随机向量及其联合分布
设 $X_1, X_2, \cdots, X_n$ 是定义在同一概率空间上的 $n$ 个随机变量,则称 $(X_1, X_2, \cdots, X_n)$ 为 $n$ 维随机向量(或随机向量)。
设 $(X, Y)$ 是二维随机向量,对任意实数 $x, y$,定义
为 $(X, Y)$ 的联合分布函数。
设 $F(x, y)$ 是二维随机向量 $(X, Y)$ 的联合分布函数,则:
1. $0 \le F(x, y) \le 1$
2. $F(x, y)$ 对每个变量单调不减
3. $F(-\infty, y) = F(x, -\infty) = 0$,$F(+\infty, +\infty) = 1$
4. $F(x, y)$ 对每个变量右连续
5. 对任意 $a_1 < a_2$,$b_1 < b_2$:
设 $(X, Y)$ 的联合分布函数为 $F(x, y)$,则 $X$ 和 $Y$ 的边缘分布函数分别为:
离散型随机向量及其分布
设二维离散型随机向量 $(X, Y)$ 的所有可能取值为 $(x_i, y_j)$,则
称为 $(X, Y)$ 的联合分布律(或联合概率分布)。
性质:$p_{ij} \ge 0$,$\sum_i \sum_j p_{ij} = 1$
$X$ 的边缘分布律:$p_{i \cdot} = P(X = x_i) = \sum_j p_{ij}$
$Y$ 的边缘分布律:$p_{\cdot j} = P(Y = y_j) = \sum_i p_{ij}$
离散型随机变量 $X$ 与 $Y$ 相互独立的充要条件是:对所有 $i, j$,有
即 $p_{ij} = p_{i \cdot} \cdot p_{\cdot j}$
连续型随机向量及其联合密度
设二维随机向量 $(X, Y)$ 的联合分布函数为 $F(x, y)$,若存在非负可积函数 $f(x, y)$,使得
则称 $(X, Y)$ 为连续型随机向量,$f(x, y)$ 为联合概率密度函数。
1. $f(x, y) \ge 0$
2. $\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) \, dx \, dy = 1$
3. 在 $f(x, y)$ 连续点处,$\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)$
4. 对平面上任意区域 $G$,$P((X, Y) \in G) = \iint_G f(x, y) \, dx \, dy$
设 $(X, Y)$ 的联合密度函数为 $f(x, y)$,则边缘密度函数为:
连续型随机变量 $X$ 与 $Y$ 相互独立的充要条件是:
几乎处处成立。
若 $(X, Y)$ 的联合密度函数为
则称 $(X, Y)$ 服从二维正态分布,记为 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$。
其中 $\rho$ 是 $X$ 与 $Y$ 的相关系数。当 $\rho = 0$ 时,$X$ 与 $Y$ 独立。
随机向量函数的分布
设 $(X, Y)$ 的联合密度函数为 $f(x, y)$,$Z = X + Y$,则 $Z$ 的密度函数为:
若 $X, Y$ 独立,则 $f_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) \, dx$(卷积)。
若 $X \sim N(\mu_1, \sigma_1^2)$,$Y \sim N(\mu_2, \sigma_2^2)$,且 $X, Y$ 独立,则
更一般地,$aX + bY + c \sim N(a\mu_1 + b\mu_2 + c, a^2\sigma_1^2 + b^2\sigma_2^2)$。
设 $X_1, X_2, \cdots, X_n$ 独立同分布,分布函数为 $F(x)$。令 $M = \max\{X_1, \cdots, X_n\}$,$N = \min\{X_1, \cdots, X_n\}$,则:
条件分布和条件密度
设 $(X, Y)$ 是离散型随机向量,对于 $P(Y = y_j) > 0$,定义
为在 $Y = y_j$ 条件下 $X$ 的条件分布律。
设 $(X, Y)$ 的联合密度为 $f(x, y)$,边缘密度为 $f_Y(y)$,对于 $f_Y(y) > 0$,定义
为在 $Y = y$ 条件下 $X$ 的条件概率密度函数。
次序统计量
设 $X_1, X_2, \cdots, X_n$ 是来自总体的简单随机样本。将其按从小到大排列为 $X_{(1)} \le X_{(2)} \le \cdots \le X_{(n)}$,则称 $X_{(k)}$ 为第 $k$ 个次序统计量。
特别地,$X_{(1)} = \min\{X_1, \cdots, X_n\}$,$X_{(n)} = \max\{X_1, \cdots, X_n\}$。
设总体分布函数为 $F(x)$,密度函数为 $f(x)$,则第 $k$ 个次序统计量 $X_{(k)}$ 的密度函数为: