本章目录

§3.1

随机向量及其联合分布

定义 — 随机向量

设 $X_1, X_2, \cdots, X_n$ 是定义在同一概率空间上的 $n$ 个随机变量,则称 $(X_1, X_2, \cdots, X_n)$ 为 $n$ 维随机向量(或随机向量)。

定义 — 联合分布函数

设 $(X, Y)$ 是二维随机向量,对任意实数 $x, y$,定义

联合分布函数
$$F(x, y) = P(X \le x, Y \le y)$$

为 $(X, Y)$ 的联合分布函数

联合分布函数的性质

设 $F(x, y)$ 是二维随机向量 $(X, Y)$ 的联合分布函数,则:

1. $0 \le F(x, y) \le 1$

2. $F(x, y)$ 对每个变量单调不减

3. $F(-\infty, y) = F(x, -\infty) = 0$,$F(+\infty, +\infty) = 1$

4. $F(x, y)$ 对每个变量右连续

5. 对任意 $a_1 < a_2$,$b_1 < b_2$:

$$P(a_1 < X \le a_2, b_1 < Y \le b_2) = F(a_2, b_2) - F(a_2, b_1) - F(a_1, b_2) + F(a_1, b_1)$$
定义 — 边缘分布函数

设 $(X, Y)$ 的联合分布函数为 $F(x, y)$,则 $X$ 和 $Y$ 的边缘分布函数分别为:

$$F_X(x) = P(X \le x) = F(x, +\infty) = \lim_{y \to +\infty} F(x, y)$$
$$F_Y(y) = P(Y \le y) = F(+\infty, y) = \lim_{x \to +\infty} F(x, y)$$
§3.2

离散型随机向量及其分布

定义 — 离散型随机向量的联合分布律

设二维离散型随机向量 $(X, Y)$ 的所有可能取值为 $(x_i, y_j)$,则

$$p_{ij} = P(X = x_i, Y = y_j), \quad i, j = 1, 2, \cdots$$

称为 $(X, Y)$ 的联合分布律(或联合概率分布)。

性质:$p_{ij} \ge 0$,$\sum_i \sum_j p_{ij} = 1$

边缘分布律

$X$ 的边缘分布律:$p_{i \cdot} = P(X = x_i) = \sum_j p_{ij}$

$Y$ 的边缘分布律:$p_{\cdot j} = P(Y = y_j) = \sum_i p_{ij}$

离散型随机变量的独立性

离散型随机变量 $X$ 与 $Y$ 相互独立的充要条件是:对所有 $i, j$,有

$$P(X = x_i, Y = y_j) = P(X = x_i) \cdot P(Y = y_j)$$

即 $p_{ij} = p_{i \cdot} \cdot p_{\cdot j}$

§3.3

连续型随机向量及其联合密度

定义 — 联合概率密度函数

设二维随机向量 $(X, Y)$ 的联合分布函数为 $F(x, y)$,若存在非负可积函数 $f(x, y)$,使得

$$F(x, y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) \, du \, dv$$

则称 $(X, Y)$ 为连续型随机向量,$f(x, y)$ 为联合概率密度函数

联合密度函数的性质

1. $f(x, y) \ge 0$

2. $\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) \, dx \, dy = 1$

3. 在 $f(x, y)$ 连续点处,$\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)$

4. 对平面上任意区域 $G$,$P((X, Y) \in G) = \iint_G f(x, y) \, dx \, dy$

边缘密度函数

设 $(X, Y)$ 的联合密度函数为 $f(x, y)$,则边缘密度函数为:

$$f_X(x) = \int_{-\infty}^{+\infty} f(x, y) \, dy$$
$$f_Y(y) = \int_{-\infty}^{+\infty} f(x, y) \, dx$$
连续型随机变量的独立性

连续型随机变量 $X$ 与 $Y$ 相互独立的充要条件是:

$$f(x, y) = f_X(x) \cdot f_Y(y)$$

几乎处处成立。

二维正态分布

若 $(X, Y)$ 的联合密度函数为

$$f(x,y) = \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}} \exp\left\{-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma_1^2} - 2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2} + \frac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}$$

则称 $(X, Y)$ 服从二维正态分布,记为 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$。

其中 $\rho$ 是 $X$ 与 $Y$ 的相关系数。当 $\rho = 0$ 时,$X$ 与 $Y$ 独立。

§3.4

随机向量函数的分布

两个随机变量和的分布

设 $(X, Y)$ 的联合密度函数为 $f(x, y)$,$Z = X + Y$,则 $Z$ 的密度函数为:

卷积公式
$$f_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x) \, dx = \int_{-\infty}^{+\infty} f(z-y, y) \, dy$$

若 $X, Y$ 独立,则 $f_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) \, dx$(卷积)。

独立正态分布之和

若 $X \sim N(\mu_1, \sigma_1^2)$,$Y \sim N(\mu_2, \sigma_2^2)$,且 $X, Y$ 独立,则

$$X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)$$

更一般地,$aX + bY + c \sim N(a\mu_1 + b\mu_2 + c, a^2\sigma_1^2 + b^2\sigma_2^2)$。

最大值和最小值的分布

设 $X_1, X_2, \cdots, X_n$ 独立同分布,分布函数为 $F(x)$。令 $M = \max\{X_1, \cdots, X_n\}$,$N = \min\{X_1, \cdots, X_n\}$,则:

$$F_M(x) = [F(x)]^n$$
$$F_N(x) = 1 - [1 - F(x)]^n$$
§3.5

条件分布和条件密度

定义 — 条件分布律(离散型)

设 $(X, Y)$ 是离散型随机向量,对于 $P(Y = y_j) > 0$,定义

$$P(X = x_i | Y = y_j) = \frac{P(X = x_i, Y = y_j)}{P(Y = y_j)} = \frac{p_{ij}}{p_{\cdot j}}$$

为在 $Y = y_j$ 条件下 $X$ 的条件分布律

定义 — 条件密度函数(连续型)

设 $(X, Y)$ 的联合密度为 $f(x, y)$,边缘密度为 $f_Y(y)$,对于 $f_Y(y) > 0$,定义

条件密度函数
$$f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}$$

为在 $Y = y$ 条件下 $X$ 的条件概率密度函数

§3.6

次序统计量

定义 — 次序统计量

设 $X_1, X_2, \cdots, X_n$ 是来自总体的简单随机样本。将其按从小到大排列为 $X_{(1)} \le X_{(2)} \le \cdots \le X_{(n)}$,则称 $X_{(k)}$ 为第 $k$ 个次序统计量

特别地,$X_{(1)} = \min\{X_1, \cdots, X_n\}$,$X_{(n)} = \max\{X_1, \cdots, X_n\}$。

次序统计量的分布

设总体分布函数为 $F(x)$,密度函数为 $f(x)$,则第 $k$ 个次序统计量 $X_{(k)}$ 的密度函数为:

$$f_{(k)}(x) = \frac{n!}{(k-1)!(n-k)!} [F(x)]^{k-1} [1-F(x)]^{n-k} f(x)$$