本章目录

§4.1

数学期望

定义 — 离散型随机变量的数学期望

设离散型随机变量 $X$ 的分布律为 $P(X = x_k) = p_k$,若级数 $\sum_k x_k p_k$ 绝对收敛,则定义

离散型期望
$$E(X) = \sum_k x_k p_k$$

为 $X$ 的数学期望(或期望均值)。

定义 — 连续型随机变量的数学期望

设连续型随机变量 $X$ 的密度函数为 $f(x)$,若积分 $\int_{-\infty}^{+\infty} x f(x) \, dx$ 绝对收敛,则定义

连续型期望
$$E(X) = \int_{-\infty}^{+\infty} x f(x) \, dx$$

为 $X$ 的数学期望

随机变量函数的期望

设 $Y = g(X)$,则:

离散型:$E(Y) = E(g(X)) = \sum_k g(x_k) p_k$

连续型:$E(Y) = E(g(X)) = \int_{-\infty}^{+\infty} g(x) f(x) \, dx$

对于二维随机向量 $(X, Y)$ 和函数 $Z = g(X, Y)$:

$$E(Z) = \sum_i \sum_j g(x_i, y_j) p_{ij} \quad \text{或} \quad E(Z) = \iint g(x, y) f(x, y) \, dx \, dy$$
常见分布的期望
分布记号期望 $E(X)$
两点分布$B(1, p)$$p$
二项分布$B(n, p)$$np$
泊松分布$P(\lambda)$$\lambda$
几何分布$Ge(p)$$1/p$
均匀分布$U(a, b)$$(a+b)/2$
指数分布$Exp(\lambda)$$1/\lambda$
正态分布$N(\mu, \sigma^2)$$\mu$
§4.2

数学期望的性质

期望的基本性质

设 $X, Y$ 的期望存在,$a, b, c$ 为常数,则:

1. $E(c) = c$

2. $E(aX) = aE(X)$

3. $E(X + Y) = E(X) + E(Y)$(对任意有限个随机变量成立)

4. $E(aX + bY + c) = aE(X) + bE(Y) + c$

5. 若 $X, Y$ 独立,则 $E(XY) = E(X)E(Y)$

注意

期望的线性性质对任意随机变量成立(无需独立),但乘积的期望等于期望的乘积需要独立性条件。

§4.3

随机变量的方差

定义 — 方差与标准差

设随机变量 $X$ 的期望为 $E(X) = \mu$,若 $E[(X - \mu)^2]$ 存在,则定义

方差
$$\text{Var}(X) = D(X) = E[(X - \mu)^2] = E(X^2) - [E(X)]^2$$

为 $X$ 的方差。$\sqrt{D(X)}$ 称为标准差(或均方差)。

方差的性质

1. $D(c) = 0$(常数的方差为零)

2. $D(aX + b) = a^2 D(X)$

3. $D(X) = E(X^2) - [E(X)]^2$(计算公式)

4. 若 $X, Y$ 独立,则 $D(X + Y) = D(X) + D(Y)$

5. $D(X) = 0$ 当且仅当 $P(X = c) = 1$($c$ 为常数)

常见分布的方差
分布记号方差 $D(X)$
两点分布$B(1, p)$$p(1-p)$
二项分布$B(n, p)$$np(1-p)$
泊松分布$P(\lambda)$$\lambda$
均匀分布$U(a, b)$$(b-a)^2/12$
指数分布$Exp(\lambda)$$1/\lambda^2$
正态分布$N(\mu, \sigma^2)$$\sigma^2$
切比雪夫不等式

设随机变量 $X$ 的期望 $E(X) = \mu$,方差 $D(X) = \sigma^2$,则对任意 $\varepsilon > 0$:

切比雪夫不等式
$$P(|X - \mu| \ge \varepsilon) \le \frac{\sigma^2}{\varepsilon^2}$$

或等价地:$P(|X - \mu| < \varepsilon) \ge 1 - \frac{\sigma^2}{\varepsilon^2}$

§4.4

协方差和相关系数

定义 — 协方差

设 $(X, Y)$ 是二维随机向量,定义

协方差
$$\text{Cov}(X, Y) = E[(X - E(X))(Y - E(Y))] = E(XY) - E(X)E(Y)$$

为 $X$ 与 $Y$ 的协方差

协方差的性质

1. $\text{Cov}(X, X) = D(X)$

2. $\text{Cov}(X, Y) = \text{Cov}(Y, X)$(对称性)

3. $\text{Cov}(aX, bY) = ab \cdot \text{Cov}(X, Y)$

4. $\text{Cov}(X_1 + X_2, Y) = \text{Cov}(X_1, Y) + \text{Cov}(X_2, Y)$

5. $D(X \pm Y) = D(X) + D(Y) \pm 2\text{Cov}(X, Y)$

6. 若 $X, Y$ 独立,则 $\text{Cov}(X, Y) = 0$(反之不一定成立)

定义 — 相关系数

设 $D(X) > 0$,$D(Y) > 0$,定义

相关系数
$$\rho_{XY} = \frac{\text{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$$

为 $X$ 与 $Y$ 的相关系数

相关系数的性质

1. $|\rho_{XY}| \le 1$

2. $|\rho_{XY}| = 1$ 当且仅当存在常数 $a, b$($a \ne 0$)使得 $P(Y = aX + b) = 1$

3. $\rho_{XY} = 0$ 时称 $X$ 与 $Y$ 不相关

4. 独立 $\Rightarrow$ 不相关,但不相关 $\not\Rightarrow$ 独立

5. 对于二维正态分布,不相关 $\Leftrightarrow$ 独立

独立与不相关

独立描述的是两个随机变量之间没有任何关系;不相关只说明两个随机变量之间没有线性关系。独立是更强的条件。

§4.5

条件数学期望和熵

定义 — 条件期望

设 $(X, Y)$ 是二维随机向量。在给定 $Y = y$ 的条件下,$X$ 的条件期望定义为:

离散型:$E(X | Y = y) = \sum_i x_i P(X = x_i | Y = y)$

连续型:$E(X | Y = y) = \int_{-\infty}^{+\infty} x f_{X|Y}(x|y) \, dx$

全期望公式

$E(X | Y)$ 是 $Y$ 的函数,作为随机变量,有:

全期望公式
$$E(X) = E[E(X|Y)]$$
条件方差公式
$$D(X) = E[D(X|Y)] + D[E(X|Y)]$$

即总方差 = 组内方差的期望 + 组间方差