本章目录

§6.1

随机样本

定义 — 总体与个体

在数理统计中,研究对象的全体称为总体,总体中的每个成员称为个体

由于关心的是总体中个体的某个数量指标,而该指标的全部可能取值构成一个分布,因此可以用随机变量 $X$ 及其分布来描述总体。

定义 — 简单随机样本

设总体 $X$ 的分布函数为 $F(x)$。若 $X_1, X_2, \cdots, X_n$ 满足:

1. 独立性:$X_1, X_2, \cdots, X_n$ 相互独立

2. 同分布性:每个 $X_i$ 都与总体 $X$ 同分布

则称 $(X_1, X_2, \cdots, X_n)$ 为来自总体 $X$ 的简单随机样本,$n$ 为样本容量

抽样方法

简单随机抽样:有放回抽样,每次独立抽取。

分层抽样:将总体分层,各层分别抽样。

系统抽样:按固定间隔抽取样本。

常用统计量

样本均值

$$\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$$

样本方差

$$S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2$$

样本 $k$ 阶矩:$A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k$,$B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^k$

样本均值和方差的性质

设总体 $E(X) = \mu$,$D(X) = \sigma^2$,则:

1. $E(\bar{X}) = \mu$,$D(\bar{X}) = \frac{\sigma^2}{n}$

2. $E(S^2) = \sigma^2$(无偏性)

§6.2

抽样分布

定义 — $\chi^2$ 分布

设 $X_1, \cdots, X_n \stackrel{iid}{\sim} N(0, 1)$,则

$$\chi^2 = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n)$$

性质:$E(\chi^2) = n$,$D(\chi^2) = 2n$;可加性成立。

定义 — $t$ 分布

设 $X \sim N(0,1)$,$Y \sim \chi^2(n)$ 独立,则

$$T = \frac{X}{\sqrt{Y/n}} \sim t(n)$$

性质:密度函数关于原点对称;$n$ 大时近似 $N(0,1)$。

定义 — $F$ 分布

设 $U \sim \chi^2(n_1)$,$V \sim \chi^2(n_2)$ 独立,则

$$F = \frac{U/n_1}{V/n_2} \sim F(n_1, n_2)$$

性质:$1/F \sim F(n_2, n_1)$;$T^2 \sim F(1,n)$ 若 $T \sim t(n)$

正态总体的抽样分布定理

设 $X_1, \cdots, X_n$ 来自 $N(\mu, \sigma^2)$,则:

1. $\bar{X} \sim N(\mu, \sigma^2/n)$

2. $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$

3. $\bar{X}$ 与 $S^2$ 独立

4. $\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$

中心极限定理的应用

当样本量 $n$ 足够大时,无论总体分布如何,样本均值 $\bar{X}$ 近似服从正态分布,这是抽样分布的重要性质。