随机样本
在数理统计中,研究对象的全体称为总体,总体中的每个成员称为个体。
由于关心的是总体中个体的某个数量指标,而该指标的全部可能取值构成一个分布,因此可以用随机变量 $X$ 及其分布来描述总体。
设总体 $X$ 的分布函数为 $F(x)$。若 $X_1, X_2, \cdots, X_n$ 满足:
1. 独立性:$X_1, X_2, \cdots, X_n$ 相互独立
2. 同分布性:每个 $X_i$ 都与总体 $X$ 同分布
则称 $(X_1, X_2, \cdots, X_n)$ 为来自总体 $X$ 的简单随机样本,$n$ 为样本容量。
简单随机抽样:有放回抽样,每次独立抽取。
分层抽样:将总体分层,各层分别抽样。
系统抽样:按固定间隔抽取样本。
样本均值:
样本方差:
样本 $k$ 阶矩:$A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k$,$B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^k$
设总体 $E(X) = \mu$,$D(X) = \sigma^2$,则:
1. $E(\bar{X}) = \mu$,$D(\bar{X}) = \frac{\sigma^2}{n}$
2. $E(S^2) = \sigma^2$(无偏性)
抽样分布
设 $X_1, \cdots, X_n \stackrel{iid}{\sim} N(0, 1)$,则
性质:$E(\chi^2) = n$,$D(\chi^2) = 2n$;可加性成立。
设 $X \sim N(0,1)$,$Y \sim \chi^2(n)$ 独立,则
性质:密度函数关于原点对称;$n$ 大时近似 $N(0,1)$。
设 $U \sim \chi^2(n_1)$,$V \sim \chi^2(n_2)$ 独立,则
性质:$1/F \sim F(n_2, n_1)$;$T^2 \sim F(1,n)$ 若 $T \sim t(n)$
设 $X_1, \cdots, X_n$ 来自 $N(\mu, \sigma^2)$,则:
1. $\bar{X} \sim N(\mu, \sigma^2/n)$
2. $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
3. $\bar{X}$ 与 $S^2$ 独立
4. $\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
当样本量 $n$ 足够大时,无论总体分布如何,样本均值 $\bar{X}$ 近似服从正态分布,这是抽样分布的重要性质。