点估计和估计量的评选标准
设总体 $X$ 的分布函数 $F(x; \theta)$ 含有未知参数 $\theta$,$X_1, X_2, \cdots, X_n$ 是来自总体的样本。
构造一个适当的统计量 $\hat{\theta} = \hat{\theta}(X_1, X_2, \cdots, X_n)$ 作为参数 $\theta$ 的估计值,称为 $\theta$ 的点估计量,简称估计量。
基本思想:用样本矩估计总体矩,建立方程组求解未知参数。
步骤:
1. 计算总体的各阶矩 $\mu_k = E(X^k)$(含未知参数 $\theta_1, \cdots, \theta_m$)
2. 用样本矩 $A_k = \frac{1}{n}\sum_{i=1}^{n} X_i^k$ 代替总体矩 $\mu_k$
3. 解方程组 $A_k = \mu_k$($k = 1, 2, \cdots, m$)得到参数估计
基本思想:选择使样本出现概率最大的参数值作为估计。
似然函数:
离散型:$L(\theta) = \prod_{i=1}^{n} P(X_i = x_i; \theta)$
连续型:$L(\theta) = \prod_{i=1}^{n} f(x_i; \theta)$
最大似然估计:使 $L(\theta)$ 达到最大的 $\hat{\theta}$
求解步骤:
1. 写出似然函数 $L(\theta)$
2. 取对数得 $\ln L(\theta)$
3. 对 $\theta$ 求导并令其等于零
4. 解方程得最大似然估计 $\hat{\theta}$
设 $X_1, \cdots, X_n$ 来自 $N(\mu, \sigma^2)$,求 $\mu$ 和 $\sigma^2$ 的最大似然估计。
解:
似然函数:
对数似然:
令偏导数为零,解得:
估计量的评选标准
若估计量 $\hat{\theta}$ 满足
则称 $\hat{\theta}$ 是 $\theta$ 的无偏估计量。
例:$\bar{X}$ 是 $\mu$ 的无偏估计;$S^2$ 是 $\sigma^2$ 的无偏估计;$B_2 = \frac{1}{n}\sum(X_i - \bar{X})^2$ 不是 $\sigma^2$ 的无偏估计。
设 $\hat{\theta}_1$ 和 $\hat{\theta}_2$ 都是 $\theta$ 的无偏估计,若
则称 $\hat{\theta}_1$ 比 $\hat{\theta}_2$ 更有效。
方差越小,估计量越集中在真值附近,估计精度越高。
若当 $n \to \infty$ 时,估计量 $\hat{\theta}_n$ 依概率收敛于 $\theta$:
则称 $\hat{\theta}_n$ 是 $\theta$ 的相合估计量(一致估计量)。
相合性意味着样本量越大,估计越准确。
在所有无偏估计中,方差最小的称为最小方差无偏估计(MVUE)。
克拉美-拉奥不等式:无偏估计量方差的下界为
其中 $I(\theta) = E\left[\left(\frac{\partial \ln f(X;\theta)}{\partial \theta}\right)^2\right]$ 是 Fisher 信息量。
无偏性:估计量的期望等于真值(无系统偏差)
有效性:在无偏估计中方差最小(精度高)
相合性:样本量趋于无穷时估计量收敛于真值(大样本性质)
置信区间和正态总体的置信区间
设总体 $X$ 的分布含未知参数 $\theta$,对于给定的 $\alpha$($0 < \alpha < 1$),若统计量 $\hat{\theta}_L$ 和 $\hat{\theta}_U$ 满足
则称区间 $(\hat{\theta}_L, \hat{\theta}_U)$ 为 $\theta$ 的置信度(置信水平)为 $1 - \alpha$ 的置信区间。
$\hat{\theta}_L$ 称为置信下限,$\hat{\theta}_U$ 称为置信上限。
置信区间是一个随机区间。"置信度为 95%"意味着:若重复抽样多次,约有 95% 的区间会包含真实参数值。
设 $X_1, \cdots, X_n$ 来自 $N(\mu, \sigma^2)$,置信度为 $1 - \alpha$:
情形1:$\sigma^2$ 已知
枢轴量:$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$
情形2:$\sigma^2$ 未知
枢轴量:$\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
设 $X_1, \cdots, X_n$ 来自 $N(\mu, \sigma^2)$,$\mu$ 未知,置信度为 $1 - \alpha$:
枢轴量:$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
从正态总体中抽取 $n = 16$ 个样本,得 $\bar{x} = 50$,$s = 4$。求总体均值 $\mu$ 的 95% 置信区间。
解:
$\sigma^2$ 未知,用 $t$ 分布。$\alpha = 0.05$,$t_{0.025}(15) = 2.131$
95% 置信区间为 $(47.869, 52.131)$
置信下限:$P(\theta > \hat{\theta}_L) = 1 - \alpha$
置信上限:$P(\theta < \hat{\theta}_U) = 1 - \alpha$
例:$\mu$ 的单侧置信下限($\sigma$ 未知):$\hat{\mu}_L = \bar{X} - t_\alpha(n-1) \frac{S}{\sqrt{n}}$