3.5 统计初步-EW帮帮网

本章系统阐述统计推断理论基础，涵盖大数定律、抽样分布、参数估计与假设检验等核心内容。以下从六个核心考点系统梳理知识体系：

考点一：大数定律与中心极限定理

1. 大数定律

切比雪夫不等式：
设随机变量 $X$ 的数学期望 $E(X)=\mu$ ，方差 $D(X)=\sigma^2$ ，则对任意 $\varepsilon>0$ ：
$P\{|X-\mu| \geq \varepsilon\} \leq \frac{\sigma^2}{\varepsilon^2}$
辛钦大数定律：
设独立同分布序列 ${X_n\}$ 满足 $E(X_i)=\mu$ ，则对任意 $\varepsilon>0$ ：
$\lim_{n \to \infty} P\left\{ \left| \frac{1}{n}\sum_{k=1}^n X_k - \mu \right| < \varepsilon \right\} = 1$

核心思想：大量样本的平均值具有稳定性，依概念收敛于理论均值。

2. 中心极限定理

设独立同分布序列 ${X_n\}$ 满足 $E(X_i)=\mu$ ， $D(X_i)=\sigma^2$ ，则：
$\lim_{n \to \infty} P\left\{ \frac{\sum_{k=1}^n X_k - n\mu}{\sigma\sqrt{n}} \leq x \right\} = \Phi(x)$

核心思想：大量样本和 $\sum X_k$ 近似服从正态分布 $N(n\mu, n\sigma^2)$ 。

考点二：抽样分布

1. 统计量定义

样本均值： $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$
样本方差： $S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$
次序统计量： $X_{(1)} = \min(X_i),\ X_{(n)} = \max(X_i)$

2. 三大抽样分布

分布类型	定义	重要性质
$\chi^2$ 分布	$X_1,...,X_n \sim N(0,1)$ ，则 $\sum_{i=1}^n X_i^2 \sim \chi^2(n)$	可加性（独立）： $\chi^2(n_1) + \chi^2(n_2) \sim \chi^2(n_1+n_2)$
$t$ 分布	$\sim N(0,1),\ Y \sim \chi^2(n)$ ，则 $\frac{X}{\sqrt{Y/n}} \sim t(n)$	对称性： $t_{1-\alpha}(n) = -t_{\alpha}(n)$
$F$ 分布	$\sim \chi^2(m),\ V \sim \chi^2(n)$ ，则 $\frac{U/m}{V/n} \sim F(m,n)$	倒数性质： $F_{1-\alpha}(m,n) = \frac{1}{F_{\alpha}(n,m)}$

3. 正态总体下的抽样分布

设 $X_1,...,X_n \sim N(\mu,\sigma^2)$ ，则：

$\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$ ，标准化得 $\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$
$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ ，且 $\bar{X}$ 与 $S^2$ 独立
$\frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)$
$\chi^2 = \frac{1}{\sigma^2}\sum_{i=1}^n (X_i - \mu)^2 \sim \chi^2(n)$

考点三：统计量的数字特征

统计量	期望	方差
样本均值 $\bar{X}$	$E(\bar{X}) = \mu$	$D(\bar{X}) = \frac{\sigma^2}{n}$
样本方差 $S^2$	$E(S^2) = \sigma^2$	$D(S^2) = \frac{2\sigma^4}{n-1}$
样本协方差 $S_{XY}$	$E(S_{XY}) = \text{Cov}(X,Y)$	复杂表达式需特殊计算

考点四：参数估计

1. 矩估计法

核心思想：用样本矩估计总体矩
$\frac{1}{n}\sum_{i=1}^n X_i^k \to E(X^k)$
步骤：
1. 建立方程 $\hat{\mu}_k = E(X^k)$
2. 解方程得参数估计量

2. 最大似然估计

似然函数：
离散型： $L(\theta) = \prod_{i=1}^n P(X_i;\theta)$
连续型： $L(\theta) = \prod_{i=1}^n f(X_i;\theta)$
求解步骤：
1. 取对数 $\ln L(\theta)$
2. 对 $\theta$ 求导并令导数为零
3. 解方程得 $\hat{\theta}_{MLE}$

考点五：估计量的评选标准

标准	数学定义	判定方法
无偏性	$E(\hat{\theta}) = \theta$	计算期望验证等式成立
有效性	$D(\hat{\theta}_1) < D(\hat{\theta}_2)$	比较方差大小
一致性	$\lim_{n \to \infty} P(\|\hat{\theta}-\theta\| \geq \varepsilon) = 0$	应用大数定律或切比雪夫不等式

考点六：区间估计与假设检验

1. 区间估计

步骤：
1. 构造枢轴量 $T(X,\theta)$ （如 $\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}$ ）
2. 确定置信区间 $1-\alpha$
3. 反解得到 $\theta$ 的区间估计

正态总体均值区间估计：

$\sigma^2$ 已知： $\mu \in \left( \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right)$
$\sigma^2$ 未知： $\mu \in \left( \bar{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} \right)$

2. 假设检验

两类错误：

错误类型	概率符号	发生条件
第一类错误	$\alpha$	$H_0$ 为真但被拒绝（弃真）
第二类错误	$\beta$	$H_0$ 为假但被接受（存伪）

检验步骤：
1. 建立原假设 $H_0$ 与备择假设 $H_1$
2. 确定检验统计量及其分布
3. 给定显著性水平 $\alpha$ ，确定拒绝域
4. 根据样本计算统计量值，判断是否拒绝 $H_0$

总结

本章重点掌握：

大数定律与中心极限定理的理论联系与区别
三大抽样分布的定义与正态总体的抽样分布性质
参数估计的双重方法（矩估计与极大似然估计）
假设检验的逻辑框架与两类错误的实际意义

3.5 统计初步