Files
handsomezhuzhu.github.io/otherdocs/概统/11-置信区间.md
2026-01-03 16:26:46 +08:00

125 lines
4.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 十一、置信区间
## 1. 基本概念
**置信区间**:是在给定置信水平下,包含未知总体参数的一个区间估计。
**置信水平(置信度)**是我们对所构造的置信区间包含总体参数真值的可信程度常用1-α表示如95%或99%。
**置信上限与置信下限**:置信区间的两个端点,分别称为置信下限和置信上限。
## 2. 构造置信区间的基本原理
置信区间的基本思想来源于统计量的抽样分布。对于参数θ的估计,我们找到一个包含θ的随机区间$[\hat{\theta}_L, \hat{\theta}_U]$,使得:
$$P(\hat{\theta}_L \leq \theta \leq \hat{\theta}_U) = 1-\alpha$$
其中1-α为置信水平,α为显著性水平。
## 3. 单个正态总体参数的置信区间
### (1) 总体均值μ的置信区间(方差σ²已知)
使用标准正态分布:
$$\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
其中:
- $\bar{X}$:样本均值
- $z_{\alpha/2}$:标准正态分布的上α/2分位点
- σ:总体标准差
- n样本容量
### (2) 总体均值μ的置信区间(方差σ²未知)
使用t分布
$$\bar{X} \pm t_{\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}}$$
其中:
- $t_{\alpha/2}(n-1)$自由度为n-1的t分布上α/2分位点
- S样本标准差
### (3) 总体方差σ²的置信区间
使用χ²分布:
**μ未知**
$$\left(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}\right)$$
**μ已知**
$$\left(\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{\alpha/2}(n)}, \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{1-\alpha/2}(n)}\right)$$
其中:
- $\chi^2_{\alpha/2}(n-1)$和$\chi^2_{1-\alpha/2}(n-1)$分别是自由度为n-1的χ²分布上α/2和1-α/2分位点
## 4. 两个正态总体参数的置信区间
### (1) 两个总体均值差μ₁-μ₂的置信区间(方差已知)
$$\bar{X} - \bar{Y} \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}$$
### (2) 两个总体均值差μ₁-μ₂的置信区间(方差未知但相等)
$$\bar{X} - \bar{Y} \pm t_{\alpha/2}(n_1+n_2-2) \cdot S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}$$
其中合并标准差 $S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}}$
### (3) 两个总体方差比σ₁²/σ₂²的置信区间
使用F分布
$$\left(\frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)}\right)$$
## 5. 总体比例p的置信区间大样本
对于大样本,可用正态近似:
$$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
其中$\hat{p} = \frac{x}{n}$是样本比例。
## 6. 常用置信水平与分位点对应关系
### 标准正态分布分位点 $z_{\alpha/2}$
| 置信水平1-α | α | α/2 | $z_{\alpha/2}$ |
|------------|---|-----|----------------|
| 90% | 0.10 | 0.05 | 1.645 |
| 95% | 0.05 | 0.025 | 1.960 |
| 99% | 0.01 | 0.005 | 2.576 |
### 上分位点记号
- 若$U \sim N(0,1)$,则$P\{U > u_\alpha\}=\alpha$
- 若$T \sim t(n)$,则$P\{T > t_\alpha(n)\}=\alpha$
### t分布分位点示例 $t_{\alpha/2}(n-1)$
| 自由度 | t₀.₀₂₅ | t₀.₀₀₅ |
|--------|--------|--------|
| 5 | 2.571 | 4.032 |
| 10 | 2.228 | 3.169 |
| 20 | 2.086 | 2.845 |
| 30 | 2.042 | 2.750 |
| ∞ | 1.960 | 2.576 |
## 7. 置信区间的解释
需要注意置信区间的正确解释:
- 置信水平1-α是指构造置信区间的可靠程度
- 不是对参数θ落在具体区间$[a,b]$内的概率
- 对于已经得到的具体区间$[a,b]$,参数要么在这个区间内,要么不在
## 8. 影响置信区间宽度的因素
1. **置信水平1-α**:置信水平越高,区间越宽
2. **样本容量n**:样本越大,区间越窄
3. **总体变异程度σ**:变异越大,区间越宽
4. **数据精度**:测量误差会影响区间宽度
## 9. 置信区间与假设检验的关系
置信区间和假设检验是统计推断的两种基本方法,它们之间存在密切联系:
1. 在显著性水平α检验假设H₀: θ=θ₀的接受域就是θ₀的1-α置信区间
2. 如果假设检验拒绝原假设,则在相应的置信区间中不包含该假设值