概统笔记

This commit is contained in:
2026-01-03 16:26:46 +08:00
parent a01982ebf4
commit 068dd157e5
13 changed files with 3024 additions and 0 deletions

View File

@@ -0,0 +1,124 @@
# 十一、置信区间
## 1. 基本概念
**置信区间**:是在给定置信水平下,包含未知总体参数的一个区间估计。
**置信水平(置信度)**是我们对所构造的置信区间包含总体参数真值的可信程度常用1-α表示如95%或99%。
**置信上限与置信下限**:置信区间的两个端点,分别称为置信下限和置信上限。
## 2. 构造置信区间的基本原理
置信区间的基本思想来源于统计量的抽样分布。对于参数θ的估计,我们找到一个包含θ的随机区间$[\hat{\theta}_L, \hat{\theta}_U]$,使得:
$$P(\hat{\theta}_L \leq \theta \leq \hat{\theta}_U) = 1-\alpha$$
其中1-α为置信水平,α为显著性水平。
## 3. 单个正态总体参数的置信区间
### (1) 总体均值μ的置信区间(方差σ²已知)
使用标准正态分布:
$$\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
其中:
- $\bar{X}$:样本均值
- $z_{\alpha/2}$:标准正态分布的上α/2分位点
- σ:总体标准差
- n样本容量
### (2) 总体均值μ的置信区间(方差σ²未知)
使用t分布
$$\bar{X} \pm t_{\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}}$$
其中:
- $t_{\alpha/2}(n-1)$自由度为n-1的t分布上α/2分位点
- S样本标准差
### (3) 总体方差σ²的置信区间
使用χ²分布:
**μ未知**
$$\left(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}\right)$$
**μ已知**
$$\left(\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{\alpha/2}(n)}, \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{1-\alpha/2}(n)}\right)$$
其中:
- $\chi^2_{\alpha/2}(n-1)$和$\chi^2_{1-\alpha/2}(n-1)$分别是自由度为n-1的χ²分布上α/2和1-α/2分位点
## 4. 两个正态总体参数的置信区间
### (1) 两个总体均值差μ₁-μ₂的置信区间(方差已知)
$$\bar{X} - \bar{Y} \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}$$
### (2) 两个总体均值差μ₁-μ₂的置信区间(方差未知但相等)
$$\bar{X} - \bar{Y} \pm t_{\alpha/2}(n_1+n_2-2) \cdot S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}$$
其中合并标准差 $S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}}$
### (3) 两个总体方差比σ₁²/σ₂²的置信区间
使用F分布
$$\left(\frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)}\right)$$
## 5. 总体比例p的置信区间大样本
对于大样本,可用正态近似:
$$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
其中$\hat{p} = \frac{x}{n}$是样本比例。
## 6. 常用置信水平与分位点对应关系
### 标准正态分布分位点 $z_{\alpha/2}$
| 置信水平1-α | α | α/2 | $z_{\alpha/2}$ |
|------------|---|-----|----------------|
| 90% | 0.10 | 0.05 | 1.645 |
| 95% | 0.05 | 0.025 | 1.960 |
| 99% | 0.01 | 0.005 | 2.576 |
### 上分位点记号
- 若$U \sim N(0,1)$,则$P\{U > u_\alpha\}=\alpha$
- 若$T \sim t(n)$,则$P\{T > t_\alpha(n)\}=\alpha$
### t分布分位点示例 $t_{\alpha/2}(n-1)$
| 自由度 | t₀.₀₂₅ | t₀.₀₀₅ |
|--------|--------|--------|
| 5 | 2.571 | 4.032 |
| 10 | 2.228 | 3.169 |
| 20 | 2.086 | 2.845 |
| 30 | 2.042 | 2.750 |
| ∞ | 1.960 | 2.576 |
## 7. 置信区间的解释
需要注意置信区间的正确解释:
- 置信水平1-α是指构造置信区间的可靠程度
- 不是对参数θ落在具体区间$[a,b]$内的概率
- 对于已经得到的具体区间$[a,b]$,参数要么在这个区间内,要么不在
## 8. 影响置信区间宽度的因素
1. **置信水平1-α**:置信水平越高,区间越宽
2. **样本容量n**:样本越大,区间越窄
3. **总体变异程度σ**:变异越大,区间越宽
4. **数据精度**:测量误差会影响区间宽度
## 9. 置信区间与假设检验的关系
置信区间和假设检验是统计推断的两种基本方法,它们之间存在密切联系:
1. 在显著性水平α检验假设H₀: θ=θ₀的接受域就是θ₀的1-α置信区间
2. 如果假设检验拒绝原假设,则在相应的置信区间中不包含该假设值