mirror of
https://github.com/handsomezhuzhu/handsomezhuzhu.github.io.git
synced 2026-02-20 20:00:14 +00:00
概统笔记
This commit is contained in:
124
otherdocs/概统/11-置信区间.md
Normal file
124
otherdocs/概统/11-置信区间.md
Normal file
@@ -0,0 +1,124 @@
|
||||
# 十一、置信区间
|
||||
|
||||
## 1. 基本概念
|
||||
|
||||
**置信区间**:是在给定置信水平下,包含未知总体参数的一个区间估计。
|
||||
|
||||
**置信水平(置信度)**:是我们对所构造的置信区间包含总体参数真值的可信程度,常用1-α表示,如95%或99%。
|
||||
|
||||
**置信上限与置信下限**:置信区间的两个端点,分别称为置信下限和置信上限。
|
||||
|
||||
## 2. 构造置信区间的基本原理
|
||||
|
||||
置信区间的基本思想来源于统计量的抽样分布。对于参数θ的估计,我们找到一个包含θ的随机区间$[\hat{\theta}_L, \hat{\theta}_U]$,使得:
|
||||
|
||||
$$P(\hat{\theta}_L \leq \theta \leq \hat{\theta}_U) = 1-\alpha$$
|
||||
|
||||
其中1-α为置信水平,α为显著性水平。
|
||||
|
||||
## 3. 单个正态总体参数的置信区间
|
||||
|
||||
### (1) 总体均值μ的置信区间(方差σ²已知)
|
||||
|
||||
使用标准正态分布:
|
||||
|
||||
$$\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
|
||||
|
||||
其中:
|
||||
- $\bar{X}$:样本均值
|
||||
- $z_{\alpha/2}$:标准正态分布的上α/2分位点
|
||||
- σ:总体标准差
|
||||
- n:样本容量
|
||||
|
||||
### (2) 总体均值μ的置信区间(方差σ²未知)
|
||||
|
||||
使用t分布:
|
||||
|
||||
$$\bar{X} \pm t_{\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}}$$
|
||||
|
||||
其中:
|
||||
- $t_{\alpha/2}(n-1)$:自由度为n-1的t分布上α/2分位点
|
||||
- S:样本标准差
|
||||
|
||||
### (3) 总体方差σ²的置信区间
|
||||
|
||||
使用χ²分布:
|
||||
|
||||
**μ未知**:
|
||||
$$\left(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}\right)$$
|
||||
|
||||
**μ已知**:
|
||||
$$\left(\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{\alpha/2}(n)}, \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{1-\alpha/2}(n)}\right)$$
|
||||
|
||||
其中:
|
||||
- $\chi^2_{\alpha/2}(n-1)$和$\chi^2_{1-\alpha/2}(n-1)$分别是自由度为n-1的χ²分布上α/2和1-α/2分位点
|
||||
|
||||
## 4. 两个正态总体参数的置信区间
|
||||
|
||||
### (1) 两个总体均值差μ₁-μ₂的置信区间(方差已知)
|
||||
|
||||
$$\bar{X} - \bar{Y} \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}$$
|
||||
|
||||
### (2) 两个总体均值差μ₁-μ₂的置信区间(方差未知但相等)
|
||||
|
||||
$$\bar{X} - \bar{Y} \pm t_{\alpha/2}(n_1+n_2-2) \cdot S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}$$
|
||||
|
||||
其中合并标准差 $S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}}$
|
||||
|
||||
### (3) 两个总体方差比σ₁²/σ₂²的置信区间
|
||||
|
||||
使用F分布:
|
||||
|
||||
$$\left(\frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)}\right)$$
|
||||
|
||||
## 5. 总体比例p的置信区间(大样本)
|
||||
|
||||
对于大样本,可用正态近似:
|
||||
|
||||
$$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
|
||||
|
||||
其中$\hat{p} = \frac{x}{n}$是样本比例。
|
||||
|
||||
## 6. 常用置信水平与分位点对应关系
|
||||
|
||||
### 标准正态分布分位点 $z_{\alpha/2}$
|
||||
| 置信水平1-α | α | α/2 | $z_{\alpha/2}$ |
|
||||
|------------|---|-----|----------------|
|
||||
| 90% | 0.10 | 0.05 | 1.645 |
|
||||
| 95% | 0.05 | 0.025 | 1.960 |
|
||||
| 99% | 0.01 | 0.005 | 2.576 |
|
||||
|
||||
### 上分位点记号
|
||||
|
||||
- 若$U \sim N(0,1)$,则$P\{U > u_\alpha\}=\alpha$
|
||||
- 若$T \sim t(n)$,则$P\{T > t_\alpha(n)\}=\alpha$
|
||||
|
||||
### t分布分位点示例 $t_{\alpha/2}(n-1)$
|
||||
| 自由度 | t₀.₀₂₅ | t₀.₀₀₅ |
|
||||
|--------|--------|--------|
|
||||
| 5 | 2.571 | 4.032 |
|
||||
| 10 | 2.228 | 3.169 |
|
||||
| 20 | 2.086 | 2.845 |
|
||||
| 30 | 2.042 | 2.750 |
|
||||
| ∞ | 1.960 | 2.576 |
|
||||
|
||||
## 7. 置信区间的解释
|
||||
|
||||
需要注意置信区间的正确解释:
|
||||
- 置信水平1-α是指构造置信区间的可靠程度
|
||||
- 不是对参数θ落在具体区间$[a,b]$内的概率
|
||||
- 对于已经得到的具体区间$[a,b]$,参数要么在这个区间内,要么不在
|
||||
|
||||
## 8. 影响置信区间宽度的因素
|
||||
|
||||
1. **置信水平1-α**:置信水平越高,区间越宽
|
||||
2. **样本容量n**:样本越大,区间越窄
|
||||
3. **总体变异程度σ**:变异越大,区间越宽
|
||||
4. **数据精度**:测量误差会影响区间宽度
|
||||
|
||||
## 9. 置信区间与假设检验的关系
|
||||
|
||||
置信区间和假设检验是统计推断的两种基本方法,它们之间存在密切联系:
|
||||
|
||||
1. 在显著性水平α下,检验假设H₀: θ=θ₀的接受域就是θ₀的1-α置信区间
|
||||
2. 如果假设检验拒绝原假设,则在相应的置信区间中不包含该假设值
|
||||
Reference in New Issue
Block a user