概统笔记

2026-02-20 20:00:14 +00:00 · 2026-01-03 16:26:46 +08:00
parent a01982ebf4
commit 068dd157e5
13 changed files with 3024 additions and 0 deletions
--- a/otherdocs/概统/11-置信区间.md
+++ b/otherdocs/概统/11-置信区间.md
@@ -0,0 +1,124 @@
+# 十一、置信区间
+
+## 1. 基本概念
+
+**置信区间**：是在给定置信水平下，包含未知总体参数的一个区间估计。
+
+**置信水平（置信度）**：是我们对所构造的置信区间包含总体参数真值的可信程度，常用1-α表示，如95%或99%。
+
+**置信上限与置信下限**：置信区间的两个端点，分别称为置信下限和置信上限。
+
+## 2. 构造置信区间的基本原理
+
+置信区间的基本思想来源于统计量的抽样分布。对于参数θ的估计，我们找到一个包含θ的随机区间$[\hat{\theta}_L, \hat{\theta}_U]$，使得：
+
+$$P(\hat{\theta}_L \leq \theta \leq \hat{\theta}_U) = 1-\alpha$$
+
+其中1-α为置信水平，α为显著性水平。
+
+## 3. 单个正态总体参数的置信区间
+
+### (1) 总体均值μ的置信区间（方差σ²已知）
+
+使用标准正态分布：
+
+$$\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
+
+其中：
+- $\bar{X}$：样本均值
+- $z_{\alpha/2}$：标准正态分布的上α/2分位点
+- σ：总体标准差
+- n：样本容量
+
+### (2) 总体均值μ的置信区间（方差σ²未知）
+
+使用t分布：
+
+$$\bar{X} \pm t_{\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}}$$
+
+其中：
+- $t_{\alpha/2}(n-1)$：自由度为n-1的t分布上α/2分位点
+- S：样本标准差
+
+### (3) 总体方差σ²的置信区间
+
+使用χ²分布：
+
+**μ未知**：
+$$\left(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}\right)$$
+
+**μ已知**：
+$$\left(\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{\alpha/2}(n)}, \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{1-\alpha/2}(n)}\right)$$
+
+其中：
+- $\chi^2_{\alpha/2}(n-1)$和$\chi^2_{1-\alpha/2}(n-1)$分别是自由度为n-1的χ²分布上α/2和1-α/2分位点
+
+## 4. 两个正态总体参数的置信区间
+
+### (1) 两个总体均值差μ₁-μ₂的置信区间（方差已知）
+
+$$\bar{X} - \bar{Y} \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}$$
+
+### (2) 两个总体均值差μ₁-μ₂的置信区间（方差未知但相等）
+
+$$\bar{X} - \bar{Y} \pm t_{\alpha/2}(n_1+n_2-2) \cdot S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}$$
+
+其中合并标准差 $S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}}$
+
+### (3) 两个总体方差比σ₁²/σ₂²的置信区间
+
+使用F分布：
+
+$$\left(\frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)}\right)$$
+
+## 5. 总体比例p的置信区间（大样本）
+
+对于大样本，可用正态近似：
+
+$$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
+
+其中$\hat{p} = \frac{x}{n}$是样本比例。
+
+## 6. 常用置信水平与分位点对应关系
+
+### 标准正态分布分位点 $z_{\alpha/2}$
+| 置信水平1-α | α | α/2 | $z_{\alpha/2}$ |
+|------------|---|-----|----------------|
+| 90%       | 0.10 | 0.05 | 1.645         |
+| 95%       | 0.05 | 0.025 | 1.960        |
+| 99%       | 0.01 | 0.005 | 2.576        |
+
+### 上分位点记号
+
+- 若$U \sim N(0,1)$，则$P\{U > u_\alpha\}=\alpha$
+- 若$T \sim t(n)$，则$P\{T > t_\alpha(n)\}=\alpha$
+
+### t分布分位点示例 $t_{\alpha/2}(n-1)$
+| 自由度 | t₀.₀₂₅ | t₀.₀₀₅ |
+|--------|--------|--------|
+| 5      | 2.571  | 4.032  |
+| 10     | 2.228  | 3.169  |
+| 20     | 2.086  | 2.845  |
+| 30     | 2.042  | 2.750  |
+| ∞      | 1.960  | 2.576  |
+
+## 7. 置信区间的解释
+
+需要注意置信区间的正确解释：
+- 置信水平1-α是指构造置信区间的可靠程度
+- 不是对参数θ落在具体区间$[a,b]$内的概率
+- 对于已经得到的具体区间$[a,b]$，参数要么在这个区间内，要么不在
+
+## 8. 影响置信区间宽度的因素
+
+1. **置信水平1-α**：置信水平越高，区间越宽
+2. **样本容量n**：样本越大，区间越窄
+3. **总体变异程度σ**：变异越大，区间越宽
+4. **数据精度**：测量误差会影响区间宽度
+
+## 9. 置信区间与假设检验的关系
+
+置信区间和假设检验是统计推断的两种基本方法，它们之间存在密切联系：
+
+1. 在显著性水平α下，检验假设H₀: θ=θ₀的接受域就是θ₀的1-α置信区间
+2. 如果假设检验拒绝原假设，则在相应的置信区间中不包含该假设值