6.3 KiB
五、多维随机变量及其分布
1. 二维分布函数
定义:F(x,y) = P\{X \leq x, Y \leq y\}
四条基本性质:
-
单调不减性:F(x,y)是变量x和y的不减函数
- 对于任意固定的y,当$x_2 > x_1$时,
F(x_2,y) \geq F(x_1,y) - 对于任意固定的x,当$y_2 > y_1$时,
F(x,y_2) \geq F(x,y_1)
- 对于任意固定的y,当$x_2 > x_1$时,
-
有界性:$0 \leq F(x,y) \leq 1$,且
F(-\infty, y) = F(x, -\infty) = 0- $F(-\infty, -\infty) = 0$,
F(+\infty, +\infty) = 1
-
右连续性:$F(x+0, y) = F(x, y)$,
F(x, y+0) = F(x, y) -
非负性:对于任意$(x_1, y_1), (x_2, y_2)$,
x_1 < x_2, $y_1 < y_2$,有F(x_2, y_2) - F(x_2, y_1) + F(x_1, y_1) - F(x_1, y_2) \geq 0
2. 联合分布
离散型:联合分布律
p_{ij} = P\{X = x_i, Y = y_j\}, \quad i,j = 1,2,...
性质:
- 非负性:
p_{ij} \geq 0 - 规范性:
\sum_{i=1}^{\infty}\sum_{j=1}^{\infty} p_{ij} = 1
连续型:联合概率密度
$f(x,y)$,(x,y) \in \mathbb{R}^2
性质:
- 非负性:
f(x,y) \geq 0 - 规范性:
\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f(x,y)dxdy = F(\infty, \infty) = 1 - 若$f(x,y)$在点$(x,y)$连续,则有
\frac{\partial^2 F(x,y)}{\partial x \partial y} = f(x,y)
区域概率:点$(X,Y)$落在平面区域$G$内的概率
P\{(X,Y) \in G\} = \iint_G f(x,y)dxdy
3. 边缘分布
边缘分布函数:
F_X(x) = F(x, \infty)F_Y(y) = F(\infty, y)
离散型边缘分布律
p_{i\cdot} = \sum_{j=1}^{\infty} p_{ij} = P\{X = x_i\}, \quad i = 1,2,...
p_{\cdot j} = \sum_{i=1}^{\infty} p_{ij} = P\{Y = y_j\}, \quad j = 1,2,...
连续型边缘概率密度
f_X(x) = \int_{-\infty}^{\infty} f(x,y)dy
f_Y(y) = \int_{-\infty}^{\infty} f(x,y)dx
3.1 二维均匀分布
定义:若$(X,Y)$在区域$D$上均匀分布,则
f(x,y) = \begin{cases} \frac{1}{S_D}, & (x,y) \in D \\ 0, & \text{其他} \end{cases}
其中$S_D$为区域D的面积。
结论1:$P{(X,Y) \in G} = \frac{S_G}{S_D}$(面积之比)
结论2:若$D={(x,y)\mid a \le x \le b, c \le y \le d}$,则 $X \sim U(a,b)$,$Y \sim U(c,d)$,且X与Y相互独立。
结论3:X、Y的边缘分布不一定是均匀分布。
4. 条件分布与条件密度
离散型
在$Y = y_j$条件下X的条件分布律:
P\{X = x_i | Y = y_j\} = \frac{P\{X = x_i, Y = y_j\}}{P\{Y = y_j\}} = \frac{p_{ij}}{p_{\cdot j}}
在$X = x_i$条件下Y的条件分布律:
P\{Y = y_j | X = x_i\} = \frac{P\{X = x_i, Y = y_j\}}{P\{X = x_i\}} = \frac{p_{ij}}{p_{i\cdot}}
连续型
在$Y = y$条件下X的条件概率密度:
f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)}
在$Y = y$条件下X的条件分布函数:
F_{X|Y}(x|y) = P\{X \leq x | Y = y\} = \int_{-\infty}^{x} \frac{f(x,y)}{f_Y(y)}dx
5. 相互独立的随机变量
定义:设$F(x,y)$及$F_X(x), F_Y(y)$分别是二维随机变量$(X,Y)$的分布函数及边缘分布函数,若对于所有$x,y$有
P\{X \leq x, Y \leq y\} = P\{X \leq x\}P\{Y \leq y\}
即
F(x,y) = F_X(x)F_Y(y)
则称随机变量X和Y是相互独立的。
独立性判定:
- 连续型:X和Y相互独立
\Leftrightarrowf(x,y) = f_X(x)f_Y(y)在平面上几乎处处成立 - 离散型:X和Y相互独立
\Leftrightarrow对于所有可能取值$(x_i, y_j)$有P\{X = x_i, Y = y_j\} = P\{X = x_i\}P\{Y = y_j\}
6. 二维正态分布(重点性质)
设$(X,Y) \sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)$,则
- $X \sim N(\mu_1,\sigma_1^2)$,
Y \sim N(\mu_2,\sigma_2^2) - $X$与$Y$相互独立
\Leftrightarrow \rho=0 - 任意非零线性组合$aX+bY$仍服从正态分布
7. 两个随机变量函数的分布
(1) Z = X + Y 的分布(卷积公式)
设$(X,Y)$是二维连续型随机变量,具有概率密度$f(x,y)$,则$Z = X + Y$的概率密度为
f_{X+Y}(z) = \int_{-\infty}^{+\infty} f(z-y, y)dy = \int_{-\infty}^{+\infty} f(x, z-x)dx
若X和Y相互独立,边缘概率密度为$f_X(x), f_Y(y)$,则有卷积公式:
f_{X+Y}(z) = f_X * f_Y = \int_{-\infty}^{+\infty} f_X(z-y)f_Y(y)dy = \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx
(2) Z = Y/X 的分布、Z = XY 的分布
设$(X,Y)$是二维连续型随机变量,概率密度为f(x,y)
f_{Y/X}(z) = \int_{-\infty}^{\infty} |x|f(x, xz)dx
f_{XY}(z) = \int_{-\infty}^{\infty} \frac{1}{|x|}f(x, \frac{z}{x})dx
若X和Y相互独立,边缘概率密度为$f_X(x), f_Y(y)$,则有:
f_{Y/X}(z) = \int_{-\infty}^{\infty} |x|f_X(x)f_Y(xz)dx
f_{XY}(z) = \int_{-\infty}^{\infty} \frac{1}{|x|}f_X(x)f_Y(\frac{z}{x})dx
(3) M = max{X,Y} 及 N = min{X,Y} 的分布
设X,Y是两个相互独立的随机变量,分布函数分别为F_X(x), F_Y(y)
最大值的分布:
F_{\max}(z) = P\{M \leq z\} = P\{X \leq z, Y \leq z\} = F_X(z)F_Y(z)
最小值的分布:
F_{\min}(z) = P\{N \leq z\} = 1 - P\{N > z\} = 1 - P\{X > z, Y > z\}
= 1 - [1-F_X(z)][1-F_Y(z)]
推广:若$X_1, X_2, ..., X_n$独立同分布,分布函数为$F(x)$,则
F_{\max}(z) = [F(z)]^nF_{\min}(z) = 1 - [1-F(z)]^n
8. 多维随机变量典型例题
例:设随机变量(X,Y)的概率密度为
f(x,y) = \begin{cases} \frac{1}{2}(x+y)e^{-(x+y)}, & x > 0, y > 0 \\ 0, & \text{其他} \end{cases}
(1) 问:X和Y是否相互独立?(2) 求Z = X + Y的概率密度。
解:
(1) (X,Y)关于X的边缘概率密度为
f_X(x) = \int_{-\infty}^{+\infty} f(x,y)dy = \begin{cases} \int_0^{+\infty} \frac{1}{2}(x+y)e^{-(x+y)}dy, & x > 0 \\ 0, & x \leq 0 \end{cases} = \begin{cases} \frac{1}{2}(x+1)e^{-x}, & x > 0 \\ 0, & x \leq 0 \end{cases}
同理,f_Y(y) = \begin{cases} \frac{1}{2}(y+1)e^{-y}, & y > 0 \\ 0, & y \leq 0 \end{cases}
而 f_X(x) \cdot f_Y(y) = \begin{cases} \frac{1}{4}(x+1)(y+1)e^{-(x+y)}, & x > 0, y > 0 \\ 0, & \text{其他} \end{cases}
显然 $f_X(x) \cdot f_Y(y) \neq f(x,y)$,故X和Y不独立。
(2) Z = X + Y的概率密度为
f_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x)dx
只有当$x > 0$且$z - x > 0$,即$0 < x < z$时,被积函数不为零。
当$z \leq 0$时,f_Z(z) = 0
当$z > 0$时,
f_Z(z) = \int_0^z \frac{1}{2}(x + z - x) \cdot e^{-(x+z-x)}dx = \int_0^z \frac{1}{2}ze^{-z}dx = \frac{1}{2}z^2e^{-z}
所以 f_Z(z) = \begin{cases} \frac{1}{2}z^2e^{-z}, & z > 0 \\ 0, & z \leq 0 \end{cases}