1. 随机事件及其概率
随机试验,简称试验, 记作 $E$.
能在相同条件下重复进行,能事先明确所有结果,试验之前不能确定哪个结果会出现。
样本点 : $ E $ 的一种可能结果, 记作 $ \omega $
样本空间 :$\omega$ 的全体,记作$\Omega$
随机事件 :$\Omega$ 的子集, 简称事件 ,通常记为 $A$, $B$, $C$ …
基本事件 :由一个样本点组成的事件
必然事件 :每次试验必然发生
不可能事件 : 每次试验不可能发生
事件间的关系
- 子事件
$A \subset B$
$A$ 发生, $B$ 必然发生
- 相等事件
$A = B$
$A$ , $B$ 互为子事件
- 和事件
$A \cup B$
事件$A$ 和 事件 $B$ 的全部样本点组成的集合
n个事件的和记为
$$
\bigcup_{i=1}^{n} A_i
$$
- 积事件
$A \cap B$
既属于事件 $A$ 又属于事件 $B$ 的样本点组成的集合
n个事件的积记为
$$
\bigcap_{i=1}^{n} A_i
$$
- 互斥事件
$A \cap B = \emptyset$
$A$ 与 $B$ 没有相同的样本点
- 对立事件
$A \cap B = \emptyset$ 且 $A \cup B = \Omega$
不是 $A$ 发生就是 $B$ 发生
- 差事件
$A - B$ $A\overline{B}$ $A - AB$
属于事件 $A$ 而不属于事件 $B$ 的样本点组成的集合
事件间的运算律
- 交换律
- 结合律
- 分配律
- 德摩根律
- 吸收律
古典概型与几何概型
古典概型
样本空间有限且等可能
几何概型
样本空间无限且等可能
概率公式
条件概率
若$P(A) > 0$, 在$A$ 发生的条件下, $B$ 发生的概率
$$
P(B \mid A) = \frac{P(AB)}{P(A)}
$$
乘法公式:
$$
P(AB) = P(B \mid A) P(A)
$$
$$
P(\Omega) = P(A)+P(\overline{A}) = 1
$$
$$
P(A-B)=P(A-AB)=P(A)-P(AB)
$$
$$
P(A+B)=P(A)+P(B)-P(AB)
$$
$n$ 个任意事件的并: $\sum A_i - \sum A_iA_j + \sum A_iA_jA_k …$
全概率公式
$$
P(A) = \sum_{i}^n P(A \mid B_i) P(B_i)
$$
贝叶斯公式
$$
P(B_i \mid A) = \frac{P(A \mid B_i) P(B_i)}{\sum\limits_{j=1}^n P(A \mid B_j) P(B_j)}
$$
事件的独立性
事件$A$ 和 事件$B$ 相互独立
$P(AB) = P(A)P(B) \iff P(A \mid B) = P(A) \text{ 或 } P(B \mid A) = P(B)$
推广: $n$ 个事件相互独立 $\iff$ 对于任意$k(2<=k <=n)$ 个事件,$P(A_1A_2…A_k) = P(A_1)P(A_2)…P(A_k)$
$n$ 重独立试验 :试验 $E$ 做 $n$ 次
伯努利试验 :试验结果只有两个,事件 $A$ 发生或者事件 $A$ 不发生
$n$ 重伯努利试验 : 伯努利试验在相同条件下重复 $n$ 次
恰好发生k次的概率为:
共有$C_n^k$ 种情况, 每种情况两两互斥, 且每次发生的概率是$p^{k}q^{n-k}$
每种情况累加起来
$P_n(k) = C_n^k p^{k} q^{n-k}$
几何概率 :
前 $k-1$ 次试验不中,第 $k$ 次中的概率
$G(k) = pq^{k-1}$
随机变量及其分布
随机变量 : 对于每一个样本点 $\omega \in \Omega$ 都有唯一对应的值 $X(\omega)$ 与之对应, 则称函数$X(\omega)$ 为随机变量, 简称 $X$
离散型随机变量 :取值有限个或可列无限多个
分布函数 : 设 X 是一个随机变量,$x$ 是任意实数,函数 $ F(x) = P{X \le x}$ 称为 $x$ 的分布函数
分布函数的性质: 非负性,单调不减性,规范性,右连续性
概率密度 : 对于一个连续型随机变量 $X$,记它的分布函数 $F(x) = \int_{-\infty}^{x} f(t)dt$
则称 $f(x)$ 为 $X$ 的 概率密度函数 ,简称 概率密度。
概率密度的性质:
- 非负性 $f(x) \geq 0, x \in \mathbb{R}$
- 规范性 $\int_{-\infty}^{\infty}f(x)dx = 1$
- $P{a < X \leq b} = \int_{a}^{b}f(x)dx$
- 连续点处: $F’(x) = f(x)$
常见的离散型随机变量分布
退化分布
$P{X=C}=1$
0-1 分布(两点分布)
$X \sim b(1,p)$
二项分布
$$
P{X=k}=C_{n}^{k}p^{k}(1-p)^{n-k}, k=0,1,2,…,n.
$$$X \sim b(n,p)$
泊松分布
$$
P{X=k}=\frac{\lambda^{k}e^{-\lambda}}{k!},\lambda>0,k=0,1,2…,
$$$X \sim P(\lambda)$
泊松分布的二项近似
当 $n$ 很大, $p$ 很小的时候,二项分布近可似于泊松分布
常见的连续型随机变量的分布
均匀分布、
$X \sim U[a,b]$
$$
F(x) = \begin{cases}
0, & x < a \
\frac{x-a}{b-a}, & a \leq x \leq b \
1, & x > b
\end{cases}
$$指数分布
$X \sim e(\lambda)$
$$
F(x) = \begin{cases}
1 - e^{-\lambda x}, & x > 0\
0, & x \leq 0
\end{cases}
$$正态分布
$X \sim (\mu,\sigma^{2})$
标准正态分布 $u = 0, \sigma=1$
随机变量函数的分布
- 离散型 : 离散随机变量函数仍然离散, 只要列出所有可能值即可
- 连续型
设 $X$ 的分布函数为 $F_x(x)$ , 概率密度 $f_x(x)$, $Y = g(X)$ 为随机变量 X 的函数($g(x)$ 为一连续函数), 其分布函数为
$$
F_y(y) = P{Y \leq y} = P{g(X) \leq y} = P{x \in C_y} = \int_{C_y}f(x)dx
$$
若 $Y = g(X)$ 连续且单调 ,则可以通过求其反函数来简化计算
$$
F_Y(y) = P{Y\leq y} = P{g(X) \leq y} = \
P{X \leq h(y)} = \int_{-\infty}^{h(y)}f_X(x)dx = f(h(y))|h’(y)|
$$
多维随机变量及其分布
3.1 二维随机变量及其分布
二维随机变量 :设 $X$ 和 $Y$ 是 $\Omega$ 上的两个 随机变量,由它们构成的有序数组 $(X,Y)$
联合分布函数 : 二元函数 $F(x,y) = P{X \leq x \land Y \leq y}$ 一个从左下角无限远延伸到 $(x,y)$ 的矩形的范围
二维概率随机变量概率密度 : 对于分布函数 $F(x,y) = \int_{-\infty}^{y} \int_{-\infty}^{x}f(u,v)dudv$
$f(x,y)$ 为 二维连续随机变量 $X$ , $Y$ 的 概率密度(密度函数) 或 联合概率密度
性质:
$f(x,y) \geq 0$
$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}f(x,y)dxdy = F(+\infty,+\infty) = 1$
若 $f(x,y)$ 在点 $(x,y)$ 处连续
$$
\frac{\delta^{2}F(x,y)}{\delta_x \delta_y} = f(x,y)
$$
$F(-\infty,-\infty) = 0, F(+\infty,+\infty) = 1,F(-\infty,y) = 0,F(x,-\infty)=0$
边缘函数:
$F_x(x) = (x,+\infty)$
$F_y(x)=(+\infty,y)$
二维均匀分布
二维正态分布
由二维推广至多维随机变量