概率论

1. 随机事件及其概率

随机试验,简称试验, 记作 $E$.

能在相同条件下重复进行,能事先明确所有结果,试验之前不能确定哪个结果会出现。

样本点 : $ E $ 的一种可能结果, 记作 $ \omega $

样本空间 :$\omega$ 的全体,记作$\Omega$

随机事件 :$\Omega$ 的子集, 简称事件 ,通常记为 $A$, $B$, $C$ …

基本事件 :由一个样本点组成的事件

必然事件 :每次试验必然发生

不可能事件 : 每次试验不可能发生

事件间的关系

  1. 子事件

$A \subset B$

$A$ 发生, $B$ 必然发生

  1. 相等事件

$A = B$

$A$ , $B$ 互为子事件

  1. 和事件

$A \cup B$

事件$A$ 和 事件 $B$ 的全部样本点组成的集合

n个事件的和记为

$$
\bigcup_{i=1}^{n} A_i
$$

  1. 积事件

$A \cap B$

既属于事件 $A$ 又属于事件 $B$ 的样本点组成的集合

n个事件的积记为

$$
\bigcap_{i=1}^{n} A_i
$$

  1. 互斥事件

$A \cap B = \emptyset$

$A$ 与 $B$ 没有相同的样本点

  1. 对立事件

$A \cap B = \emptyset$ 且 $A \cup B = \Omega$

不是 $A$ 发生就是 $B$ 发生

  1. 差事件

$A - B$ $A\overline{B}$ $A - AB$

属于事件 $A$ 而不属于事件 $B$ 的样本点组成的集合

事件间的运算律

  1. 交换律
  2. 结合律
  3. 分配律
  4. 德摩根律
  5. 吸收律

古典概型与几何概型

  1. 古典概型

    样本空间有限且等可能

  2. 几何概型

    样本空间无限且等可能

概率公式

条件概率

若$P(A) > 0$, 在$A$ 发生的条件下, $B$ 发生的概率

$$
P(B \mid A) = \frac{P(AB)}{P(A)}
$$

乘法公式:

$$
P(AB) = P(B \mid A) P(A)
$$

$$
P(\Omega) = P(A)+P(\overline{A}) = 1
$$

$$
P(A-B)=P(A-AB)=P(A)-P(AB)
$$

$$
P(A+B)=P(A)+P(B)-P(AB)
$$

$n$ 个任意事件的并: $\sum A_i - \sum A_iA_j + \sum A_iA_jA_k …$

全概率公式

$$
P(A) = \sum_{i}^n P(A \mid B_i) P(B_i)
$$

贝叶斯公式

$$
P(B_i \mid A) = \frac{P(A \mid B_i) P(B_i)}{\sum\limits_{j=1}^n P(A \mid B_j) P(B_j)}
$$

事件的独立性

事件$A$ 和 事件$B$ 相互独立

$P(AB) = P(A)P(B) \iff P(A \mid B) = P(A) \text{ 或 } P(B \mid A) = P(B)$

推广: $n$ 个事件相互独立 $\iff$ 对于任意$k(2<=k <=n)$ 个事件,$P(A_1A_2…A_k) = P(A_1)P(A_2)…P(A_k)$

$n$ 重独立试验 :试验 $E$ 做 $n$ 次

伯努利试验 :试验结果只有两个,事件 $A$ 发生或者事件 $A$ 不发生

$n$ 重伯努利试验 : 伯努利试验在相同条件下重复 $n$ 次

恰好发生k次的概率为:

共有$C_n^k$ 种情况, 每种情况两两互斥, 且每次发生的概率是$p^{k}q^{n-k}$

每种情况累加起来

$P_n(k) = C_n^k p^{k} q^{n-k}$

几何概率 :

前 $k-1$ 次试验不中,第 $k$ 次中的概率

$G(k) = pq^{k-1}$

随机变量及其分布

随机变量 : 对于每一个样本点 $\omega \in \Omega$ 都有唯一对应的值 $X(\omega)$ 与之对应, 则称函数$X(\omega)$ 为随机变量, 简称 $X$

离散型随机变量 :取值有限个或可列无限多个

分布函数 : 设 X 是一个随机变量,$x$ 是任意实数,函数 $ F(x) = P{X \le x}$ 称为 $x$ 的分布函数

分布函数的性质: 非负性,单调不减性,规范性,右连续性

概率密度 : 对于一个连续型随机变量 $X$,记它的分布函数 $F(x) = \int_{-\infty}^{x} f(t)dt$

则称 $f(x)$ 为 $X$ 的 概率密度函数 ,简称 概率密度

概率密度的性质:

  1. 非负性 $f(x) \geq 0, x \in \mathbb{R}$
  2. 规范性 $\int_{-\infty}^{\infty}f(x)dx = 1$
  3. $P{a < X \leq b} = \int_{a}^{b}f(x)dx$
  4. 连续点处: $F’(x) = f(x)$

常见的离散型随机变量分布

  1. 退化分布

    $P{X=C}=1$

  2. 0-1 分布(两点分布)

    $X \sim b(1,p)$

  3. 二项分布

    $$
    P{X=k}=C_{n}^{k}p^{k}(1-p)^{n-k}, k=0,1,2,…,n.
    $$

    $X \sim b(n,p)$

  4. 泊松分布

    $$
    P{X=k}=\frac{\lambda^{k}e^{-\lambda}}{k!},\lambda>0,k=0,1,2…,
    $$

    $X \sim P(\lambda)$

    泊松分布的二项近似

    当 $n$ 很大, $p$ 很小的时候,二项分布近可似于泊松分布

常见的连续型随机变量的分布

  1. 均匀分布、

    $X \sim U[a,b]$

    $$
    F(x) = \begin{cases}
    0, & x < a \
    \frac{x-a}{b-a}, & a \leq x \leq b \
    1, & x > b
    \end{cases}
    $$

  2. 指数分布

    $X \sim e(\lambda)$

    $$
    F(x) = \begin{cases}
    1 - e^{-\lambda x}, & x > 0\
    0, & x \leq 0
    \end{cases}
    $$

  3. 正态分布

    $X \sim (\mu,\sigma^{2})$

    标准正态分布 $u = 0, \sigma=1$

随机变量函数的分布

  1. 离散型 : 离散随机变量函数仍然离散, 只要列出所有可能值即可
  2. 连续型

设 $X$ 的分布函数为 $F_x(x)$ , 概率密度 $f_x(x)$, $Y = g(X)$ 为随机变量 X 的函数($g(x)$ 为一连续函数), 其分布函数为

$$
F_y(y) = P{Y \leq y} = P{g(X) \leq y} = P{x \in C_y} = \int_{C_y}f(x)dx
$$

若 $Y = g(X)$ 连续且单调 ,则可以通过求其反函数来简化计算

$$
F_Y(y) = P{Y\leq y} = P{g(X) \leq y} = \
P{X \leq h(y)} = \int_{-\infty}^{h(y)}f_X(x)dx = f(h(y))|h’(y)|
$$

多维随机变量及其分布

3.1 二维随机变量及其分布

二维随机变量 :设 $X$ 和 $Y$ 是 $\Omega$ 上的两个 随机变量,由它们构成的有序数组 $(X,Y)$

联合分布函数 : 二元函数 $F(x,y) = P{X \leq x \land Y \leq y}$ 一个从左下角无限远延伸到 $(x,y)$ 的矩形的范围

二维概率随机变量概率密度 : 对于分布函数 $F(x,y) = \int_{-\infty}^{y} \int_{-\infty}^{x}f(u,v)dudv$

$f(x,y)$ 为 二维连续随机变量 $X$ , $Y$ 的 概率密度(密度函数)联合概率密度

性质:

  1. $f(x,y) \geq 0$

  2. $\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}f(x,y)dxdy = F(+\infty,+\infty) = 1$

  3. 若 $f(x,y)$ 在点 $(x,y)$ 处连续

$$
\frac{\delta^{2}F(x,y)}{\delta_x \delta_y} = f(x,y)
$$

$F(-\infty,-\infty) = 0, F(+\infty,+\infty) = 1,F(-\infty,y) = 0,F(x,-\infty)=0$

边缘函数:

$F_x(x) = (x,+\infty)$

$F_y(x)=(+\infty,y)$

二维均匀分布

二维正态分布

由二维推广至多维随机变量

3.2 随机变量的独立性

github