概率论符号和公式整理

发布于:2025-06-30 ⋅ 阅读:(19) ⋅ 点赞:(0)

本文是由AI生成后,经作者优化整理的文章。个人总结,仅限参考!

以下整理了概率论中的常用符号和公式表格,覆盖基础知识、关键定理和常用分布:


一、基础集合与事件符号

符号 名称 含义/公式 说明
S S S 样本空间 所有可能结果的集合 全集
ω \omega ω 样本点 S S S 中的元素 基本事件
A , B A, B A,B 事件 S S S 的子集 可能发生的结果集合
A c A^c Ac 补事件 S − A S - A SA A A A 不发生
A ∩ B A \cap B AB 事件交 A A A B B B 同时发生 P ( A ∩ B ) P(A \cap B) P(AB) 即联合概率
A ∪ B A \cup B AB 事件并 A A A B B B 发生 加法公式核心
A ∖ B A \setminus B AB 事件差 A A A 发生但 B B B 不发生 A ∩ B c A \cap B^c ABc
∅ \emptyset 空事件 不可能事件 P ( ∅ ) = 0 P(\emptyset) = 0 P()=0
A ⊆ B A \subseteq B AB 事件包含 A A A 发生则 B B B 必然发生 蕴含关系
A ⊥ B A \perp B AB 事件独立 P ( A ∩ B ) = P ( A ) P ( B ) P(A \cap B) = P(A)P(B) P(AB)=P(A)P(B) 统计独立性定义

二、概率函数与公理

公理

公理 名称 数学表述 说明
公理 1 非负性 对于任意事件 A A A (即 A ⊆ S A \subseteq S AS),
P ( A ) ≥ 0 P(A) \geq 0 P(A)0
任何事件发生的概率都不能小于零。
公理 2 规范性 P ( S ) = 1 P(S) = 1 P(S)=1 整个样本空间 S S S (包含所有可能结果) 发生的概率等于 1。意味着某种结果必然发生。
公理 3 可列可加性 对于任意可数个 (有限个或可数无穷个) 两两互斥的事件 A 1 , A 2 , A 3 , . . . A_1, A_2, A_3, ... A1,A2,A3,... (即 i ≠ j i \neq j i=j A i ∩ A j = ∅ A_i \cap A_j = \emptyset AiAj=),
P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left( \bigcup_{i=1}^{\infty} A_i \right) = \sum_{i=1}^{\infty} P(A_i) P(i=1Ai)=i=1P(Ai)
互斥事件并的概率等于各事件概率之和。如果一个事件可以分解成一些互不重叠的子事件,那么该事件的概率就是这些子事件概率的总和。
符号 名称 公式/定义 说明
P ( A ∣ B ) P(A \mid B) P(AB) 条件概率 P ( A ∩ B ) P ( B ) \dfrac{P(A \cap B)}{P(B)} P(B)P(AB) B B B 发生下 A A A 的概率
公式 乘法公式 P ( A ∩ B ) = P ( A ∣ B ) P ( B ) P(A \cap B) = P(A \mid B) P(B) P(AB)=P(AB)P(B) 联合概率计算
公式 全概率公式 P ( A ) = ∑ i P ( A ∣ B i ) P ( B i ) P(A) = \sum_i P(A \mid B_i) P(B_i) P(A)=iP(ABi)P(Bi) { B i } \{B_i\} {Bi} 为分割
公式 贝叶斯定理 P ( B j ∣ A ) = P ( A ∣ B j ) P ( B j ) ∑ i P ( A ∣ B i ) P ( B i ) P(B_j \mid A) = \dfrac{P(A \mid B_j) P(B_j)}{\sum_i P(A \mid B_i) P(B_i)} P(BjA)=iP(ABi)P(Bi)P(ABj)P(Bj) 后验概率计算
对偶公式
符号/名称 公式 说明
德摩根律
(事件逆运算法则)
( A ∪ B ) c = A c ∩ B c (A \cup B)^c = A^c \cap B^c (AB)c=AcBc 并集的补集 = 补集的交集
(推广: ( ⋃ i A i ) c = ⋂ i A i c \left( \bigcup_{i} A_i \right)^c = \bigcap_{i} A_i^c (iAi)c=iAic
( A ∩ B ) c = A c ∪ B c (A \cap B)^c = A^c \cup B^c (AB)c=AcBc 交集的补集 = 补集的并集
(推广: ( ⋂ i A i ) c = ⋃ i A i c \left( \bigcap_{i} A_i \right)^c = \bigcup_{i} A_i^c (iAi)c=iAic
加法公式的对偶形式 P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(AB)=P(A)+P(B)P(AB) 事件并的概率 = 概率和减交集概率
(消除重复计算)
P ( A ∩ B c ) = P ( A ) − P ( A ∩ B ) P(A \cap B^c) = P(A) - P(A \cap B) P(ABc)=P(A)P(AB) A A A 发生但 B B B 不发生的概率
互斥事件的对偶性质 A ∩ B = ∅ A \cap B = \emptyset AB=,则 P ( A ∪ B ) = P ( A ) + P ( B ) P(A \cup B) = P(A) + P(B) P(AB)=P(A)+P(B) 互斥时:并集概率 = 概率之和
P ( A ∪ B ) = P ( A ) + P ( B ) P(A \cup B) = P(A) + P(B) P(AB)=P(A)+P(B),则 A ∩ B = ∅ A \cap B = \emptyset AB= 逆关系:概率可加性蕴含事件互斥
Borel-Cantelli 引理的对偶 ∑ n = 1 ∞ P ( A n ) < ∞    ⟹    P ( lim sup ⁡ A n ) = 0 \sum_{n=1}^{\infty} P(A_n) < \infty \implies P\left(\limsup A_n\right) = 0 n=1P(An)<P(limsupAn)=0 事件列若概率和收敛,则“无限发生”概率为 0
∑ n = 1 ∞ P ( A n ) = ∞  且独立    ⟹    P ( lim sup ⁡ A n ) = 1 \sum_{n=1}^{\infty} P(A_n) = \infty \text{ 且独立} \implies P\left(\limsup A_n\right) = 1 n=1P(An)= 且独立P(limsupAn)=1 事件列若独立且概率和发散,则“无限发生”概率为 1(对偶结论
独立性的对偶条件 P ( A ∩ B ) = P ( A ) P ( B )    ⟹    A , B  独立 P(A \cap B) = P(A)P(B) \implies A, B \text{ 独立} P(AB)=P(A)P(B)A,B 独立 独立性的基础定义形式
P ( A ∣ B ) = P ( A ) (当  P ( B ) > 0 ) P(A \mid B) = P(A) \quad \text{(当 } P(B)>0\text{)} P(AB)=P(A)(当 P(B)>0 对偶表达:条件概率 = 无条件概率
(独立性在条件概率中的体现)
P ( A ∣ B ) = P ( A ∣ B c ) P(A \mid B) = P(A \mid B^c) P(AB)=P(ABc) 独立性等价于: B B B 发生与否不影响 A A A 的条件概率

对偶性在概率论中的意义
对偶公式揭示了概率运算中互补结构的对称性(如并/交、发生/不发生、独立/相关),是化简复杂概率问题和证明极限定理的核心工具。尤其当问题涉及补事件互逆结论时(如“至少发生一次” vs. “永不发生”),对偶关系常提供简洁的转换路径。


三、随机变量与分布

符号 名称 公式/定义 说明
X , Y X, Y X,Y 随机变量 函数 X : S → R X: S \to \mathbb{R} X:SR 将结果映射为实数
F X ( x ) F_X(x) FX(x) 累积分布函数 (CDF) F X ( x ) = P ( X ≤ x ) F_X(x) = P(X \leq x) FX(x)=P(Xx) 单调不减、右连续
离散型
p X ( x ) p_X(x) pX(x) 概率质量函数 (PMF) p X ( x ) = P ( X = x ) p_X(x) = P(X = x) pX(x)=P(X=x) 离散随机变量概率
连续型
f X ( x ) f_X(x) fX(x) 概率密度函数 (PDF) P ( a ≤ X ≤ b ) = ∫ a b f X ( x )   d x P(a \leq X \leq b) = \int_a^b f_X(x) \, dx P(aXb)=abfX(x)dx f X ( x ) ≥ 0 f_X(x) \geq 0 fX(x)0, (\int_{-\infty}^{\infty} f_X(x) , dx = 1$
公式 CDF与PDF关系 F X ( x ) = ∫ − ∞ x f X ( t )   d t F_X(x) = \int_{-\infty}^{x} f_X(t) \, dt FX(x)=xfX(t)dt f X ( x ) = d d x F X ( x ) f_X(x) = \frac{d}{dx} F_X(x) fX(x)=dxdFX(x)

四、重要数字特征

符号 名称 公式 说明
E [ X ] E[X] E[X] 期望 离散: ∑ x i p ( x i ) \sum x_i p(x_i) xip(xi)
连续: ∫ x f ( x )   d x \int x f(x) \, dx xf(x)dx
随机变量平均值
Var ( X ) \text{Var}(X) Var(X) 方差 E [ ( X − E [ X ] ) 2 ] = E [ X 2 ] − ( E [ X ] ) 2 E\left[(X - E[X])^2\right] = E[X^2] - (E[X])^2 E[(XE[X])2]=E[X2](E[X])2 度量离散程度
σ X \sigma_X σX 标准差 Var ( X ) \sqrt{\text{Var}(X)} Var(X) 方差的平方根
Cov ( X , Y ) \text{Cov}(X,Y) Cov(X,Y) 协方差 E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] = E [ X Y ] − E [ X ] E [ Y ] E[(X-E[X])(Y-E[Y])] = E[XY]-E[X]E[Y] E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y] 衡量两变量线性相关性
ρ X , Y \rho_{X,Y} ρX,Y 相关系数 Cov ( X , Y ) σ X σ Y \dfrac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y} σXσYCov(X,Y) $
Skew ( X ) \text{Skew}(X) Skew(X) 偏度 E [ ( X − μ σ ) 3 ] E\left[\left(\frac{X-\mu}{\sigma}\right)^3\right] E[(σXμ)3] 分布不对称性度量
Kurt ( X ) \text{Kurt}(X) Kurt(X) 峰度 E [ ( X − μ σ ) 4 ] − 3 E\left[\left(\frac{X-\mu}{\sigma}\right)^4\right] - 3 E[(σXμ)4]3 分布尖锐或平坦程度(减3后正态为0)

五、极限定理

以下是大数定律主要形式的结构化对比表格,包含核心公式、条件及收敛目标:

大数定律类型 条件 公式表达(收敛形式) 收敛目标 应用场景
伯努利大数定律 独立重复试验( n n n 次),固定事件概率 p p p lim ⁡ n → ∞ P ( ∣ μ n n − p ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{\mu_n}{n} - p \right| < \varepsilon \right) = 1 limnP( nμnp <ε)=1 频率 μ n n \frac{\mu_n}{n} nμn → 概率 p p p 频率稳定性(抛硬币等)
切比雪夫大数定律 随机变量序列 { X n } \{X_n\} {Xn} 两两不相关,方差一致有界( D ( X i ) ≤ C D(X_i) \leq C D(Xi)C lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E ( X i ) ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \frac{1}{n} \sum_{i=1}^n E(X_i) \right| < \varepsilon \right) = 1 limnP( n1i=1nXin1i=1nE(Xi) <ε)=1 样本均值 → 期望均值 1 n ∑ E ( X i ) \frac{1}{n} \sum E(X_i) n1E(Xi) 异分布随机变量序列分析
辛钦大数定律 { X n } \{X_n\} {Xn} 独立同分布(i.i.d.),期望存在( E ( X i ) = μ E(X_i) = \mu E(Xi)=μ,方差可无) lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − μ ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \mu \right| < \varepsilon \right) = 1 limnP( n1i=1nXiμ <ε)=1 样本均值 X ˉ n \bar{X}_n Xˉn → 总体均值 μ \mu μ 参数估计(抽样调查)
泊松大数定律 独立试验( n n n 次),第 k k k 次事件概率为 p k p_k pk(概率可变) lim ⁡ n → ∞ P ( ∣ μ n n − 1 n ∑ k = 1 n p k ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{\mu_n}{n} - \frac{1}{n} \sum_{k=1}^n p_k \right| < \varepsilon \right) = 1 limnP( nμnn1k=1npk <ε)=1 频率 μ n n \frac{\mu_n}{n} nμn → 平均概率 p ˉ \bar{p} pˉ 变概率事件长期规律(如故障率)
马尔可夫大数定律 满足马尔可夫条件 lim ⁡ n → ∞ 1 n 2 D ( ∑ i = 1 n X i ) = 0 \lim_{n \to \infty} \frac{1}{n^2} D\left( \sum_{i=1}^n X_i \right) = 0 limnn21D(i=1nXi)=0 lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E ( X i ) ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \frac{1}{n} \sum_{i=1}^n E(X_i) \right| < \varepsilon \right) = 1 limnP( n1i=1nXin1i=1nE(Xi) <ε)=1 样本均值 → 期望均值 1 n ∑ E ( X i ) \frac{1}{n} \sum E(X_i) n1E(Xi) 广义随机序列(无相关性要求)

补充说明:

  1. 统一数学表达
    所有大数定律均可概括为:
    1 n ∑ i = 1 n X i → P μ ( n → ∞ ) \frac{1}{n} \sum_{i=1}^n X_i \xrightarrow{P} \mu \quad (n \to \infty) n1i=1nXiP μ(n)
    其中 μ \mu μ 是总体期望或期望的平均, → P \xrightarrow{P} P 表示依概率收敛。

  2. 符号

    • μ n \mu_n μn:事件发生次数(伯努利/泊松)
    • X ˉ n = 1 n ∑ X i \bar{X}_n = \frac{1}{n} \sum X_i Xˉn=n1Xi:样本均值
    • ε \varepsilon ε:任意小的正数(收敛精度)
    • D ( ⋅ ) D(\cdot) D():方差

💡 核心思想:大量独立重复试验下,随机现象的偶然性偏差被稀释,样本统计量稳定趋近于理论期望值。
⚠️ 注意:大数定律不消除单次试验的随机性,也不解释微小偏差的长期累积效应(如赌徒谬误)。


六、常见离散概率分布

分布 PMF 期望 方差 应用场景
伯努利 Bern ( p ) \text{Bern}(p) Bern(p) p ( 1 ) = p ,   p ( 0 ) = 1 − p p(1)=p, \, p(0)=1-p p(1)=p,p(0)=1p p p p p ( 1 − p ) p(1-p) p(1p) 单次二元试验(如抛硬币)
二项 Bin ( n , p ) \text{Bin}(n,p) Bin(n,p) ( n k ) p k ( 1 − p ) n − k \binom{n}{k} p^k (1-p)^{n-k} (kn)pk(1p)nk n p np np n p ( 1 − p ) np(1-p) np(1p) n n n 次独立伯努利试验成功次数
几何 Geom ( p ) \text{Geom}(p) Geom(p) ( 1 − p ) k − 1 p (1-p)^{k-1}p (1p)k1p 1 p \frac{1}{p} p1 1 − p p 2 \frac{1-p}{p^2} p21p 首次成功所需试验次数
泊松 Pois ( λ ) \text{Pois}(\lambda) Pois(λ) λ k e − λ k ! \frac{\lambda^k e^{-\lambda}}{k!} k!λkeλ λ \lambda λ λ \lambda λ 单位时间/空间内稀有事件发生次数

七、常见连续概率分布

分布 PDF 期望 方差 应用场景
均匀 Unif ( a , b ) \text{Unif}(a,b) Unif(a,b) 1 b − a ,   x ∈ [ a , b ] \frac{1}{b-a}, \, x \in [a,b] ba1,x[a,b] a + b 2 \frac{a+b}{2} 2a+b ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(ba)2 区间内等可能取值
正态 N ( μ , σ 2 ) \mathcal{N}(\mu,\sigma^2) N(μ,σ2) 1 σ 2 π e − ( x − μ ) 2 2 σ 2 \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} σ2π 1e2σ2(xμ)2 μ \mu μ σ 2 \sigma^2 σ2 自然界广泛存在的分布
指数 Exp ( λ ) \text{Exp}(\lambda) Exp(λ) λ e − λ x ,   x ≥ 0 \lambda e^{-\lambda x}, \, x \geq 0 λeλx,x0 1 λ \frac{1}{\lambda} λ1 1 λ 2 \frac{1}{\lambda^2} λ21 无记忆性的等待时间分布
伽马 Γ ( α , β ) \Gamma(\alpha,\beta) Γ(α,β) β α x α − 1 e − β x Γ ( α ) \frac{\beta^\alpha x^{\alpha-1} e^{-\beta x}}{\Gamma(\alpha)} Γ(α)βαxα1eβx α β \frac{\alpha}{\beta} βα α β 2 \frac{\alpha}{\beta^2} β2α 多阶段等待时间、可靠性分析

说明

  1. 符号体系差异:不同教材/文献可能存在符号差异(如方差 D ( X ) D(X) D(X) σ X 2 \sigma_X^2 σX2)。
  2. 上下文依赖:符号含义需结合上下文理解(例如 σ \sigma σ 可表示标准差或参数)。
  3. 分支领域扩展:信息论(熵 H ( X ) H(X) H(X))、随机过程(马尔可夫链 P i j P_{ij} Pij) 等有其专用符号。
  4. 测度论基础:严格定义中概率空间记为 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P),其中 F \mathcal{F} F σ \sigma σ-代数。

网站公告

今日签到

点亮在社区的每一天
去签到