【概率论】分布函数的定义与应用：从直观到数学形式-EW帮帮网

分布函数（Cumulative Distribution Function, CDF）是概率论与数理统计中的核心概念，它用一个函数全面描述了随机变量取值的概率分布情况。在本文中，我们将从直观感受开始，逐步引入分布函数的定义、性质以及离散型和连续型分布函数的区别，并结合实例加深理解。

1. 分布函数的直观引入

1.1 从一个例子出发

假设你正在研究学生的考试成绩分布，绘制了成绩的频率直方图。通过直方图，你可以看到分数落在不同区间的频率，但如果你想知道“分数不超过某个值的学生比例”，该如何计算？

答案是：累积频率。

1.2 累积分布与分布函数

累积频率是一种描述“至多取某值”的概率的方法。将这种累积概率用数学函数表示，就得到了分布函数。

例如，当分数范围为0到100时，假设分布函数 $F (x)$ 表示分数小于等于 $x$ 的概率，则：

$F (60)$ 表示分数小于等于60的学生比例。
$F (100) = 1$ ，表示所有学生都拿到了不超过100的分数。

2. 分布函数的定义

2.1 数学定义

对于一个随机变量 $X$ ，分布函数 $F (x)$ 定义为：

$\leq x)$

即 $F (x)$ 是 $X$ 取值“小于等于 $x$ ”的概率。它反映了随机变量取值的累计概率分布。

2.2 分布函数的图像

通过绘制 $F (x)$ 的图像，可以更直观地观察其增长趋势。通常， $F (x)$ 表现为递增的曲线或阶梯状函数，具体形态取决于随机变量的类型。

3. 分布函数的性质

分布函数具有以下重要性质：

单调非减性：

对任意 $x_1 \leq x_2$ ，有 $F(x_1) \leq F(x_2)$ 。这是因为概率不会减少。

界限：

$\lim_{x \to -\infty} F(x) = 0, \quad \lim_{x \to +\infty} F(x) = 1$

表示 $X$ 的取值范围包含所有可能性。

右连续性：

分布函数 $F (x)$ 在每个 $x$ 处都是右连续的，即：

$\lim_{x \to x_0^+} F(x) = F(x_0)$
连续性随机变量同时还是左连续的

4. 离散型与连续型分布函数

4.1 离散型分布函数

离散型随机变量的分布函数 $F (x)$ 通过求和表示：

$\sum_{x_i \leq x} P(X = x_i)$

特点：阶梯状函数，每个阶跃对应某个具体值的概率。

案例：掷一颗骰子，随机变量 $X$ 表示骰子点数。分布函数为：

$\leq 1) = 1/6$
$\leq 2) = 2/6$

以此类推，分布函数的图像是逐步递增的阶梯状。

4.2 连续型分布函数

连续型随机变量的分布函数 $F (x)$ 通过积分表示：

$\int_{-\infty}^x f(t) \, dt$

其中 $f (x)$ 是概率密度函数（PDF）。

特点：平滑曲线，分布函数是概率密度函数的积分。

案例：均匀分布在 $[0, 1]$ 上的随机变量，其概率密度函数为 $f (x) = 1$ （ $\in [0, 1]$ ）。分布函数为：

$\begin{cases} 0, & x < 0 \\ x, & 0 \leq x \leq 1 \\ 1, & x > 1 \end{cases}$

5. 应用与计算

5.1 由分布函数计算概率

通过分布函数可以直接计算随机变量的区间概率：

$\leq X \leq b) = F(b) - F(a)$

例题：已知 $F (x)$ 为标准正态分布的分布函数，求 $\leq X \leq 1)$ ：

$\leq X \leq 1) = F(1) - F(-1)$

5.2 分布函数求导

对于连续型随机变量，分布函数的导数就是概率密度函数：

$\frac{d}{dx}F(x)$

例题：已知 $F(x) = x^2$ （ $\leq x \leq 1$ ），求概率密度函数 $f (x)$ ：

$\frac{d}{dx}F(x) = 2x$

6. 总结与展望

本文从直观实例出发，逐步引入分布函数的定义、性质和计算方法。我们不仅探讨了离散型与连续型分布函数的差异，还通过实例展示了分布函数的应用。

在实际应用中，分布函数被广泛用于统计分析、数据建模和工程问题中。未来的内容中，我们将进一步探讨分布函数与统计学其他概念（如分位数、概率图）的联系。

【概率论】分布函数的定义与应用：从直观到数学形式

目录