【基础理论】介绍一个概率分布:柯西分布

发布于:2022-12-12 ⋅ 阅读:(743) ⋅ 点赞:(0)

目录

一、提要

二、柯西分布的几何解释

三、性质

四、结论


一、提要

        连续概率密度函数究竟有多少,应该有无穷多。在诸多分布函数中,高斯分布可能是最著名的。然而,有没有类似于高斯函数的分布,而形式上不是指数函数的呢?回答是有,柯西分布就是一种。

二、柯西分布的几何解释

        柯西分布,也称为柯西-洛伦兹分布或洛伦兹分布,是描述共振行为的连续分布。它还描述了以随机角度倾斜的线段切割 x 轴的水平距离分布。如图:我们从原点引出射线,相邻射线角度相等,这些射线与平行于x轴的直线S有交点,这些交点在S线上的密度是不同的,显然,在90°的附近密度最大。(目测)

Cauchy Distribution -- from Wolfram MathWorld

        让 θ 表示具有固定旋转点的线与垂直轴所成的角度,如图所示。然后

tan\Theta = \frac{x}{b}                                                             (1)

\Theta = tan^{-1} \frac{x}{b}                                                         (2)

d\Theta = \frac{1}{1+\frac{x^2}{b^2}}\frac{dx}{b} =\frac{bdx}{b^2+x^2}                                 (3)

\frac{d\theta }{\pi } =\frac{1}{ \pi } \frac{bdx}{b^2+x^2}                                                  (4)

将(4)分别取积分:

         显然,左边是对\[-\frac{\pi}{2},\frac{\pi}{2}]上均匀分布积分,后者是对某个函数在整个数轴积分,两个都是1;显然都能构成概率密度函数。(注意概率密度函数的三个要素)

        后者的概率密度函数就是柯西分布。即:

                f(x) = \frac{1}{ \pi } \frac{b }{b^2+x^2}                            

        更一般的写法是:

密度函数和分布函数的曲线: 

 

        其中 b 是半峰半宽,m 是统计中位数。在关于的图示中,m=0。Cauchy 分布在 Wolfram 语言中实现为 CauchyDistribution[m, Gamma/2].

三、性质

        柯西分布的均值、方差都不存在!。下面我们使用numpy对它进行抽样,并和标准正态分布进行对照。

import numpy as np
from matplotlib import pyplot as plt
cnt=1000 #抽样1000个样本点
x=np.random.standard_cauchy(cnt)
y=np.random.randn(cnt)
plt.figure()
plt.subplot(2,1,1)
plt.hist(x,100,density=True)
plt.legend(['Cauchy'])

plt.subplot(2,1,2)
plt.hist(y,100,density=True)
plt.legend(['Gauss'])
plt.show()

结果图: 

四、结论

        柯西分布的取值范围非常广,很大的值也有一定概率取到,因而柯西分布也称为heavy-tail distribution。并且相比于gaussian,概率密度的最大取值只有0.1,就是x=0的那个地方。

        而高斯分布的取值就集中很多,0处的概率密度为0.6左右。

        再有,在量子世界,粒子和粒子距离很远,比如,电子到原子核的距离,就好比一个汽车到三千公里外的一个城市距离,因此,要显著描述电子的位置分布,只能是柯西-洛伦兹分布,不能用高斯分布刻画,因为高斯分布尺度不够,信号太弱,噪声将把电子的电磁能量淹没,模型无效。

本文含有隐藏内容,请 开通VIP 后查看

网站公告


今日签到

点亮在社区的每一天
去签到