概率论-泊松分布详解(狗都能看懂)

发布于:2024-05-09 ⋅ 阅读:(27) ⋅ 点赞:(0)

24年再看一年前写的文章。

概率论-泊松分布详解(狗都能看懂) (qq.com)icon-default.png?t=N7T8https://mp.weixin.qq.com/s?__biz=MzkwMTQyMTU0OA==&mid=2247483842&idx=1&sn=8785a5fd1e4d73228e04fe0a17840aa3&chksm=c0b44141f7c3c8571ef8e8c5b1dc24b632389710a2c9ebdc63236db9ffe1aa00fb40b7a0dfb9&token=667671903&lang=zh_CN#rd23年暑假自学概率论泊松公式的时候,有很多地方没懂,便自己研究了一下。在公众号上收获的阅读量很多,也受到很多朋友的留言和提问。因此想在CSDN上也发表一下。

很多地方感觉也没有讲的很清楚(或者有可能讲错),因此如果有朋友能留言评论区一起探讨,十分感激赐教。

以下是原文。


上图黑板上右边第六题,我自学的时候感觉这一段有难度而且比较重要,又看到很多同学在弹幕留言说根本看不懂,所以简单写下。

(废话段)先从基本概念讲起,很多同学包括我以前,都会急于去看这题到底怎么做的出来,因为脑海中已经有个模糊的框架了,感觉就差那么一丢丢,前面的概念基础啥的都已经会了,只要能看到那一小步怎么弄就行了。其实不然,对于数学这种逻辑性的课程,卡住了就意味这基本概念不清晰,或者没有理解概念的意义(这一点很重要,要真正理解数学概念的意义很难,但并不意味着意义不重要,相反意义是最重要的。作为学生只能不断接近意义)。对我自己来说,最近学习的时候,我会花大量的时间去思考和搜索这些数学公式的意义,去理解。下面我先说说二项分布和泊松分布的意义。

二项分布公式。


24年添加的latex公式:

\lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}


简单说说很好懂。

先不要管那个lim极限,这是争对于n趋向于∞才要加上的。

后面有一个括号,括号里上面一个n下面一个k,那玩意就是Cnk,从n个里取出k个数有多少种取法。这个写法不同而已。

那这个东西的具体意义是什么。我扔100次硬币,100次里正朝上有30次的概率是多少?好!正常人都会问:为什么是30次不是50次,正常情况不都是差不多50次吗。注意这里的30的意义,是指已经出来的结果就是30,而不是说由概率1/2×100 。换句话说,我每扔100次作为一组,每组的情况都不一样,这些组里,正朝上出现30次这种结果的组,出现的可能性是多少?(下面一段会细说)好,出现30次正上的结果,首先从100次里面选30次,其次这30次是正上,正上的概率设为p(虽然大家都知道是1/2),30次都是正上了就要把每次的正上概率都乘起来。所以是p的30次方。接下来的是反上,反上概率1-p,共有70次反上,所以(1-p)的70次方。再看这个公式就比较好懂了。

二项分布和伯努利模型很像。网上说这两玩意不一样,讲的也有点乱。看到知乎一个很棒的答案(忘记答主叫啥了简称花生哥):

伯努利分布:一堆花生,只有剥了和没剥的,随便拿一个吃了,花生已经剥好了的概率是a,那拿到没剥的带壳的花生概率就是1-a。

二项分布:很饿拿了很多花生吃,但是闲的蛋疼每次拿一个花生都记录一下花生剥了还是没剥。一共吃了N个,最后统计了N个花生整体的分布情况:(N+1种结果)

  1. 剥了出现0次,没剥出现N次;
  2. 剥了出现1次,没剥出现N-1次;
  3. 剥了出现2次,没剥出现N-2次;
  4. 剥了出现3次,没剥出现N-3次;

……N+1. 剥了出现N次,没剥出现0次。

这N+1种结果,每种结果出现的概率,就是二项分布。其实我觉得伯努利和二项分布没啥区别,反正区别这两玩意没啥用。

那其次泊松分布就是二项分布的一种特别形式,当n很大,p很小,期望值np小于10的时候,二项分布的形式可以改写为泊松分布,其目的就是让运算更简便。(稍后会证明结果真的差不多,虽然公式很逆天,即使逆天也是逆天极限公式实打实算出来的公式)

ok先简单的看看这两公式长什么样以及推到过程。(我不会打字数学符号,直接截屏了)


24年添加的公式:

有了p=\frac\mu n了之后,就有:\\ \lim\limits_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}=\lim\limits_{n\to\infty}\binom{n}{k}\Big(\frac{\mu}{n}\Big)^k(1-\frac{\mu}{n})^{n-k}\\ 我们来算一下这个极限:\\ \begin{aligned}\lim_{n\to\infty}\binom{n}{k}\Big(\frac{\mu}{n}\Big)^{k}(1-\frac{\mu}{n})^{n-k}&=\lim_{n\to\infty}\frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}\frac{\mu^{k}}{n^{k}}\Big(1-\frac{\mu}{n}\Big)^{n-k}\\&=\lim_{n\to\infty}\frac{\mu^{k}}{k!}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\Big(1-\frac{\mu}{n}\Big)^{-k}\Big(1-\frac{\mu}{n}\Big)^{n}\end{aligned}\\ 其中:\\ \lim_{n\to\infty}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\Big(1-\frac{\mu}{n}\Big)^{-k}=1\\ \lim_{n\to\infty}\left(1-\frac{\mu}{n}\right)^n=e^{-\mu}\\ 所以:\\ \lim\limits_{n\to\infty}\binom{n}{k}\Big(\frac{\mu}{n}\Big)^k(1-\frac{\mu}{n})^{n-k}=\frac{\mu^k}{k!}e^{-\mu}\\ 上面就是 泊松分布的概率密度函数,也就是说,在T时间内卖出k个馒头的概率为:\\ P(X=k)=\frac{\mu^k}{k!}e^{-\mu}


感谢csdn的馒头哥,引用一下你的推到过程。

这个过程没什么好说的,肉眼看一看就明白了。里面有一个括号里,上面一个n下面一个k,那玩意就是Cnk,从n个里取出k个数有多少种取法。

里面那个μ是期望值,这个也要具体说一下。

所谓期望值就是:

二项分布X~B(n,p),期望值E(X)=np,意义表示随机变量X的平均值,或平均水平。(n表示n次试验,p表示单次试验的成功概率。)

那通俗理解期望值就是“差不多这样吧”的意思,就是计算前预估的,期望的一个差不多的数字。那计算法则就是直接用个体数n×概率p,得出。这个很容易明白,一共200人,脑残的概率是15%,那差不多里面有30个脑残左右。这是期望值。

概念都懂了现在看这题。再放一遍。

银行有1000个用户,每人10万存里面。现在有一批用户觉得通货膨胀严重,要取钱出来买特斯拉,取钱的规则是:提20%积蓄的概率是0.006 。现在问:银行金库里要存放多少钱,才能够95%以上概率的情况下,人们能顺利取钱。(涉及钱的题我都很讨厌,因为很烦。)

好,这样就算是做出来了。其实感觉还是没有说的无敌清楚,考虑到还是会有小白同学看后看不懂的情况,其实讲题就是这样的抽象,自己是已经完全懂了的,试图站在初学者的视角去看待怎么才能讲的清楚,但是还是不能做到完完全全的讲清楚,至少我是这样。果然不是做老师的料。

ok很重要的,前文提到过会证明这两个公式一样,下面就来证明一下:

不算∑求和了,就算k等于0的时候,给诸位看到这里的老爷看看结果。下面是k=0的简化结果,红圈和红线对应着泊松和二项。

然而我的尊贵怀特版卡西欧计算器找不到了,只能用python算一下(的亏还没忘记python怎么写)

(如果你也想学习python就请看我的往期python笔记,还有c语言也有!)点这里

Python​mp.weixin.qq.com/s?__biz=MzkwMTQyMTU0OA==&mid=2247483768&idx=1&sn=2e8d87a207becb799e8b86acf6c6838a&chksm=c0b441fbf7c3c8ed1e4ab0b3d58e9091dbe7c5799f1d035efc4f6bf04f5a229304f17458983a&scene=21#wechat_redirect​编辑icon-default.png?t=N7T8https://link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s%3F__biz%3DMzkwMTQyMTU0OA%3D%3D%26mid%3D2247483768%26idx%3D1%26sn%3D2e8d87a207becb799e8b86acf6c6838a%26chksm%3Dc0b441fbf7c3c8ed1e4ab0b3d58e9091dbe7c5799f1d035efc4f6bf04f5a229304f17458983a%26scene%3D21%23wechat_redirect

0.0024差别不大,太神奇了!

总结一下:最重要的有两点,第一,二项公式泊松公式的意义,参考这道题目可以好好理解;第二,泊松公式的证明,当年能想出极限的这种求法很不简单。第三,我不是当老师的料,太累了。写这个泊松公式解析,主要也是对自己的一个复习加深印象,这个公式也确实比较厉害,不是简单的概率里的期望值啊那种运算那么简单。


网站公告

今日签到

点亮在社区的每一天
去签到