正態(tài)分布知識(shí)點(diǎn)(正態(tài)分布)

來(lái)源：好上學(xué) ??時(shí)間：2022-08-16

從身高分布到馬太效應(yīng)

正態(tài)分布無(wú)處不在

上一年超模君在高考的前一天，押中了高考作文題。

現(xiàn)在距離緊張又刺激的高考，只剩下2天了。

看樣子又到超模君蒙題的時(shí)刻，以下內(nèi)容有可能是考試重點(diǎn)，請(qǐng)做好筆記：

某位不愿透露姓名的考生問(wèn)到超模君，他現(xiàn)在考上清華還有希望嗎？

超模君看了看他的近期成績(jī)，Emmm...

這位考生近期模擬考的分?jǐn)?shù)分別為580,600,680,620，四次考試的平均值為620分，標(biāo)準(zhǔn)差為37.4，而一個(gè)學(xué)生的成績(jī)可以近似看做正態(tài)分布。

清華大學(xué)的分?jǐn)?shù)線是680分，把它在上圖標(biāo)出來(lái)：

上圖陰影的面積為0.03，也就是說(shuō)考上清華大學(xué)的概率為3%。

所以超模君的建議是：

其實(shí)除了高考成績(jī)外，我們的生活中還有許多這樣的例子，比如：

身高

人的IQ分布

正態(tài)分布的前世今生

正態(tài)分布概念是由德國(guó)的數(shù)學(xué)家和天文學(xué)家棣莫弗（Moivre）于1733年首次提出，但當(dāng)時(shí)他并沒(méi)有正態(tài)分布更多的應(yīng)用成果，所以并沒(méi)有什么名氣。

后來(lái)，德國(guó)數(shù)學(xué)家高斯（Gauss）率先將其應(yīng)用于天文學(xué)家研究，這時(shí)候正態(tài)分布才引起了人們的廣泛重視，因此正態(tài)分布又叫高斯分布。

左：棣莫弗右：高斯

到了19世紀(jì)，高爾頓和凱特勒把正態(tài)分布用在了其他學(xué)科上，他們用實(shí)際的行動(dòng)開(kāi)拓了應(yīng)用統(tǒng)計(jì)學(xué)，為數(shù)理統(tǒng)計(jì)學(xué)的產(chǎn)生奠定了基礎(chǔ)。

在他們兩人的影響下，正態(tài)分布獲得了普遍認(rèn)可和廣泛應(yīng)用（甚至是濫用）。

左：高爾頓右：凱特勒

那么這么厲害的正態(tài)分布到底講的是什么呢？別急，我們先來(lái)看看高爾頓是怎么研究的。

1877 年，高爾頓設(shè)計(jì)了一個(gè)叫高爾頓釘板的實(shí)驗(yàn)，模擬正態(tài)分布的性質(zhì)：

實(shí)驗(yàn)視頻只需14秒！

高爾頓釘板試驗(yàn)內(nèi)容：

有一塊貼在墻上的木板，木板上有一些水平釘子，它們彼此的距離均相等。讓一些小球從木板上方的入口處自由落體，經(jīng)過(guò)一次次碰撞后，這些小球最終掉落到下方的豎槽中。

知道了實(shí)驗(yàn)內(nèi)容后，我們來(lái)看看高爾頓釘板實(shí)驗(yàn)的細(xì)節(jié)：

彈珠往下滾的時(shí)候，撞到釘子就會(huì)隨機(jī)選擇往左邊走，還是往右邊走：

這些小球最終的分布位置如下圖：

像這種左右對(duì)稱，兩頭低，中間高的曲線我們稱它為正態(tài)分布，又因其曲線呈鐘形，人們又經(jīng)常叫它鐘形曲線。

為什么正態(tài)分布會(huì)如此常見(jiàn)呢？

咳咳，接下來(lái)就是今天內(nèi)容的重點(diǎn)了（敲黑板）！

這個(gè)問(wèn)題可以用中心定理（central limit theorem）來(lái)回答：在適當(dāng)?shù)臈l件下，大量相互獨(dú)立隨機(jī)變量的均值經(jīng)適當(dāng)標(biāo)準(zhǔn)化后依分布收斂于正態(tài)分布。

中心極限定理提出者——棣莫弗

這個(gè)定理可以這么理解：

生活中各種各樣的因素就像高爾頓釘板實(shí)驗(yàn)中的釘子一樣，對(duì)我們各個(gè)方面產(chǎn)生了大大小小的影響，使得最后的結(jié)果分布趨近于正態(tài)分布；

但中心定理并不是萬(wàn)能的，他擁有兩個(gè)很重要的前提：

首先，第一個(gè)前提就是取樣需要隨機(jī)。

這個(gè)前提相信大家可以很好地理解，如果我們抽取的人的時(shí)候，只抽抽長(zhǎng)的高的或者只抽取長(zhǎng)得矮的人，那么結(jié)果自然不符合正態(tài)分布。

第二，影響結(jié)果的因素是相互獨(dú)立或者是相互影響比較小的。

也就是說(shuō)，如果影響結(jié)果的因素之間并沒(méi)有太大的關(guān)系，那么這些因素可以看成是相互獨(dú)立的，這樣結(jié)果才能符合正態(tài)分布。

以身高為例，影響一個(gè)人長(zhǎng)高的因素有很多，例如：

父母長(zhǎng)得高還是矮

營(yíng)養(yǎng)是否跟得上

是否熱愛(ài)運(yùn)動(dòng)

......

等等

父母長(zhǎng)得高還是矮對(duì)營(yíng)養(yǎng)的補(bǔ)充沒(méi)有很大的關(guān)系，跟是否熱愛(ài)運(yùn)動(dòng)也沒(méi)有關(guān)系，所以可以看成是相互獨(dú)立的因素，所以身高的人群分布曲線自然就符合正態(tài)分布。

這時(shí)刻可能有人會(huì)問(wèn)，如果這些因素不獨(dú)立，甚至是有緊密的聯(lián)系會(huì)怎么樣呢？

我們來(lái)看看下面這個(gè)例子：人均財(cái)富分布（馬太效應(yīng)）。

從下圖可以發(fā)現(xiàn)：富人的有錢程度（可以一直向x軸右端延伸）遠(yuǎn)遠(yuǎn)超出窮人的貧窮程度，即財(cái)富分布曲線有右側(cè)的長(zhǎng)尾。

人均財(cái)富分布圖

這是因?yàn)閷?dǎo)致財(cái)富差距的因素比如教育資源，家庭背景，工作單位相互影響，并不獨(dú)立。

如果一個(gè)人家庭背景不錯(cuò)，那么他大有機(jī)會(huì)獲得好的教育資源，從而選擇更好的工作。

這么來(lái)看的話，家庭，教育，工作3個(gè)因素產(chǎn)生了1 1 1＞3的結(jié)果；而相互獨(dú)立的因素應(yīng)該是1 1 1=3（加法）。

這就導(dǎo)致圖像并沒(méi)有出現(xiàn)正態(tài)分布。

但是后來(lái)統(tǒng)計(jì)學(xué)家們發(fā)現(xiàn)，既然這些因素相互影響，那么完全可以把這些相互影響的因素看做乘法，接下來(lái)我們通過(guò)對(duì)數(shù)把乘法轉(zhuǎn)換為加法。

這里需要補(bǔ)一點(diǎn)高中的數(shù)學(xué)識(shí)：

大家在高中的時(shí)候都學(xué)過(guò)對(duì)數(shù)，對(duì)數(shù)有一個(gè)獨(dú)特的性質(zhì)——可以把乘法變成加法。（如下圖所示）

把乘法變成加法后，不就可以看成結(jié)果是是由一個(gè)個(gè)獨(dú)立的因素影響的嗎？

因此我們對(duì)之前的數(shù)據(jù)取自然對(duì)數(shù)，結(jié)果就接近于正態(tài)分布了：

這就是正態(tài)分布的一個(gè)衍生——對(duì)數(shù)正態(tài)分布。

總的來(lái)說(shuō)，正態(tài)分布解釋了自然界中大部分常見(jiàn)的分布問(wèn)題，但事情的結(jié)果往往還是由自己決定的。

3%離100%的成功還差了32倍的汗水和付出。

如果想在高考（或者考研，國(guó)考）這個(gè)戰(zhàn)場(chǎng)上取得更好的成績(jī)，走進(jìn)更好的學(xué)術(shù)殿堂，那么還是需要不斷地提升自己，減小隨機(jī)性（標(biāo)準(zhǔn)差）。

職校招生網(wǎng)

在線咨詢

正態(tài)分布知識(shí)點(diǎn)(正態(tài)分布)

熱招院校推薦

東方理工大學(xué)

泰山護(hù)理職業(yè)學(xué)院

臨沂衛(wèi)生學(xué)校

濰坊護(hù)理職業(yè)學(xué)院

濟(jì)南護(hù)理職業(yè)學(xué)院

山東省青島衛(wèi)生學(xué)校

山東力明科技職業(yè)學(xué)院

青島大學(xué)醫(yī)學(xué)院

熱門(mén)專業(yè)