正态分布的前生今生(上)

神说,要来正态分布,就有矣正态分布。
神看正态分布是好之,就被随机误差服从了正态分布。
创世纪—数理统计

图片 1

1. 正态分布,熟悉的旁观者

较好玩。100年来坐数学家为主底科学家等及赌场及股市搏斗的故事:信息论创始人香农居然是炒股高手,收益率超过巴菲特的局1个百分点;21点、轮盘赌、赌马面对科学家赌徒们准确的计算败下阵来,股市则难以对付得多。

学过基础统计学的同窗多对正态分布非常熟悉。这个钟形的布曲线不但形状优雅,它对应的密度函数写成数学表达式

涉嫌到多欧美的全名及公司称,大部分且是自身不熟悉的。

f(x)=12π−−√σe−(x−μ)22σ2

英文原版写给2006年,书被的信息与数目约截至至2005年。期待有人补充写最近10年来之故事。

为老有数学的美感。其法后底概率密度函数

以下是书被有些情之摘要:

f(x)=12π−−√e−x22

1:索普自学了“FORTRAN”这种古老的程序语言,然后自己在计算机及编程。他的盘算结果表明(21接触赌局中)牌面为5之牌子比任何牌子还会长赌场胜率,但对玩家不利。通过简单算牌面为5的牌出现了小张,玩家可以判定出剩下的牌对自己是否有利于。#717

更是的凝练漂亮,两单极重点之数学常量 π、e 都出现在马上公式之中。在自家个人的审美之中,它吧属
top-N
的最美丽的数学公式之一,如果有人提问我数理统计领域哪个公式最会于丁觉得到上帝之是,那我一定投正态分布的票。因为这分布戴在神秘之面纱,在宇宙中无处不在,让你以错综复杂冗杂的数据背后相隐隐的秩序。

2:当他俩了交谈时,索普已不通过意间把20世纪最宏大的人物之一成功带动顶了另外一个世界。香农和索普及一致,同意合作制造轮盘赌博预测机。香农说最佳工作地方就是外的寒。#731

 

3:马丁派战术非但远远未阻止赌徒的覆灭,反而加速了这种覆灭。输家要押注的数据很快高及128美元、256美元、512美元……后来还是玩家的钱北光了,或是精神崩溃了,要么出于赌注太要命,赌场拒绝接受押注。#842

图片 2

4:凯利描述了同等种收到内幕消息的赌客押注的概括方法,仅适用于马场不收场手续费的景(根本没有这么的马场)或内部消息可信度极高之状况。策略就是是每场比赛还以尽基金以来解注,根据收到的内幕消息——每匹马的出奇制胜概率仍比例分红押注金额。#1081

正态分布曲线

5:凯利的博系统,以那个尽普遍的数学形式,被称为“凯利准则”。可以使被外形式的便利赌博活动着得最好充分收益。实际上,最要命的难题在于怎样找到那些罕见的、赌徒占据优势的赌环境。凯利意识及出同样种植人人都得接触到的有利赌博环境:股票市场。#1164

正态分布又普通为称呼高斯分布,在是领域,冠名权那是一个怪高的光荣。2002年先去了德国之兄弟等还会意识,德国1991年至2001年内发行的的一样舒缓10马克的纸币上印着高斯(Carl
Friedrich Gauss,
1777-1855)的头像和正态密度曲线,而1977年东德批发的20马克的不过流通纪念钢镚上,也冲在正态分布曲线和高斯的名字。正态分布为冠名高斯分布,我们为爱看是高斯发现了正态分布,其实不然,不过高斯对正态分布的历史地位之成立是自从及了决定性的来意。

6:试验用终止。据索普估计,他们曾于盖30独小时的工时内以1万美元成为了2.1万美元(如果不是出于基梅尔那次不幸的狂欢,他们也许最终会落3.2万美元)。#1414

图片 3 图片 4 
 图片 5
德国马克和纪念币上之高斯头像和正态分布曲线

7:在《击败东道主》一挥毫1966年之修订版中,索普描述了一致栽更加高档的“数接触往往”策略(现在照旧很盛行,这种策略系统吧深受称呼“高低算牌法”)。把您看出现的每张低点数牌(2、3、4、5还是6)都算为“+1”,把看到底各级张高点数牌(10要A)都划算为“–1”。#1534

正态曲线虽然看上去分外美,却无是同样碰首就能体悟的。我们当本科学习数理统计的时光,课本一齐来介绍正态分布就给有分布密度函数,却没有说明是密度函数是透过什么规律推导出来的。所以自己直接做不知情数学家当年是怎么找到这概率分布曲线的,又是怎发现随机误差服从这个奇异之布之。我们在实践中大量底使用正态分布,却对这个分布之来龙去脉知之甚少,正态分布真是吃人倍感既熟悉又生。直到我念研究生的下,我的先生为我介绍了陈希儒院士的《数理统计学简史》这本开,看了今后才了解了正态分布曲线从发现到叫人们刮目相看就广泛应用,也是由此了几百年的历史。

8:西蒙斯说他们“退出了21接触工作”。另外一各知名的拉斯维加斯通说,《击败东道主》一写是自基福弗听证会后赌博业遭遇的太可怜打击。#1574

正态分布之立即段历史是生完美之,我们经过言语同样多重的故事来揭开她底秘面纱。

9:高级投资经理人(像这奇特业务的其它从业者一样)似乎总是习惯大肆宣传自己的成如忽略自己之挫败。认真查对这些声明战胜了市面的案例隔三差五见面发觉,其中多数都是站不住脚的。#1733

 

10:更令人震惊的凡,有些小型投资者还是坚信经过当互联网上找寻一些音讯再看财经频道的评说就足以选出能够克服市场的股票。#1759

2. 不期而遇,正态曲线的首涂鸦发现

11:在法玛和萨缪尔森的确定性倡导下,有效市场假说在20世纪六七十年代(这恰好是“明星”投资经理人、主动管理型互惠基金与股票投资媒体报道繁盛的年代)席卷了教育界。#1782

第一独故事跟概率论的升华密切相关,主角是棣莫弗(Abraham de Moivre,
1667-1754) 和拉普拉斯 (Pierre-Simon Laplace
1749-1827)。拉普拉斯凡只特别科学家,被称之为法国底牛顿;棣莫弗名气可能未算是大怪,不过大家该还当好熟悉这名字,因为咱们于高中数学学复数的时刻还学过棣莫弗公式

12:索普的翻新的处在当受精确计算出而高达平衡卖空认股权证风险的目的需要买小股票。这种技能现在受称之为“德尔塔对因”(deltahedging),“德尔塔”即Δ,是希腊语的第4个假名,被用来表示量之扭转。#2039

(cosθ+isinθ)n=cos(nθ)+isin(nθ).

13:约翰·梅纳德·凯恩斯都做出“市场保非理性的日较你能支撑的时长得差不多”的资深论断。以非理性价格买进某种商品几乎毫无益处,除非你能够保证以“理性”价格出售时得以得利润。#2043

只要棣莫弗所描写的《机遇论》(The doctrine of
chances)是概率论发展历史遭遇很重大之均等本书。牛顿对棣莫弗十分欣赏,遇到学生向外请求教概率方面的题材时常,他即便说:“这样的题目应当去摸索棣莫弗,他针对性这些题材的研究比较自己深切得差不多。”

14:萨缪尔森得出的定论是,高PQ的人数用会见潜在地用自己之钱或朋友的钱进行投资。他们对自己之“策略”保密。否则,有效的市场以会见效仿他们之做法,使他们取得的国策优势尽失。#2080

 

15:克劳德·香农战胜了市场与99.9%之协同基金经理人。1986年,香农的构成投资平均复合收益率也28%——而沃伦·巴菲特的伯克希尔–哈撒韦公司平均收益率为27%。#2124

图片 6图片 7
棣莫弗和拉普拉斯

16:伯努利的言论以及约翰·凯利以1956年见报之章有酷紧凑的沟通。凯利的法则最终得以给另行陈述也如此一个简单的规律:选择赌博或者投资时,选择最终结出的几何平均数高的酷。这同一拟虽就是“凯利准则”,比凯利公式“胜率/倍率”在计算赌注大小方面下越来越广阔。#2679

古典概率论发源于赌博,惠更斯(Christiaan Huygens,
1629-1695)、帕斯卡(Blaise Pascal, 1623-1662)、费马(Pierre de Fermat,
1601-1665)、雅可比·贝努利(Jacob Bernoulli,
1654-1705)都是古典概率的创立者,他们那会研究的票房价值问题基本上来自赌桌上,最早的概率论问题是赌徒梅累于1654年于帕斯卡提出的哪些分割赌金的问题。统计学着的完整均值之所以受称呼期望
(Expectation),
就是源自惠更斯、帕斯卡这些人研究平均情况下一个赌徒在赌桌上得期待自己获得多少钱。

17:几何平均数则(或者凯利准则)的“近视”特征于21点娱乐中是根本的。现在若可以根据现有的牌面结构决定赌注大小。牌面结构将来会面发生变化,但尚未提到。#2730

来一致上一个弟兄,也许是独赌棍,向棣莫弗提了一个以及博有关的问题:A、B
两人数在赌场里赌博,A、B各自的制胜概率是p,q=1−p,
赌 n 局。两人约定:若 A 赢的局数 X>np, 则 A
付给赌场 X−np 元;若 X<np,则B
付给赌场 np−X 元。
问赌场挣钱的期望值是小。

18:布雷曼是首先只提出几何平均数最大化可以用齐特定财富目标的年华缩至最差的人。谁想成为富翁?布雷曼表示赌徒要投资者以几何平均数则获得百万(或其它)财富的速要较下另外任何资本管理方式还快。#2750

问题并无复杂, 本质上是一个二项分布,若 np 为整数,棣莫弗求出终极的驳斥结果是

19:真正想如果赚的人数相应遵照(普通)凯利赌徒的做法,总是追求极致酷几乎哪里平均数。当凯利赌徒为允许以其他比例拆分资金总额投入现金账户与随意游走的股票时,他会挑选一半对一半之拆分方式,因为这么做的几何平均数最好深。香农的计划是凯利赌博之一个特例。#2901

2npqb(n,p,np)

20:鲁宾斯坦表示,在某些特定的假要条件下,最佳的投资做连永恒比例调整型投资组合。这就成立地说了一般性投资者为什么要限期重新调整股票、债券以及现金的持有量。#2917

里 b(n,p,i)=(ni)piqn−i 是常见的亚桩概率。
但是针对性切实的 n,
因为中的老二项公式中生出组合数,要把这理论结果其实算起数值结果可以是桩好的行,
这就让棣莫弗寻找近似计算的主意。

21:据显示,完全用凯利准则下注的赌博者以资本翻倍之前发生1/3底票房价值遭遇基金减半。减半实行凯利准则的赌博者则独自生1/9的概率在财力翻倍之前遭基金减半。#3200

 

22:1987年10月19日黑色星期一的崩盘对普林斯顿–纽波特公司的市场中立性进行了从严的考验。道琼斯指数的值在同等天内降了23%,是根本单日下跌幅度最要命之平等破。而普林斯顿–纽波特公司价值6亿美元的投资组合在这次崩盘中唯有蒸发少200万美元左右。#3244

与此相关联的旁一个题目,是遵循二项分布的随机变量 X∼B(n,p),
求X 落于二项分布中心点一定限制的几率 Pd=P(|X–np|≤d)。

23:区别在巴菲特及索罗斯之合作社收入波动性更要命。普林斯顿-纽波特公司之正规化收益偏差约为4%,这使该资产比股票市场本身还要更稳定。#3665

对于 p=1/2 的情状,
棣莫弗做了一些划算并拿走了部分接近结果,但是还不够优秀,幸运的凡棣莫弗和斯特林(James
Stirling, 1692-1770)处在同一个时,
而且二口里出关联,斯特林公式是当数学分析中必学的一个要公式

24:有效市场假说的维护者们日常认可市场达成存细微的定价错误,因为漏洞百出太过一线,因此任何人都无见面吗这个费心。交易费用将会晤耗尽一切利润。长期资金管理企业之策略是利用杠杆将这些细小的赚取机会增大至足够引起注重的水平。#3769

n!≈2πn−−−√(ne)n.

25:周反对说:“市场高达无那基本上会,你无法在债券市场赚到那笔钱。”斯科尔斯厉声说道:“原因即在于你——有您这种蠢货存在,我们才能够净赚到这笔钱。”#3791

 

26:长期资金管理公司愚蠢的左低估了起恐慌的可能,而当这种恐慌的规模中交易者们将更换得联系好连贯。基金又进行了数百桩投注。它的操作前提是如果这些赌博相互关联度大没有。#3968

事实上斯特林公式的雏形是棣莫弗最先获得的,但斯特林改进了是公式,改进之结果也棣莫弗所用。1733
年,棣莫弗很快以斯特林公式进行测算并拿走了至关重要的展开。考虑 n 是偶数的图景,二项概率也

27:对于真正的长线投资者,凯利准则是进取型和癫狂型风险当的格。#4016

b(n,12,i)=(ni)(12)n

28:1986年8月11日,《巴伦周刊》汇报了1026寒互惠基金的近年表现。香农取得的低收入过内部的1025家。#4084

以下将b(n,12,i)简记为b(i),
通过斯特林公式做有概括的精打细算好获取,

29:尽管如此,统计套利从某种程度上如比传统的投资做经理人凭直觉进行的交易还爱懂。这是如出一辙栽运算法则,是交易员通过一行行计算机代码费力地计算出来的。统计套利操作的功成名就可说明市场及连接存在无效的状况,凯利准则指导下之血本管理体系可以以这些不算情况赢得超过市场之获益,而与此同时不必承担败诉风险。#4256

b(n2)≈2πn−−−√,

30:威廉·津巴估价,一流的香港计算机集团可以以好之(赌马)赛季里赚钱到1亿美元,其中大约一半收益都归团队主管有。伍兹自己说已经赚了1.5亿美元。#4315

b(n2+d)b(n2)≈e−2d2n,

31:但这无异于想想也出现于了极致意外的地方。凯利准则在身结冰技术是亚文化领域开始流行。有些人计划冷冻自己之尸体以统在长久的前途可行使诊疗纳米技术将那复活(索普曾配备冷冻自己的遗体)。这看似不可能是的联系就是内需办信托资产支出制冷费用。#4353

于是有

b(n2+d)≈22πn−−−√e−2d2n.

采用上式的结果,并以二项概率累加求和的长河中近乎之运用定积分代替求和,很爱就会获

P(∣∣∣Xn–12∣∣∣≤cn−−√)=≈=≈∑−cn√≤i≤cn√b(n2+i)∑−cn√≤i≤cn√22πn−−−√e−2i2n∑−2c≤2in√≤2c12π−−√e−12(2in√)22n−−√∫2c−2c12π−−√e−x2/2dx.(1)

 

看,正态分布之密度函数的样式在积分公式中出现了!这为即是咱们在数理统计课本上到之一个主要结论:二项分布的极端分布是正态分布。

上述才是讨论了 p=1/2 的情状,
棣莫弗也针对 p≠1/2举行了一些计算,后来拉普拉斯本着 p≠1/2 的状做了还多的剖析,并将二项分布的正态近似推广至了任意 p 的事态。
这是首先蹩脚正态密度函数被数学家刻画出,而且是为二项分布的极分布之花样给演绎出来的。
熟悉基础概率统计的同窗等都知情这结果其实被棣莫弗-拉普拉斯核心极限定理。

[棣莫弗-拉普拉斯中坚极限定理]如若随机变量 Xn(n=1,2,⋯) 服从参数为 n,p 的二项分布,则针对擅自的 x, 恒有

limn→∞P(Xn–npnp(1−p)−−−−−−−−√≤x)=∫x−∞12π−−√e−t22dt.

 

咱俩在大学念书数理统计的时光,学习之过程还是预先念正态分布,然后才念为主极限定理。而念到正态分布的下,直接就叙了该概率密度的数学形式,虽然数学上颇精美,但是好困惑数学家们是怎样凭空就找到这分布之。读了陈希孺的《数理统计学简史》之后,我才晓得正态分布之密度形式首赖发现凡是在棣莫弗-拉普拉斯之主干极限定理中。数学家研究数学题目的历程非常少是遵照我们数学教材编排的依次推进的,现代的数学教材都是本数学内在的逻辑进行集团编写的,虽然逻辑结构及严谨优美,却把数学问题研讨之史印痕抹得一样干二均。DNA
双螺旋结构的发现者之一詹姆斯·沃森(James D. Watson, 1928-)
在他的力作《DNA 双螺旋》序言中说:“ Science seldom proceeds in the
straightforward logical manner imagined by outsiders.
(科学的觉察那个少会像门外男子所想象的同样,按照直接了当合乎逻辑的点子进行的。)”
棣莫弗给来他的觉察后40年(大约是1770年),
拉普拉斯建立了基本极限定理较一般的形式,中心极限定理随后而给另外数学家们推广至了其它任意分布之景象,而休限于二项分布。后续的统计学家发现,一多重之重中之重统计量,在样本量 N 趋于无穷的时,
其极分布且有正态的花样,
这构成了数理统计学中大样遵循理论的基本功。

棣莫弗于二项分布的乘除中瞥见了正态曲线的形容,不过他并无能够展现这个曲线的好好之远在。棣莫弗的之工作这连没引起众人足够的青睐,原因在棣莫弗
不是只统计学家,从未起统计学的角度去考虑其行事之含义。
正态分布(当时为无吃命名也正态分布)
在即时也不过是为极端分布的花样出现,并无以统计学,尤其是误差分析面临发挥作用。这吗即是正态分布最终没有让冠名
棣莫弗分布的第一原由。
那高斯举行了底工作导致统计学家把正态分布之即刻顶桂冠戴在了他的峰上吧?这先得自最小二乘法的腾飞说由。

3. 尽小二趁法,数据解析的瑞士军刀

老二个故事的中流砥柱是欧拉(Leonhard Euler, 1707-1783)、拉普拉斯、勒让德
(Adrien-Marie Legendre, 1752–1833) 和高斯,
故事发生的时是18世纪面临交19世纪初。17、18
世纪是对发展之黄金年代,微积分的腾飞和牛顿万发出引力定律的树,直接的推波助澜了天文学与测地学的迅猛发展。当时底百般科学家等都于考虑多天文学上的题目,几个典型的问题如下:

  • 土星和木星是太阳系中之大行星,由于相互之间吸引对个别的移动轨道产生了震慑,许多不胜数学家,包括欧拉同拉普拉斯还当因长期积聚的天文观测数据测算土星和木星的运转轨道。
  • 逼让德行当了一个内阁让的显要任务,测量通过巴黎底子午线的长。
  • 海上航行经纬度的稳定。主要是经过对恒星和月给及之有一定的考察来确定经纬度。

这些天文学与测地学的题材,无不事关到数的再三测、分析及计算;17、18世纪的天文观测,也累了大量之数量要开展分析和计量。很多年以前,学者等即使既经验性的认为,对于生误差的测数据,多次测取算术平均是比好的拍卖办法。虽然缺少理论及之论据,也不绝于耳的饱受部分丁之质询,取算术平均作为一如既往栽非常直观的艺术,已经让采用了千百年,
在多年攒的数目的拍卖涉中也博得相当程度的说明,被看是平等栽优质的多少处理措施。

如上关联的题目,我们一直关怀的目标量往往心有余而力不足直接观察,但是部分息息相关的计量是可以考察到的,而经过成立数学模型,最终得以解出我们关注的计量。这些题目都好用如下数学模型描述:我们纪念量的量是 β0,⋯,βp,
另发多少个可测量的量 x1,⋯,xp,y,
这些量中有线性关系

y=β0+β1×1+⋯+βpxp

什么样通过多组观测数据求解出参数β0,⋯,βp呢?
欧拉与拉普拉斯应用的之方还是求解如下线性方程组

⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪y1=β0+β1×11+⋯+βpxp1y2=β0+β1×12+⋯+βpxp2⋮yn=β0+β1x1n+⋯+βpxpn.(2)

唯独面临的一个问题是,有 n 组观测数据,p+1 独变量, 如果 n>p+1,
则取的线性矛盾方程组,无法直接求解。
所以欧拉及拉普拉斯下的主意都是由此对数码的定的洞察,把n个线性方程分为 p+1组,然后将每个组内的方程线性求与后由并也一个方程,从而就管n个方程的方程组化为p+1独方程的方程组,进一步解方程求解参数。这些方式新看起局部道理,但是都过度经验化,
无法形成统一处理就无异看似题目之通用解决框架。

 

如上求解线性矛盾方程的题目在本底本科生看来都无困难,这就算是统计学着之线性回归问题,直接用最好小二就法虽迎刃而解了。可是就要欧拉、拉普拉斯这些数学大牛,当时为未能对这些问题提出可行的解决方案。可见在是研究中,要想当价值观上具备突破并无便于。有效之极致小二乘法是逼让德行在
1805 年刊的,基本考虑便是道测量中生出误差,所以有方程的聚积误差为

攒误差 = ∑( 观测值 –
理论值 )2

咱求解出招累积误差最小的参数

β^==argminβ∑i=1ne2iargminβ∑i=1n[yi−(β0+β1x1i+⋯+βpxpi)]2.(3)

 

图片 8

勒让德

逼让德行在论文被针对顶小二乘法的优良性做了几乎沾说明:

  1. 尽小二乘法使得误差平方和极端小,并于逐个方程的误差之间建立了同等种植平衡,从而防范有一个顶误差取得支配地位;
  2. 算着单要求偏导后求解线性方程组,计算过程不言而喻便捷;
  3. 极致小二趁法可以导出算术平均值作为估计值。

于最后一点,推理如下:假设真值为 θ, x1,⋯,xn为n次测量值, 每次测量的误差为ei=xi–θ,按最小二乘法,误差累积为

L(θ)=∑i=1ne2i=∑i=1n(xi–θ)2

求解θ 使得 L(θ)达到最小,正好是算术平均 x¯=∑ni=1xin。

 

出于算术平均是一个历经考验之主意,而以上的推理说明,算术平均是极度小二乘法的一个特例,所以从任何一个角度说明了无限小二乘法的优良性,使我们针对最小二乘法更加有信念。

极致小二趁法发表以后迅速得到了豪门之确认接受,并火速的当数码解析实践备受受周边采用。不过历史上还要有人把极小二乘法的申归功给高斯,这同时是怎一磨事吧。高斯于1809
年呢上了无以复加小二就法,并且声明自己已经使用这方法多年。高斯发明了小行星定位的数学方法,并以数据解析面临应用最小二趁法进行计算,准确之预计了谷神星的岗位。

闲聊了大体上上无限小二趁法,没来看和正态分布有其它关系啊,离题了咔嚓?单就最小二乘机法自,虽然十分实用,不过看上去还多之终究一个代数方法,虽然可推导出极其优解,对于解除的误差有多分外,无法让来有效之辨析,而者就是是正态分布粉墨登场发挥作用的地方。勒让德行提出的极致小二趁法,确实是平将于数解析世界披荆斩棘的好刀,但是刀刃还是勿敷锋利;而就将刀的制新兴起码一半佳绩被归到高斯,是以高斯不但独自的受来了造刀的不二法门,而且把最好小二乘机这把刀子的刀刃磨得无比锋利,把极小二随着法于招了扳平把瑞士军刀。高斯进行了最好小二乘法,把正态分布与最好小二就法关系在联合,并叫正态分布于统计误差分析着树立了团结之位置,否则正态分布就无见面让称之为高斯分布了。
那高斯这号神人是如何把正态分布引入到误差分析中,打造最小二乘机法即将瑞士军刀的吧?

4. 众里找找她千百度过,误差分布曲线的成立

老三独故事发生硌长,主角是高斯及拉普拉斯,故事的要内容是寻找随机误差分布之原理。

天文学是首先单让测量误差困扰的科目,从远古届18世纪天文学一直是动数学最强盛之世界,到18世纪,天文学的进步积聚了汪洋底天文学数据要分析计算,应该什么来处理多少中之观误差成为一个大伤脑筋的题材。我们于数额处理着时下平均的常识性法则,千百来来的数量采取更证明算术平均能够清除误差,提高精度。算术平均有这么的魅力,道理何在,之前从未丁做了理论及的求证。算术平均的客体问题在天文学的多寡解析工作受到给取出来讨论:测量中之随机误差应该从怎样的概率分布?算术平均的优良性和误差的分布有哪的有心人沟通?

伽利略在他有名的《关于个别只至关重要世界系统的对话》中,对误差的布做过部分恒心的叙说,主要包括:

  1. 考察数据是误差
  2. 误差是本着如分布的;
  3. 好的误差出现频率低,小的误差出现频率高。

于是数学之言语描述,也就是说误差分布的密度函数 f(x) 关于0对如分布,概率密度随 |x| 增加而减弱多少,这片单气的叙说都蛮适合常识。

许多天文学家和数学家开始了找误差分布曲线的品。 天文学家辛普森(Thomas
Simpson, 1710-1761) 先走有了出含义之均等步。设真值为 θ, x1,⋯,xn 为n次测量值,
每次测量的误差为ei=xi–θ,若用算术平均 x¯=∑ni=1xin去估计θ, 其误差为 e¯=∑ni=1ein。
辛普森证明了,
对于如下的一个概率分布,

图片 9

辛普森的误差分布曲线

来如下结论

P(|e¯|<x)≥P(|ei|<x).

也就是说,|e¯| 相比于|ei|取小值的会再度可怜。
辛普森的之工作不行粗,但是及时是首先潮在一个一定情景下,从概率论的角度严格证明了算术平均的优良性。

 

自打 1772-1774 年,
拉普拉斯也投入到了探寻误差分布密度函数的武力遭到。拉普拉斯如果误差分布密度函数f(x)对如还满足

−f′(x)=mf(x)

经过而求得分布密度函数为

f(x)=m2e−m|x|.(4)

是概率密度函数现在吃称拉普拉斯遍布。

 

图片 10

 

拉普拉斯底误差分布曲线

坐该函数作为误差分布,拉普拉斯始发考虑如何根据测量的结果失估计未知参数的价。拉普拉斯好算一个贝叶斯主义者,他的参数估计的规格及当代贝叶斯方法好相像:假设先验分布是都匀的,计算起参数的后验分布后,取后验分布的中值点,即1/2分开位点,作为参数估计值。可是根据这误差分布密度函数做了有计算后,拉普拉斯意识计算过于复杂,最终没有能于闹什么使得之结果。

拉普拉斯不过概率论的大牛,写过当概率发展历史遭遇最为生影响力的《分析概率论》,不过盖自家之数学审美,实在无法了解拉普拉斯这样的牛人怎么摸了一个零点不可导的函数作为误差的遍布密度函数,拉普拉斯最终或无能够来定误差分布的题目。

兹轮到高斯登场了,高斯在数学史中之位置最为高,年轻的时候号称数学王子,后来让名数学家中的总狐狸,数学家阿贝尔
(Niels Henrik Abel, 1802-1829) 对他的评头品足是
:“高斯像相同才狐狸,用尾巴将沙地上的足迹抹去(He is like the fox, who
effaces his tracks in the sand with his tail) 。”
我们的数学大师陈省身把黎曼(Georg Friedrich Bernhard Riemann,1826-1866)
和庞加莱(Jules Henri Poincaré,
1854-1912)称为数学家中的神灵,而称好呢罗汉;高斯是黎曼的师资,数学圈里有些教学把高斯称为数学家中之佛。
在数学家中既能够想理论数学之星空,又能脚踏应用数学的可靠的可是免多呈现,高斯是数学家中鲜见的届”天“立”地“的人,它既对纯粹理论数学有深厚的洞察力,又最重视数学在实践中的应用。
在误差分布的拍卖面临,高斯以极简约的招数确立了随机误差的概率分布,其结果变成数理统计发展史上之一律块里程碑。

高斯的参与首先使打天文学界的一个事变说自。1801年1月,天文学家朱塞普·皮亚齐
(Giuseppe Piazzi,
1746-1826)发现了扳平发从未见过的灯光8顶的星球在运动,这粒现在吃称呼谷神星(Ceres)的小行星在夜空被起6个星期天,扫了八渡过角后即在阳光的光明下并未了踪影,无法观。而留的洞察数据有限,难以计算起他的轨道,天文学家也因此无法确定这粒新星是彗星还是行星,这个题目迅速成为了教育界关心之症结。高斯这一度是雅有名望的后生数学家了,这个题目引了他的志趣。高斯以其独立之数学才会创了一样种崭新的行星轨道的盘算方式,一个时内就计产生了谷神星的守则,并预言了外以夜空被起的流年及职位。
1801年12月31 日夜,德国天文发烧友奥伯斯(Heinrich Olbers,
1758-1840),在高斯预言的日里,用望远镜对了马上片天空。果然不生所预期,谷神星出现了!

高斯也这名大震,但是高斯这驳回披露计算轨道的法门,原因可能是高斯看自己之方的答辩基础还不够成熟,而高斯从治学严谨、精益求精,不擅自发表没有思考成熟的论战。直到1809年高斯系统地全面了连带的数学理论后,才将他的艺术公布于众,而内部使用的数量分析方法,就是盖正态误差分布也底蕴之不过小二乘法。那高斯是什么演绎出误差分布也正态分布的?让咱们看看高斯是哪猜测上帝之打算的。

设若真值为 θ, x1,⋯,xn为n次独立测量值, 每次测量的误差为ei=xi–θ,假要误差ei的密度函数为 f(e),
则测量值的联手概率也n个误差的联名概率,记否

L(θ)=L(θ;x1,⋯,xn)=f(e1)⋯f(en)=f(x1−θ)⋯f(xn−θ)

可高斯不利用贝叶斯的演绎方式,而是径直取使L(θ)达到极致老价值的 θ^=θ^(x1,⋯,xn) 作为θ的估量价值,即

θ^=argmaxθL(θ).

现今我们把L(θ) 称为样本的似然函数,而获得的估计值θ^ 称为巨似然估计。高斯首不好吃闹了偌大似然的合计,这个考虑后来于统计学家费希尔系统的升华成为参数估计中的特大似然估计理论。

 

数学家波利亚(George Pólya,
1887-1985)说了:“要变成一个吓的数学家,……,你得首先是一个好之猜想家(To
be a good mathematician,…, you must be a good
guesser)。”历史上顶级的数学家都是宏伟之猜想家。高斯接下去的想法特别牛,他起想上帝之企图,而当时充分体现了高斯的数学天才。高斯将全路问题之想模式倒过来:既然千百年来大家还当算术平均是一个好之估量,那自己就认为大似然估计导出的尽管相应是算术平均!所以高斯猜测上帝在开立世纪面临之圣旨就是:

误差分布导出的高大似然估计 = 算术平均值

然后高斯去搜寻误差密度函数 f 以迎合这或多或少。即找这样的概率分布密度函数 f, 使得极大似然估计正是算术平均 θ^=x¯。而高斯用数学技巧求解这个函数f,
高斯证明(证明不碍事,后续给闹),所有的概率密度函数中,唯一满足这个特性的便是

f(x)=12π−−√σe−x22σ2

瞧,正态分布的密度函数 N(0,σ2) 被高斯他老人家为消除出来了!

 

更进一步,高斯因这误差分布之密度函数对最小二趁法让有了一个老可观的分解。对于极端小二乘机公式中提到的每个误差 ei,
由于误差服从概率分布 N(0,σ2),
则(e1,⋯,en) 的概率为

1(2π−−√σ)nexp{−12σ2∑i=1ne2i}.

苟叫这概率最充分,必须使∑ni=1e2i 取最小值,这恰就是极小二乘法的渴求。

 

高斯所拓展的最小二乘机法变成了19世纪统计学的极关键成就,它以19世纪统计学的要紧就相当给18世纪的微积分之于数学。而逼让德行同高斯的有关最小二乘法的发明权之如何,成了数学史上仅次于牛顿、莱布尼茨微积分发明权的裂痕。相比于勒让德行1805年给闹的不过小二乘法描述,高斯基给误差正态分布的无限小二乘机理论显然更高一筹,高斯的办事受到既提出了高大似然估计的构思,又缓解了误差的概率密度分布的题材,由此我们好对误差大小的震慑进行统计度量了。高斯的这项工作对子孙后代的熏陶巨大,而正态分布为用深受冠名高斯分布。估计高斯本人就凡是一点一滴没发现及外的这工作让当代数理统计学带来的深刻影响。高斯以数学及之贡献就多,去世前他是求于好之墓碑及刻上正十七限形,以证他在刚十七度形尺规作图上之出类拔萃工作。而后人的德国票和钢镚上是以正态密度曲线来怀念高斯,这好验证高斯的这项工作以现世对进步遭遇的重量。

17、18世纪科学界流行的做法,是竭尽从某种简单明了的规则(first
principle)出发进行逻辑推导。高斯设定了律“最要命似然估计该导出优良的算术平均”,并导出了误差服从正态分布,推导的款型达到深简单优美。但是高斯为的清规戒律在逻辑上连不足以让人统统信服,因为算术平均的优良性当时再次多的凡一个历直觉,缺乏严格的反驳支撑。高斯的推理存在循环论证的含意:因为算术平均是名不虚传的,推出误差必须从正态分布;反过来,又冲正态分布推导出尽小二乘法和算术平均,来说明最小二乘法和算术平均的优良性。这陷入了一个鸡生蛋蛋生鸡的怪圈,逻辑上算术平均的优良性到底有没有出活动建立之说辞也?

高斯的稿子见报下,拉普拉斯飞速意识到了高斯的行事。拉普拉斯见到,正态分布既可以打抛钢镚产生的行及中生成出来,又可为优雅的当误差分布定律,这难道是偶然现象?拉普拉斯当之无愧概率论的大牛,他这将误差的正态分布理论和主导极限定理联系起,提出了第一误差解释。他指出要误差可以看做许多微小量的附加,则因他的着力极限定理,随机误差理所应当是高斯分布。而20世纪中心极限定理的进一步发展,也叫这解释提供了再多之申辩支撑。因此为之解释吗出发点,高斯的循环论证的天地就是可以打破。
估计拉普拉斯悟出这个结论之后自然想遇到墙,自己辛辛苦苦寻寻觅觅了这样绵长的误差分布曲线就于自己之眼皮底下,自己却长年视而不见,被高斯占了先机。

从那之后,误差分布曲线之物色尘埃落定,正态分布于误差分析中成立了投机之位置,并当整整19世纪不断的开疆扩土,直至以统计学着鹤立鸡群,傲世其它一切概率分布;而高斯和拉普拉斯底干活,为当代统计学的升华被了同等扇大门。

以漫天正态分布为发觉及祭之史中,棣莫弗、拉普拉斯、高斯各发生贡献,拉普拉斯自中心极限定理的角度讲其,高斯把它用在误差分析面临,殊途同归。正态分布为众人发现发生这般好之习性,各国国民都安快她的冠名权。因为拉普拉斯凡法国口,所以马上于法国叫称拉普拉斯布;而高斯是德国总人口,
所以在德国称为高斯分布;第三遭受立国的老百姓称他呢拉普拉斯-高斯分布。后来法国底挺数学家庞加莱建议改用正态分布就等同中立名称,
而随后统计学家卡尔·皮尔森使得这个称谓叫广大接受:

Many years ago I called the Laplace-Gaussian curve the normal curve,
which name, while it avoids an international question of priority, has
the disadvantage of leading people to believe that all other
distributions of frequency are in one sense or another “abnormal”.

* —Karl Pearson (1920) *

只是因高斯于数学家中之声名实在是无比好,
正态分布之殊荣还是重新多地于戴在了高斯的额上,目前数学界通行的用语是正态分布、高斯分布,
两者并用。

正态分布于高斯的递进下,迅速于测量误差分析着于广泛采取,然而早期为单独限于测量误差的剖析中,其首要性远没有受自然科学与社会对领域受到的师等所认识,那正态分布是哪些自测量误差分析的溪,冲向自然科学及社会是的海洋的吗?

5. 曲径通幽处,禅房花木深

以介绍正态分布的接轨发展之前,我们来基本上讲一点数学,也许有些人见面以为没意思,不过高斯已说罢:“数学是上帝之言语”;所以一旦惦记愈刻骨铭心的明正态分布之美,唯有靠上帝的语言。

天公造物的则往往是简单明了的,只是当千头万绪冗杂的万物之中,我们若发现并领会它并非易事。之前涉嫌过,17、18世纪科学界流行的做法,是拼命三郎从某种简单明了的守则出发作为科学探求的起点;而后来的数学家和物理学家们的钻研发现,屡次从局部加以的简短的轨道出发,
我们连让唤起领到了正态分布的家门口,这吃丁感觉到正态分布之上佳。

达尔文的表弟高尔顿是生物学家兼统计学家,他本着正态分布异常之推崇与颂:”我几乎没见了像误差呈正态分布这么激发人们无限想象的大自然秩序“。当代点滴号英雄的几率学家列维(Paul
Pierre Lévy, 1886-1971) 和卡克(Mark Kac, 1914-1984)
都曾经说过,正态分布是他们切入概率论的初恋情人,具有无穷的魅力。如果古希腊总人口知晓正态分布,想必奥林匹斯山的神殿里会多生一个正态女神,由其来主持世间的愚昧。

假如关下正态分布的秘密面纱展现它底好看,需要高深的概率论知识,本人以数学方面知识浅薄,不能够独当一面。只能以极为有限的限量外尝试掀开她底面纱的犄角。棣莫弗和拉普拉斯因为废钢镚的序列求和也着眼点,沿着一久小路第一破把咱领到了正态分布之家门口,这长长的路名中心极限定理。而这漫长路上风景秀丽,许多概率学家都也之倾倒。这条路以二十世纪被概率学家们进一步拓越红火,成为了为正态曲线的一致条康庄大道。而数学家和物理学家们发现:条长达小路通正态。著名的物理学家杰恩斯(Edwin
Thompson Jaynes, 1922-1998) 在他的杰作《概率仍沉思录(Probability Theory:
the Logic of
Science)》中,描绘了季漫长为正态分布之羊肠小道;曲径通幽处,禅房花木深,让我们一起来赏一下及时四条羊肠小道上之色吧。

5.1 高斯(1809)的推导

先是长达羊肠小道是高斯找到的,高斯为如下准则作为小径的落脚点

误差分布导出的大幅度似然估计 = 算术平均值

万一真值为 θ, x1,⋯,xn为n次独立测量值,
每次测量的误差为ei=xi–θ,假要误差ei的密度函数为 f(e),
则测量值的一块概率也n个误差的联手概率,记否

L(θ)=L(θ;x1,⋯,xn)=f(e1)⋯f(en)=f(x1−θ)⋯f(xn−θ)

为呼吁大似然估计,令

dlogL(θ)dθ=0

重整后可以博得

∑i=1nf′(xi−θ)f(xi−θ)=0

令 g(x)=f′(x)f(x),

∑i=1ng(xi−θ)=0

鉴于高斯假设极大似然估计的解就是算术平均 x¯,把解代抱上式,可以得

∑i=1ng(xi−x¯)=0 (1)(5)

(1)式中取 n=2, 有

g(x1−x¯)+g(x2−x¯)=0

由于这有 x1−x¯=−(x2−x¯),
并且 x1,x2 是随机的,由此取得

g(−x)=−g(x)

(1)式受更取 n=m+1,
并且要求 x1=⋯=xm=−x,xm+1=mx,
则有 x¯=0,
并且

∑i=1ng(xi−x¯)=mg(−x)+g(mx)

故得到

g(mx)=mg(x)

假使满足上式的绝无仅有的接连函数就是 g(x)=cx,
从而进一步可以求解出

f(x)=Mecx2

是因为f(x)是概率密度函数,把f(x) 正规化一下就算获得均值为0的正态分布密度函数
N(0,σ2)。

 

5.2 赫歇尔(1850)和麦克斯韦(1860) 的推理

其次久羊肠小道是天文学家赫歇尔(John Frederick William Herschel,
1792-1871)和物理学家麦克斯韦(James Clerk Maxwell, 1831-1879) 发现的。
1850年,天文学家赫歇尔于针对少的位置展开测量的时刻,需要考虑二维的误差分布,为了推导这个误差的概率密度分布
p(x,y),赫歇尔设置了少单准则:

  1. x 轴和 y 轴的误差是相互独立的,即随机误差在正交的大方向及竞相独立
  2. 误差的概率分布在上空达到有所旋转对称性,即误差的概率分布和角度没涉及

及时简单单准则对于赫歇尔考虑的莫过于测量问题看起都不行有理。由第一漫漫轨道,可以博 p(x,y) 应该享有如下形式

p(x,y)=f(x)∗f(y)

将此函数转换为最坐标,在太坐标下的概率密度函数设为 g(r,θ),

p(x,y)=p(rcosθ,rsinθ)=g(r,θ)

是因为第二条轨道, g(r,θ) 具有旋转对称性,也不怕是理所应当跟 θ 无关, 所以 g(r,θ)=g(r),
综上所述,我们可以取得

f(x)f(y)=g(r)=g(x2+y2−−−−−−√)

取 y=0, 得到 g(x)=f(x)f(0),
所以上式可以变换为

log[f(x)f(0)]+log[f(y)f(0)]=log[f(x2+y2−−−−−−√)f(0)]

令 log[f(x)f(0)]=h(x),
则有

h(x)+h(y)=h(x2+y2−−−−−−√)

从今之函数方程中好解出 h(x)=ax2,
从而可以取 f(x) 的貌似式如下

f(x)=απ−−√e−αx2

要是 f(x) 就是正态分布 N(0,1/2α)−−−√,
从而 p(x,y) 就是业内二维正态
分布的密度函数

p(x,y)=απe−α(x2+y2).

 

1860
年,伟大之物理学家麦克斯韦于考虑气体分子的活动速度分布的时节,在三维空间受到冲类似的轨道推导出了气分子运动的遍布是正态分布 ρ(vx,vy,vz)∝exp{−α(v2x+v2y+v2z)}。这即是有名的麦克斯韦分子速率分布定律。大家还记得我们以平凡物理中学过的麦克斯韦-波尔兹曼气体速率分布定律也?

F(v)==(m2πkT)3/2e−mv22kT(m2πkT)1/2e−mv2x2kT×(m2πkT)1/2e−mv2y2kT×(m2πkT)1/2e−mv2z2kT.(6)

之所以这分布其实是三只正态分布的乘积,
你的物理老师是否报过您其实这个分布就是三维正态分布?

 

赫歇尔-麦克斯韦推导的神秘之处在当给,没有使用其他概率论的知,只是根据空间几乎哪的不变性,就推导出了正态分布。美国诺贝尔奖物理学家费曼(Richard
Feymann,1918-1988) 每次见到一个来 π的数学公式的下,就会见咨询:圆在何?这个推导中应用及了 x2+y2,
也不怕是喻我们正态分布密度公式中来只π,
其来自在二维正态分布着的对等高线恰好是独到。

5.3 兰登(1941)的推导

老三漫长道是千篇一律各类电气工程师兰登(Vernon D. Landon)给出之。1941 年,
兰登研究通信电路中的噪音电压,通过分析涉数据外意识噪声电压的分布模式很相像,不同的凡遍布之层级,而以此层级可以动用方差 σ2 来描写。因此他演绎认为噪声电压的遍布密度函数形式是 p(x;σ2)。假设原来的电压啊X,
累加了一个相对其方差 σ而言非常轻微的误差扰动 ϵ, ϵ 的概率密度是 q(e),
那么新的噪音电压是 X′=X+ϵ。
兰登提出了之类的清规戒律

  1. 随机噪声具有稳定的分布模式
  2. 增长一个微小的随机噪声,不转移其安静之分布模式,只变动分布之层级(用方差度量)

于是数学之言语叙述: 如果

X∼p(x;σ2),ϵ∼q(e),X′=X+ϵ

 则有

X′∼p(x;σ2+var(ϵ))

 

今昔咱们来演绎函数p(x;σ2) 应该长成啥样。按照有限只随机变量和之遍布的精打细算方式, X′ 的分布密度函数将是 X 的布密度函数和 ϵ的布密度函数的卷积,即产生

f(x′)=∫p(x′−e;σ2)q(e)de

拿 p(x′−e;σ2) 在x′处做泰勒级数展开(为了便利,展开后把自变量由 x′ 替换为 x), 上式可以展开也

f(x)=p(x;σ2)–∂p(x;σ2)∂x∫eq(e)de+12∂2p(x;σ2)∂x2∫e2q(e)de+⋯

将p(x;σ2)简记为p,则有

f(x)=p–∂p∂xϵ¯+12∂2p∂x2ϵ2¯¯¯+o(ϵ2¯¯¯)

 

对一线的任意扰动 ϵ,
我们以为他得到正值或者负值是本着如之,所以 ϵ¯=0。所以发生

f(x)=p+12∂2p∂x2ϵ2¯¯¯+o(ϵ2¯¯¯)(2)(7)

 

对于新的噪音电压 X′=X+ϵ,
方差由σ2 增加为 σ2+var(ϵ)=σ2+ϵ2¯¯¯,所以照兰登的遍布密度函数模式不更换的设,
新的噪声电压的布密度函数应该也 f(x)=p(x;σ2+ϵ2¯¯¯)。把p(x;σ2+ϵ2¯¯¯) 在 σ2 处做泰勒级数展开,得到

f(x)=p+∂p∂σ2ϵ2¯¯¯+o(ϵ2¯¯¯) (3)(8)

较 (2) 和 (3) 这简单个相,可以落如下偏微分方程

12∂2p∂x2=∂p∂σ2

假定之方程就是物理上赫赫有名的扩散方程(diffusion
equation),求解该方程就取得

p(x;σ2)=12π−−√σe−x22σ2

而且同样涂鸦,我们推导出了正态分布!

 

杰恩斯于这推导的评价大高,认为兰登
的推理本质上吃起了宇宙空间的噪声形成经过。他指出此推导就差不多就是是骨干极限定理的增量式版本,相比叫中心极限定理是一次性增长所有的要素,兰登
的演绎是每次在本来的分布上累加一个微薄的骚动。而在斯推导中,我们看到,正态分布有一定好之风平浪静;只要数据中正态的模式都形成,他即易累保持正态分布,无论外部累加的随机噪声 q(e) 是啊分布,正态分布就像一个黑洞一样拿这个累加噪声吃少。

5.4 基于最可怜熵的演绎

还有同久小路是根据最特别熵原理的,
物理学家杰恩斯于绝充分熵原理上发坏关键之孝敬,他在《概率仍沉思录》里面对这个法子有描述和说明,没有关系发现者,我未肯定这条道的发现者是否是杰恩斯本人。

熵在物理学中长远,信息论的元老香农(Claude Elwood Shannon,
1916-2001)把这个概念引入了信息论,学习机器上之同学等都清楚目前机械上中生出一个百般好用的归类算法为最可怜熵分类器。要惦记拿熵和极其老熵的前因后果说清楚不过免易于,不过就条道的景观是一对一出格之,杰恩斯对立即条道为是宠爱有加。

对于一个概率分布 p(x),
我们定义他的熵为

H(p)=−∫p(x)logp(x)dx

 

苟叫得一个分布密度函数 p(x) 的均值 μ 和方差 σ2(给定均值和方差这个规则,也堪描述为叫得一级原点矩和二阶原点矩,这点儿独条件是相等价格的),
则在具有满足这有限只限的概率分布中,熵最要命的概率分布 p(x|μ,σ2) 就是正态分布 N(μ,σ2)。

斯结论的推理数学上多少有接触复杂,不过假如已蒙到了加限制条件下最深熵的分布是正态分布,要证实这猜测却是老粗略的,证明的思路如下。

设想少个概率分布 p(x)和q(x),使用不等式 logx≤(x−1),

∫p(x)logq(x)p(x)dx≤∫p(x)(q(x)p(x)–1)dx=∫q(x)dx–∫p(x)dx=0

于是

∫p(x)logq(x)p(x)dx=∫p(x)log1p(x)dx+∫p(x)logq(x)dx≤0

所以

H(p)≤−∫p(x)logq(x)dx(9)

深谙信息论的同班还掌握,这个姿势是信息论中之良知名的结论:一个概率分布的熵总是小于相对熵。上式要取得等号当且仅当q(x)=p(x)。

 

对 p(x),
在给定的均值 μ 和方差 σ2产, 我们取q(x)=N(μ,σ2),
则可以赢得

H(p)≤==–∫p(x)log{12π−−√σe−(x−μ)22σ2}dx∫p(x){(x−μ)22σ2+log2π−−√σ}dx12σ2∫p(x)(x−μ)2dx+log2π−−√σ(10)

出于 p(x) 的全值方差出如下限制

∫p(x)(x−μ)2dx=σ2

于是

H(p)≤12σ2σ2+log2π−−√σ=12+log2π−−√σ

要是当p(x)=N(μ,σ2)的时刻,上式可以取到等号,这即印证了定论。
杰恩斯显然对正态分布有如此的特性极为赞赏,因为就由信息论的角度证明了正态分布之优良性。而我们可以看,正态分布熵的尺寸,取决于方差的尺寸。
这吗易懂,
因为正态分布之均值和密度函数的样无关,正态分布的状是出于该方差决定的,而熵的轻重缓急反应概率分布中的信息量,显然跟密度函数的象有关。

 

好之,风景欣赏暂时告一段落。所谓“横看成岭侧成峰,远近高低各不同”,正态分布于人们提供了多种玩角度和想象空间。法国神道级别之酷数学家庞加莱对正态分布说罢相同段有意思的言语,引用来当这小节的利落:

Physicists believe that the Gaussian law has been proved in mathematics
while mathematicians think that it was experimentally established in
physics. 
(物理学家认为高斯分布已经在数学上取得证实,而数学家则以为高斯分布在大体试验中赢得认可。)

— Henri Poincaré

 

正态分布的前世今生(上)