热线电话:13121318867

登录
首页精彩阅读数据挖掘中所需的概率论 高斯的推导(七)数据分析师
数据挖掘中所需的概率论 高斯的推导(七)数据分析师
2014-11-29
收藏

数据挖掘中所需的概率论 高斯的推导(七)数据分析师

论道正态,正态分布的4大数学推导

    如本blog内之前所说:凡是涉及到要证明的东西.理论,便一般不是怎么好惹的东西。绝大部分时候,看懂一个东西不难,但证明一个东西则需要点数学功底,进一步,证明一个东西也不是特别难,难的是从零开始发明创造这个东西的时候,则更显艰难(因为任何时代,大部分人的研究所得都不过是基于前人的研究成果,前人所做的是开创性工作,而这往往是最艰难最有价值的,他们被称为真正的先驱。牛顿也曾说过,他不过是站在巨人的肩上。你,我则更是如此)。
     上述第4节已经介绍了正态分布的历史由来,但尚未涉及数学推导或证明,下面,参考概率论沉思录,引用“正态分布的前世今生”等相关内容,介绍推导正太分布的4种方法,曲径通幽,4条小径,殊途同归,进一步领略正态分布的美妙。
    「注:本节主要整编自rickjin写的"正态分布的前后今生"系列

5.1、 高斯的推导(1809)

    第一条小径是高斯找到的,高斯以如下准则作为小径的出发点
误差分布导出的极大似然估计 = 算术平均值
    设真值为,而次独立测量值,每次测量的误差为,假设误差的密度函数为,则测量值的联合概率为n个误差的联合概率,记为
    为求极大似然估计,令
    整理后可以得到
    令,由上式可以得到
    由于高斯假设极大似然估计的解就是算术平均,把解带入上式,可以得到
    在上式中取,有
    由于此时有,并且是任意的,由此得到:.再在(6)式中取,并且要求,且,则有,并且
    所以得到而满足上式的唯一的连续函数就是,从而进一步可以求解出
    由于是概率分布函数,把正规化一下就得到正态分布密度函数

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询