imtoken钱包官网版最新|高斯分布

作者: imtoken钱包官网版最新
2024-03-08 00:07:38

正态分布_百度百科

_百度百科 网页新闻贴吧知道网盘图片视频地图文库资讯采购百科百度首页登录注册进入词条全站搜索帮助首页秒懂百科特色百科知识专题加入百科百科团队权威合作下载百科APP个人中心正态分布播报讨论上传视频数学术语收藏查看我的收藏0有用+10本词条由“科普中国”科学百科词条编写与应用工作项目 审核 。正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。中文名正态分布外文名Normal Distribution适用领域概率论所属学科数学别    名高斯分布发现者棣莫弗(Abraham de Moivre)目录1历史发展2定理3定义▪一维正态分布▪标准正态分布4性质5分布曲线▪图形特征▪参数含义▪面积分布6研究过程7曲线应用▪综述▪频数分布▪综合素质研究▪医学参考值历史发展播报编辑正态分布概念是由法国数学家棣莫弗(Abraham de Moivre)于1733年首次提出的,后由德国数学家Gauss率先将其应用于天文学研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。 [1]但德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按棣莫弗的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性) 为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。定理播报编辑由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。为了便于描述和应用,常将正态变量作数据转换。将一般正态分布转化成标准正态分布。 [2]若服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。(标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。)定义播报编辑一维正态分布若随机变量 服从一个位置参数为 、尺度参数为 的概率分布,且其概率密度函数为 [3]则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作 ,读作 服从 ,或 服从正态分布。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。本词条的正态分布是一维正态分布,此外多维正态分布参见“二维正态分布”。标准正态分布当 时,正态分布就成为标准正态分布性质播报编辑正态分布的一些性质: [3](1)如果 且a与b是实数,那么 (参见期望值和方差)。(2)如果 与 是统计独立的正态随机变量,那么:它们的和也满足正态分布它们的差也满足正态分布U与V两者是相互独立的。(要求X与Y的方差相等)。(3)如果和是独立正态随机变量,那么:它们的积XY服从概率密度函数为p的分布其中是修正贝塞尔函数(modified Bessel function)它们的比符合柯西分布,满足(4)如果为独立标准正态随机变量,那么服从自由度为n的卡方分布。分布曲线播报编辑图形特征集中性:正态曲线的高峰位于正中央,即均数所在的位置。对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。参数含义正态分布有两个参数,即期望(均数)μ和标准差σ,σ2为方差。正态分布具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ2)。μ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小。正态分布以X=μ为对称轴,左右完全对称。正态分布的期望、均数、中位数、众数相同,均等于μ。σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。面积分布正态函数的不定积分是一个非初等函数,称为误差函数。实际上误差函数的导数是:将正态函数换元,误差函数和“正态函数的积分”的关系是:1、实际工作中,正态曲线下横轴上一定区间的面积(误差函数上下限之差)反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。2、正态曲线下,要取到50%概率,横轴半区间长度为0.67448975σ(该值无法用初等方法求解,是由迭代法取得的近似值。)横轴区间(μ-σ,μ+σ)内的面积为68.268949%。横轴区间(μ-2σ,μ+2σ)内的面积为95.449974%。横轴区间(μ-3σ,μ+3σ)内的面积为99.730020%。“小概率事件”和假设检验的基本思想: “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。由此可见X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件不会发生,基本上可以把区间(μ-3σ,μ+3σ)看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。而对于产量更大,试验次数更多的大规模流水线产品,要达到“万无一失”(99.99%)就要取到4σ(99.9936%),而要达到更高的水平,则需要取5σ~6σ长度的半区间,此时误差大约是0.6ppm~0.002ppm,这是工业生产中提出的“六西格玛(6σ)”原则(管理学书籍中提及的六西格玛原则的要求是3.4ppm,这个概率值所对的分布大约在半区间长度4.5σ,这是考虑到系统误差造成的均值偏移μ=1.5σ的情况)。研究过程播报编辑概念及特征:一、正态分布的概念由一般分布的频数表资料所绘制的直方图,图⑴可以看出,高峰位于中部,左右两侧大致对称。我们正态分布研究图1设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图⑶。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。为了应用方便,常对正态分布变量X作变量变换。该变换使原来的正态分布转化为标准正态分布(standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。正态分布研究图2正态分布研究图3实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。图2 正态曲线与标准正态曲线的面积分布正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。正态分布面积图1正态分布面积图2一般正态分布与标准正态分布的区别与联系正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。曲线应用播报编辑综述1、估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。 [4]2、制定参考值范围(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。3、质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。/4、正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。频数分布例1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表3。表3 100名18岁男大学生身高的实际分布与理论分布分布x+-s身高范围(cm)实际分布人数实际分布百分数(%)理论分布(%)X+-1s168.69~176.716767.0068.27X +-1.96s164.84~180.569595.0095.00X+-2.58s162.35~183.059999.0099.00综合素质研究教育统计学统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇。许多教育专家(如上海顾泠沅、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适。医学参考值某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:(1)正态分布法:适用于正态或近似正态分布的资料。双侧界值:X+-u(u)S单侧上界:X+u(u)S,或单侧下界:X-u(u)S(2)对数正态分布法:适用于对数正态分布资料。双侧界值:lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。常用u值可根据要求由表4查出。(3)百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。表4常用u值表参考值范围(%)单侧双侧800.8421.282901.2821.645951.6451.960992.3262.576统计的理论基础:如t分布、F分布、分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。概率论中最重要的分布正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。主要内涵在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓住其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下:整体论正态分布启示我们,要用整体的观点来看事物。“系统的整体观念或总体观念是系统概念的精髓。” 正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变态的事物,不是真实的事物本身。重点论正态分布曲线及面积分布图非常清晰的展示了重点,那就是基区占68.27%,是主体,要重点抓,此外95%,99%则展示了正态的全面性。认识世界和改造世界一定要抓住重点,因为重点就是事物的主要矛盾,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结合20/80法则,我们更可以大胆的把正区也可以看做是重点。发展论联系和发展是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常态,变异是非常态。总之,正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。弗朗西斯·高尔顿 [Francis Galton 1822.02.16-1911.01.17],英国探险家、优生学家、心理学家,差异心理学之父,也是心理测量学上生理计量法的创始人。高尔顿对心理学的贡献,大概可以归纳未差异心理学、心理测量的量化和实验心理学三方面:心理学研究之量化,始自高尔顿。他发明了许多感官和运动的测试,并以数量代表所测得的心理特质之差异。他认为人的所有特质,不管是物质的还是精神的,最终都可以定量叙述,这是实现人类科学的必要条件,故最先应用统计法处理心理学研究资料,重视数据的平均数与高中差数。他收集了大量资料证明人的心理特质在人口中的分布如同身高、体重那样符合正态分布曲线。他在论及遗传对个体差异的影响时,为相关系数的概念作了初步提示。如他研究了“居间亲”和其成年子女的身高关系,发现居间亲和其子女的身高有正相关,即父母的身材较高,其子女的身材也有较高的趋势。反之,父母的身材较低,其子女也有较矮的趋势。同时发现子女的身高常与其父母略有差别,而呈现“回中”趋势,即离开其父母的身高数,而回到一般人身高的平均数。智力、能力理查德·赫恩斯坦 [(Richard J. Herrnstein 1930.05.20-1994.09.13),美国比较心理学家]和默瑞(Charles Murray)合著《正态曲线》一书而闻名,在该书中他们指出人们的智力呈正态分布。智力主要是遗传的并因种族的不同而不同,犹太人、东亚人的智商最高,其次为白人,表现最差的是黑人、西班牙裔人。他们检讨了数十年来心理计量学与政策学的研究成果,发现美国社会轻忽了智商的影响愈变愈大的趋势。他们力图证明,美国现行的偏向于以非洲裔和南美裔为主的低收入阶层的社会政策,如职业培训、大学教育等,完全是在浪费资源。他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和黄种人;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及黑人的智力问题,一经出版便受到来自四面八方的围攻。新手上路成长任务编辑入门编辑规则本人编辑我有疑问内容质疑在线客服官方贴吧意见反馈投诉建议举报不良信息未通过词条申诉投诉侵权信息封禁查询与解封©2024 Baidu 使用百度前必读 | 百科协议 | 隐私政策 | 百度百科合作平台 | 京ICP证030173号 京公网安备110000020000

高斯分布 - 知乎

高斯分布 - 知乎首发于建模控制与机器学习切换模式写文章登录/注册高斯分布养生的控制人​浙江大学 控制科学与工程博士定义高斯分布最简单的形式是一维标准高斯分布,可以由概率密度函数(PDF)表示为p(x)=\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-x^2/2}, 其中, \frac{1}{\sqrt{2\pi}} 用于保证概率密度函数的积分为 1 ,这个分布的中心为 x=0 且衰减率或者说分布的“宽度”为 1 。更加一般地,我们可以通过平移和伸缩得到任意中心 \mu \in \mathbb{R} 和宽度 \sigma > 0 的高斯分布,它的pdf为p(x)=\frac{1}{\sigma}\phi(\frac{x-\mu}{\sigma})=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2}). 通常 \mu 称为均值或者密度的peak、mode, \sigma^2 称为方差。如果一个随机变量 X 服从这一分布,则记作X\sim \mathcal{N}(\mu,\sigma^2). 更进一步地,一个多元随机变量,假设为 d 维列向量 x ,其均值向量 \mu ,协方差均值 \Sigma ,概率分布可以写为p(x|\mu,\Sigma)=\frac{1}{(2\pi)^{d/2}|\Sigma|^{1/2}}exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)), 可以记作 X\sim \mathcal{N}(\mu,\Sigma) 。累积密度函数对于一个一维高斯分布,它的累积密度函数(cdf)定义为\Phi(x)=\int_{-\infty}^{x}\phi(t)dt 高维高斯分布的(cdf)就难以求解了。Entropy and Kullback–Leibler Divergence多元高斯的微分熵为h(p)=-\int_{\mathbb{R}^{d}} p(x) \ln p(x) \mathrm{d} x=\frac{1}{2} \ln \left((2 \pi e)^{d} |\Sigma|\right) 两个高斯分布的KL Divergence为\begin{array}{c} \mathrm{KL}\left(\mathcal{N}\left({\mu}_{1}, \Sigma_{1}\right) \| \mathcal{N}\left({\mu}_{2}, \Sigma_{2}\right)\right)=\frac{1}{2}\left(\ln \frac{\operatorname{det} \Sigma_{2}}{\operatorname{det} \Sigma_{1}}+\operatorname{tr} \Sigma_{2}^{-1} \Sigma_{1}\right. \\ \left.+\left({\mu}_{2}-{\mu}_{1}\right)^{\top} \Sigma_{2}^{-1}\left({\mu}_{2}-{\mu}_{1}\right)-d\right) \end{array} 仿射变换假设 A 是一个线性变换 \mathbb{R}^d\rightarrow\mathbb{R}^s 且 c\in \mathbb{R}^s ,则Ax+c\sim\mathcal{N}(A\mu+c,A\Sigma A^T) 共轭先验在贝叶斯概率理论中,如果后验分布与先验分布在同一族中,则先验和后验称为共轭分布,先验被称为似然函数前的共轭。在已知方差的情况下,均值先验的共轭还是是多元高斯。已知均值,方差矩阵的共轭先验是Wishart分布,而精度矩阵的共轭先验是Gamma分布。参数估计给定 n 个独立同分布的观测点 X_1,...,X_n ,均值和协方差矩阵的极大似然估计为\mu=\bar{X}=\frac{1}{n}\sum_{i=1}^nX_i,\\ \hat{\Sigma}=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})(X_i-\bar{X})^T. 但是一个有偏估计, \mathbb{E}[\hat{\Sigma}]=\frac{n-1}{n}\Sigma ,无偏估计为\hat{\Sigma}=S=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})(X_i-\bar{X})^T. 由高斯分布得出的分布如果 X\sim\mathcal{N}(0,\Sigma) ,则 X^T\Sigma^{-1}X 是Gamma分布 Gamma(d/2,2) 如果 X_1,X_2\sim\mathcal{N}(0,1) 且是独立的,他们的比值为标准柯西分布 Cauchy(0,1) 给定 n 个独立高斯随机变量 X_i \sim \mathcal{N}(0,1) ,则随机变量 Z:=\sqrt{\Sigma_iX_i^2} 为自由度为 n 的 \chi 分布, Z^2 为 \chi^2 分布X_1,...,X_n 的采样均值和采样标准差互相独立,他们的比值为自由度 n-1 的student's t分布。Marginalization, Conditioning假设向量 x 可以写作 (x_1^T,x_2^T)^T ,对应的均值和协方差矩阵为{\mu}=\left(\begin{array}{l} {\mu}_{1} \\ {\mu}_{2} \end{array}\right), \quad \Sigma=\left(\begin{array}{ll} \Sigma_{11} & \Sigma_{12} \\ \Sigma_{21} & \Sigma_{22} \end{array}\right) 则 x_1 的边缘分布为高斯 \mathcal{N}(\mu_1,\Sigma_{11}) ,条件分布为 \mathcal{N}(\mu_{1|2},\Sigma_{1|2}) {\mu}_{1 \mid 2}={\mu}_{1}+\Sigma_{12} \Sigma_{22}^{-1}\left(x_{2}-{\mu}_{2}\right), \quad \Sigma_{1 \mid 2}=\Sigma_{11}-\Sigma_{12} \Sigma_{22}^{-1} \Sigma_{21}. 发布于 2020-07-11 14:21机器学习数学基础贝叶斯概率​赞同 63​​3 条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录建模控制与机器学习科研道路打怪升级,自学成菜

正态分布(高斯分布)学习笔记 - 知乎

正态分布(高斯分布)学习笔记 - 知乎首发于视觉SLAM基础知识及实例演示切换模式写文章登录/注册正态分布(高斯分布)学习笔记鄢立宝低盐值劣质攻城狮1. 正态分布的定义及性质1.1 一维正态分布正态分布(Normal Distribution),也称常态分布,又名高斯分布(Gaussian Distribution),是一个常见的连续概率分布。若随机变量X服从一个数学期望为\mu、方差为\sigma ^{2}的正态分布,则记为X \sim \mathcal{N}(\mu, \sigma^{2})。其概率密度函数为正态分布,期望值\mu决定了其位置,其标准差\sigma决定了分布的幅度。正态分布的概率密度函数曲线呈钟形,因此又称之为钟形曲线(类似于寺庙里的大钟)。当\mu = 0,标准差\sigma = 1时的正态分布是标准正态分布。f(x) = \frac{1}{\sigma\sqrt{2\pi}}exp\left(-\frac{(x - \mu)^{2}}{2\sigma^{2}}\right) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x - \mu)^{2}}{2\sigma^{2}}} \tag{1} 图1:正态(高斯)分布图正态分布的性质:概率密度曲线在均值\mu处达到最大,并且左右对称;一旦均值和标准差确定,那么正态分布的曲线也就确定了;当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,但理论上永远不会与之相交;正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1;均值\mu可取实数轴上的任意数值,它决定了正态概率密度曲线的具体位置;标准差决定了概率密度曲线的“陡峭”或“扁平”程度,标准差越大,曲线越扁平;标准差越小,曲线越陡峭。这是因为,标准差越小,意味着大多数变量距离均值的距离越短,也就是说大多数变量都紧密地聚集在均值周围,图形所能覆盖的变量值就少些,图形上呈现瘦高型。相反,标准差越大,数据跨度就越大,分散程度越大,所覆盖的变量就越多,图形呈现“矮胖型”。1.2 多维正态分布任意高维正态分布x \sim \mathcal{N}(\mu, \Sigma),其中x \in \mathbb{R}^{N},\Sigma为协方差矩阵,它的概率密度函数展开形式为:P(x) = \frac{1}{\sqrt{(2\pi)^{N}\underbrace{det(\Sigma)}_{\Sigma的行列式值}}}exp\left(-\frac{1}{2}(x-\mu)^{T}\Sigma^{-1}(x-\mu)\right) \tag{2} 2. 相关名词解释2.1 数学期望数学期望是每次可能的结果乘以其结果概率的总和。期望与均值:期望与均值是两个十分相近的概念,但又可以说是截然不同。均值往往是在实验中简单的对数据进行平均,而期望就好像在上帝视角的人。举个掷骰子的例子:我们的均值怎么计算呢?显然要掷上一定多的次数来求平均值。比如,掷了6次,分别是1、5、5、6、3、3,那么均值为:\frac{1+5+5+6+3+3}{6} = 3.833333... \\可是期望呢?我们不用掷骰子就能计算出来:E(X) = 1*\frac{1}{6} + 2*\frac{1}{6} + 3*\frac{1}{6} + 4*\frac{1}{6} + 5*\frac{1}{6} + 6*\frac{1}{6} = \frac{1+2+3+4+5+6}{6} = 3.5 \\可以看出,两个值是有明显差别的,而且还时刻不同。但是为什么容易弄混呢?因为在掷足够多次数后求出来的均值,两者就无限接近了。期望值可能与每一个结果都不相等。换句话说,期望值是该变量输出值的加权平均。期望值并不一定包含于其分布的值域,也并不一定等于值域平均值。如上面的例子3.5虽然是“点数”的期望值,但却不属于可能结果中的任何一个,因为没有可能掷出此点数。2.2 方差方差是在概率论和统计中用来衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。方差分为总体方差和样本方差。总体方差计算公式:\sigma^{2} = \frac{\sum_{i = 1}^{N}{(X_i - \mu)^{2}}}{N} \tag{3} 其中:\sigma^{2}为总体方差,X_i为样本值,\mu为总体均值,N为总体样本量。但实际工作中,我们往往不清楚一个总体样本的总体均数\mu,而是通过抽取样本,计算样本均数,然后用样本均数来代替总体均数,所以样本方差的计算公式就变为:S^{2} = \frac{\sum_{i = 1}^{n}{(X_i - \overline{X})^{2}}}{n-1} \tag{4} 其中:S^{2}为样本方差,X_i为样本值,\overline{X}为观测样本均值,n为抽取的样本量。比较总体方差和样本方差,就会发现,当把总体均值\mu变为样本均值\overline{X}时,除以N就变成除以(n-1)了。原因是一个很重要的原则就是“无偏原则“。2.3 标准差标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。总体标准差:\sigma = \sqrt{\sigma^{2}} = \sqrt{\frac{\sum_{i = 1}^{N}{(X_i - \mu)^{2}}}{N}} \tag{5} 样本标准差:S = \sqrt{S^{2}} = \sqrt{\frac{\sum_{i = 1}^{n}{(X_i - \overline{X})^{2}}}{n-1}} \tag{6} 标准误差:\sigma_{n} = \frac{\sigma}{\sqrt{n}} \tag{7} 2.4 协方差矩阵从方差的基础上,协方差公式被定义为:S(x,y) = \frac{\sum^{n}_{i=1}(x_{i} - \overline{x})(y_{i} - \overline{y})}{n-1} \tag{8} 其中:S(x,y)为协方差,x_i,y_i为两个随机变量样本值,\overline{x},\overline{y}为两个随机变量所对应的观测样本均值,n为抽取的样本量。据此,我们发现:方差S^{2}可视作是随机变量x关于其自身的协方差S(x,x)。根据方差的定义,给定d个随机变量x_{k},其中k = 1, 2, 3, ..., d,则这些随机变量的方差为:S(x_{k},x_{k})^{2} = \frac{\sum^{n}_{i=1}(x_{ki} - \overline{x_{k}})^{2}}{n-1},\quad k = 1, 2, 3, ...,d \tag{9} 其中,为方便书写,x_{ki}表示随机变量x_{k}中的第i个观测样本,n表示样本量,每个随机变量对应的观测样本数量均为n。对于这些随机变量,我们还可以根据协方差的定义,求出两两之间的协方差,即:S(x_{m},x_{k})^{2} = \frac{\sum^{n}_{i=1}(x_{mi} - \overline{x_{m}})(x_{ki} - \overline{x_{k}})}{n-1} \tag{10} 因此,协方差矩阵为:\Sigma = \left[ \begin{matrix} S(x_{1},x_{1})^{2} & \cdots & S(x_{1},x_{d})^{2} \\ \vdots & \ddots & \vdots \\ S(x_{d},x_{1})^{2} & \cdots & S(x_{d},x_{d})^{2} \end{matrix} \right] \in \mathbb{R}^{d×d} \tag{11} 其中,对角线上的元素为各个随机变量的方差,非对角线上的元素为两两随机变量之间的协方差,根据协方差的定义,我们可以认定:矩阵\Sigma为对称矩阵,其大小为d×d。协方差矩阵: 是一个对称矩阵,决定了二维高斯分布的形状;协方差矩阵的对角线元素为x和y轴的方差;反斜对角线上的两个值为协方差,表明x和y的线性相关程度,正值时:x增大,y也随之增大;负值时:x增大,y随之减小。编辑于 2022-04-11 18:57正态分布样本方差数学期望​赞同 211​​添加评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录视觉SLAM基础知识及实例演示本专栏仅为个人学习记录,侵权

高斯分布-CSDN博客

>

高斯分布-CSDN博客

高斯分布

最新推荐文章于 2024-01-28 10:09:16 发布

Hecttttttttt

最新推荐文章于 2024-01-28 10:09:16 发布

阅读量2.7w

收藏

157

点赞数

35

分类专栏:

Math

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/hanghang_/article/details/104602487

版权

Math

专栏收录该内容

4 篇文章

0 订阅

订阅专栏

高斯分布

高斯分布概念协方差矩阵的传播(covariance propagation)多元高斯概率密度函数的拆分与组合高斯分布边缘化(Marginalization)高斯分布的独立性与不相关性

高斯分布概念

高斯分布(正态分布)是一个常见的连续概率分布。正态分布的数学期望值或期望值

μ

{\displaystyle \mu }

μ 等于位置参数,决定了分布的位置;其方差

σ

2

\sigma ^{2}

σ2的开平方或标准差

σ

\sigma

σ 等于尺度参数,决定了分布的幅度。正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线(类似于寺庙里的大钟,因此得名)。我们通常所说的标准正态分布是位置参数

μ

=

0

\mu = 0

μ=0,方差

σ

2

=

1

\sigma^{2}=1

σ2=1的正态分布。(源自wiki百科) 若随机变量

X

X

X服从一个位置参数为

μ

\mu

μ、方差为

σ

2

\sigma^2

σ2的正态分布,可以记为

X

X

X~

N

(

μ

,

σ

2

)

N(\mu,\sigma^2)

N(μ,σ2),则其概率密度函数为

f

(

x

)

=

1

σ

2

π

e

x

p

(

(

x

μ

)

2

2

σ

2

)

f(x) = \frac{1} {{\sigma\sqrt{2\pi}}}exp(-\frac{(x-\mu)^2}{2\sigma^2})

f(x)=σ2π

​1​exp(−2σ2(x−μ)2​)

从上面可以看到,一维高斯分布可以用变量均值和方差进行描述,那么二维高斯分布的呢?一维正态分布只有一个变量,则二维高斯分布则包含有两个变量,二维高斯分布的均值

μ

\mu

μ由两个变量的均值描述,其方差由变量的协方差矩阵进行描述,协方差矩阵

Σ

\Sigma

Σ 表示的是两个变量之间的关系。

μ

=

(

μ

a

μ

b

)

Σ

=

(

σ

x

2

ρ

σ

x

σ

y

ρ

σ

x

σ

y

σ

y

2

)

\mu = {\mu_a \choose \mu_b } \quad \Sigma = \begin{pmatrix} \sigma^2_x & \rho\sigma_x\sigma_y \\ \rho\sigma_x\sigma_y & \sigma^2_y \end{pmatrix}

μ=(μb​μa​​)Σ=(σx2​ρσx​σy​​ρσx​σy​σy2​​)

其中,

ρ

σ

x

σ

y

\rho\sigma_x\sigma_y

ρσx​σy​和

ρ

σ

y

σ

x

\rho\sigma_y\sigma_x

ρσy​σx​分别为两个变量的协方差值。协方差的计算公式如下:

C

o

v

(

X

,

Y

)

=

E

[

(

X

E

(

X

)

(

Y

E

(

Y

)

]

=

E

[

X

Y

]

E

[

X

]

E

[

Y

]

\begin{aligned} Cov(X,Y) &= E[(X-E(X)(Y-E(Y)] \\ &= E[XY] - E[X]E[Y] \end{aligned}

Cov(X,Y)​=E[(X−E(X)(Y−E(Y)]=E[XY]−E[X]E[Y]​

协方差为正,则说明这两个变量呈正相关,为零则不相关,为负则为负相关。

对于一个二维高斯随机变量

x

x

x~

N

(

μ

,

Σ

)

N(\mu,\Sigma)

N(μ,Σ),其概率密度可以表示为:

P

(

x

)

=

1

2

π

Σ

e

x

p

(

1

2

(

x

μ

)

T

Σ

1

(

x

μ

)

)

P(x) = \frac{1}{|2\pi\Sigma|}exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu))

P(x)=∣2πΣ∣1​exp(−21​(x−μ)TΣ−1(x−μ))

其图形可表示为:

协方差矩阵的传播(covariance propagation)

一个高斯随机变量的线性变换仍是高斯随机变量。 假设一个高斯随机变量

x

x

x~

N

(

μ

,

Σ

)

N(\mu,\Sigma)

N(μ,Σ),如果有

x

=

A

x

+

b

x^{\prime} = Ax + b

x′=Ax+b,则

x

x^{\prime}

x′~

N

(

μ

,

Σ

)

N(\mu^{\prime},\Sigma^{\prime})

N(μ′,Σ′)。其中,

μ

\mu^{\prime}

μ′和

Σ

\Sigma^{\prime}

Σ′为:

μ

=

E

[

x

]

=

E

[

A

x

+

b

]

=

A

E

[

x

]

+

b

=

A

μ

+

b

\mu^\prime = E[x^{\prime}] = E[Ax+b] = AE[x] + b = A\mu + b

μ′=E[x′]=E[Ax+b]=AE[x]+b=Aμ+b

Σ

=

c

o

v

[

x

]

=

E

[

(

x

E

[

x

]

)

(

x

E

[

x

]

)

]

=

A

E

[

(

x

μ

)

(

x

μ

)

T

]

A

T

=

A

Σ

A

T

\begin{aligned} \Sigma^\prime &= cov[x^{\prime}] = E[(x^\prime - E[x^\prime])(x^\prime-E[x^\prime])] \\ &= AE[(x-\mu)(x-\mu)^T]A^T \\ &= A{\Sigma}A^T \end{aligned}

Σ′​=cov[x′]=E[(x′−E[x′])(x′−E[x′])]=AE[(x−μ)(x−μ)T]AT=AΣAT​

多个独立的高斯随机变量的线性组合仍是高斯随机变量。 假设

x

1

N

(

μ

1

,

Σ

1

)

x_1 \sim N(\mu_1,\Sigma_1)

x1​∼N(μ1​,Σ1​);

x

2

N

(

μ

2

,

Σ

2

)

x_2 \sim N(\mu_2,\Sigma_2)

x2​∼N(μ2​,Σ2​) 且

x

=

A

x

1

+

B

x

2

x^\prime = Ax1 + Bx2

x′=Ax1+Bx2,有:

μ

=

E

[

x

]

=

A

μ

1

+

B

μ

2

Σ

=

c

o

v

[

x

]

=

A

Σ

1

A

T

+

B

Σ

2

B

T

\begin{aligned}\mu^\prime &= E[x^\prime]= A\mu_1 + B\mu_2 \\ \Sigma^\prime &= cov[x^\prime] = A\Sigma_1A^T + B\Sigma_2B^T\end{aligned}

μ′Σ′​=E[x′]=Aμ1​+Bμ2​=cov[x′]=AΣ1​AT+BΣ2​BT​

多元高斯概率密度函数的拆分与组合

多元高斯联合分布可拆分为一个先验分布与条件分布的乘积。(拆分公式) 有

P

(

x

)

=

P

(

x

1

x

2

)

P

(

x

2

)

P(x)=P(x_1|x_2)P(x_2)

P(x)=P(x1​∣x2​)P(x2​),假设该分布为:

x

=

[

(

x

1

x

2

)

]

x = [{x_1 \choose x_2}]

x=[(x2​x1​​)]~

N

(

[

(

μ

1

μ

2

)

]

,

[

Σ

11

Σ

12

Σ

21

Σ

22

]

)

N([{\mu_1 \choose \mu_2}],\begin{bmatrix} \Sigma_{11} & \Sigma_{12} \\ \Sigma_{21} & \Sigma_{22} \end{bmatrix})

N([(μ2​μ1​​)],[Σ11​Σ21​​Σ12​Σ22​​]),那么条件概率密度函数与先验(边缘)概率密度函数分别为:

P

(

x

1

x

2

)

N

(

μ

1

+

Σ

12

Σ

22

1

(

x

2

μ

2

)

,

Σ

11

Σ

12

Σ

22

1

Σ

21

)

P

(

x

2

)

N

(

μ

2

,

Σ

22

)

P(x_1|x_2) \sim N(\mu_1+\Sigma_{12}\Sigma_{22}^{-1}(x_2-\mu_2),\Sigma_{11}-\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}) \\ P(x_2) \sim N(\mu_2,\Sigma_{22})

P(x1​∣x2​)∼N(μ1​+Σ12​Σ22−1​(x2​−μ2​),Σ11​−Σ12​Σ22−1​Σ21​)P(x2​)∼N(μ2​,Σ22​) 我们把上式称之为多元高斯联合分布的拆分公式,这个公式是如何来的呢,可以先使用舒尔补求逆,然后化简得到,有时间的话我会出一篇讲边缘化的博客,里面会证明这个式子。总之,我们可以把上式称之为拆分公式。 反之,一个多元高斯联合分布也可以由先验概率和条件概率组合而成。(组合公式) 如果有

P

(

x

2

)

N

(

μ

2

,

Σ

22

)

P(x_2) \sim N(\mu_2,\Sigma_{22})

P(x2​)∼N(μ2​,Σ22​),

P

(

x

1

x

2

)

N

(

H

x

2

,

R

)

P(x_1|x_2) \sim N(Hx_2,R)

P(x1​∣x2​)∼N(Hx2​,R),将两者组成有:

x

=

[

(

x

1

x

2

)

]

N

(

[

(

H

μ

2

μ

2

)

]

,

[

H

Σ

22

H

T

H

Σ

22

Σ

22

H

T

Σ

22

]

)

x=[{x_1\choose x_2}] \sim N([{H\mu_2 \choose \mu_2}],\begin{bmatrix} H\Sigma_{22}H^T & H\Sigma_{22} \\ \Sigma_{22}H^T & \Sigma_{22}\end{bmatrix})

x=[(x2​x1​​)]∼N([(μ2​Hμ2​​)],[HΣ22​HTΣ22​HT​HΣ22​Σ22​​]) 同上,证明可以先不管,但如果你想证也是简单的,我们把上式称之为组合公式。

高斯分布边缘化(Marginalization)

定义:联合概率中,把最终结果中不需要的那些事件合并成其事件的全概率而消失(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率),这称为边缘化(marginalization)。

假设有一个离散的联合分布律如下图表示: x的边缘概率可表示为:

p

X

(

x

i

)

=

j

p

(

x

i

,

y

j

)

p_X(x_i)=\sum\limits_{j} p(x_i,y_j)

pX​(xi​)=j∑​p(xi​,yj​);y的边缘概率可以表示为:

p

Y

(

y

j

)

=

i

p

(

x

i

,

y

j

)

p_Y(y_j)=\sum\limits_{i} p(x_i,y_j)

pY​(yj​)=i∑​p(xi​,yj​)。 可以看到要求某一变量的边缘概率,要对另一变量进行求和。 那么在连续概率分布(如高斯分布中)呢?可以假设有两个变量

x

1

,

x

2

x_1,x_2

x1​,x2​,我们要求

x

1

x1

x1的边缘分布,实际上就是把

x

2

x_2

x2​边缘化。

x

2

P

(

x

1

,

x

2

)

d

x

2

=

x

2

P

(

x

2

x

1

)

P

(

x

1

)

d

x

2

=

x

2

P

(

x

2

x

1

)

d

x

2

P

(

x

1

)

=

P

(

x

1

)

N

(

μ

1

,

Σ

11

)

\begin{aligned} \int_{x_2}P(x_1,x_2)dx_2 &=\int_{x_2}P(x_2|x_1)P(x_1)dx_2 \\ &=\int_{x_2}P(x_2|x_1)dx_2P(x_1)\\ &= P(x_1) \sim N(\mu_1,\Sigma_{11})\end{aligned}

∫x2​​P(x1​,x2​)dx2​​=∫x2​​P(x2​∣x1​)P(x1​)dx2​=∫x2​​P(x2​∣x1​)dx2​P(x1​)=P(x1​)∼N(μ1​,Σ11​)​ 可以看到,对于高斯分布的边缘化,我们只需要在协方差矩阵将无关的变量(对应变量的行和列)去除掉即可。

N

(

μ

1

,

Σ

11

)

=

N

(

[

(

μ

1

μ

2

)

]

,

[

Σ

11

Σ

12

Σ

21

Σ

22

]

)

N(\mu_1,\Sigma_{11}) = N([{\mu_1 \choose \sout{\mu_2}}], \begin{bmatrix} \Sigma_{11} & \sout{\Sigma_{12}} \\ \sout{\Sigma_{21}} & \sout{\Sigma_{22}}\end{bmatrix})

N(μ1​,Σ11​)=N([(μ2​​μ1​​)],[Σ11​Σ21​​​Σ12​​Σ22​​​])

高斯分布的独立性与不相关性

由上述高斯分布的拆分公式中,有

P

(

x

)

=

P

(

x

1

x

2

)

P

(

x

2

)

P(x)=P(x_1|x_2)P(x_2)

P(x)=P(x1​∣x2​)P(x2​)。 右式分别满足以下分布:

P

(

x

1

x

2

)

N

(

μ

1

+

Σ

12

Σ

22

1

(

x

2

μ

2

)

,

Σ

11

Σ

12

Σ

22

1

Σ

21

)

P

(

x

2

)

N

(

μ

2

,

Σ

22

)

P(x_1|x_2) \sim N(\mu_1+\Sigma_{12}\Sigma_{22}^{-1}(x_2-\mu_2),\Sigma_{11}-\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}) \\ P(x_2) \sim N(\mu_2,\Sigma_{22})

P(x1​∣x2​)∼N(μ1​+Σ12​Σ22−1​(x2​−μ2​),Σ11​−Σ12​Σ22−1​Σ21​)P(x2​)∼N(μ2​,Σ22​)

假设

x

1

x_1

x1​和

x

2

x_2

x2​不相关,那么有:

Σ

12

=

0

\Sigma_{12} = 0

Σ12​=0 ,两者协方差为0。

Σ

12

=

E

[

(

x

1

μ

1

)

(

x

2

μ

2

)

]

=

E

[

x

1

x

2

T

]

E

[

x

1

]

E

[

x

2

]

T

=

0

\Sigma_{12}=E[(x_1-\mu_1)(x_2-\mu_2)]=E[x_1x_2^T] - E[x_1]E[x_2]^T=0

Σ12​=E[(x1​−μ1​)(x2​−μ2​)]=E[x1​x2T​]−E[x1​]E[x2​]T=0

根据独立的概念,

E

(

x

1

x

2

)

=

E

(

x

1

)

E

(

x

2

)

E(x_1x_2)=E(x_1)E(x_2)

E(x1​x2​)=E(x1​)E(x2​),该式和上式显然一样。

说明了,高斯分布的变量的不相关即为变量独立。

好了,关于高斯分布就告一段落。

如果我的文章对你有帮助,欢迎关注,点赞,评论。

参考: https://games-cn.org/games-webinar-20180426-43/

优惠劵

Hecttttttttt

关注

关注

35

点赞

157

收藏

觉得还不错?

一键收藏

知道了

1

评论

高斯分布

从高斯分布到贝叶斯滤波高斯分布高斯分布概念高斯分布特性贝叶斯滤波高斯分布高斯分布概念高斯分布(正态分布)是一个常见的连续概率分布。正态分布的数学期望值或期望值μ{\displaystyle \mu }μ 等于位置参数,决定了分布的位置;其方差σ2\sigma ^{2}σ2的开平方或标准差σ\sigmaσ 等于尺度参数,决定了分布的幅度。正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟...

复制链接

扫一扫

专栏目录

Python 图像处理: 生成二维高斯分布蒙版的实例

09-19

今天小编就为大家分享一篇Python 图像处理: 生成二维高斯分布蒙版的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

图像处理高斯法直方图平滑

12-02

%This function implements the gaussian smooth for an histogram an then it

%can be used to find the thershold. It uses the COUNTS variable that is

%returned by the imhist funcion an w is the size of the window that you

%want to use. It has to be a odd number. if not, the funcion will not run

%properly.

1 条评论

您还未登录,请先

登录

后发表或查看评论

什么叫高斯分布?

最新发布

weixin_40551464的博客

01-28

345

高斯分布在自然界和人类活动中广泛应用,例如,许多测量误差的分布、人口身高、体重、温度变化等都可以近似地用高斯分布描述。在机器学习和统计学中,高斯分布经常用作模型假设,例如,线性回归和贝叶斯推断等领域。高斯分布,也称为正态分布,是统计学中最常见的概率分布之一。它具有钟形曲线的形态,对称分布在均值周围,且由均值和标准差两个参数完全描述。—σ2是方差,σ则是标准差。—μ 是均值(期望值)

高斯分布的神奇力量: 在统计学中的重要性

禅与计算机程序设计艺术

01-08

802

1.背景介绍

高斯分布,又称正态分布,是数学统计学中最重要、最常用的概率分布。它的名字来源于德国数学家卡尔·弗里德曼·高斯(Carl Friedrich Gauss)。高斯分布在许多科学领域和实际应用中发挥着至关重要的作用,如物理学、化学、生物学、经济学、社会学、计算机科学等。在统计学中,高斯分布是描述随机变量分布情况的一个重要工具,它可以用来估计参数、进行假设检验、建立预测模型等。

本文将从...

高斯分布&正态分布

热门推荐

YYY_77的博客

07-11

3万+

文章目录高斯分布定义高斯分布意义高斯分布的证明多元高斯分布

高斯分布又叫正态分布,是统计学中最重要的连续概率分布。研究表明,在物理科学和经济学中,大量数据的分布通常是服从高斯分布,所以当我们对数据潜在分布模式不清楚时,可以优先用高斯分布近似或精确描述。

遵循高斯分布的随机变量是假设在给定范围内的任何值,比如某小学学校学生的身高,它可以取任何值,但是会限制在0到2米范围内,这个限制是根据实际生活中强加的,但是在高斯分布中,没有随机变量这个范围限制,可以扩展到整个实数范围内,最终会得到一个很好的平滑曲线,这样的

深度学习中的高斯分布

十年以上架构设计经验,专注于软件架构和人工智能领域,对机器视觉、NLP、音视频等领域都有涉猎

12-14

1533

高斯分布(Gaussian Distribution)又称正态分布(Normal Distribution)。高斯分布是一种重要的模型,其广泛应用与连续型随机变量的分布中,在数据分析领域中高斯分布占有重要地位。高斯分布是一个非常常见的连续概率分布。由于中心极限定理(Central Limit Theorem)的广泛应用,高斯分布在统计学上非常重要。

数学基础--高斯分布详解

积木的笔记

12-24

2万+

正态分布(Normal Distribution),又名高斯分布(Gaussian Distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。约翰·卡尔·弗里德里希·高斯(Johann Carl Friedrich Gauss)是德国著名数学家、物理学家、天文学家、大地测量学家,他是近代数学奠基者之一,被认为是历史上最重要的数学家之一,并享有“数学王子”的美誉。他的头像也被印在以前德国的官方货币(德国马克 10 马克)上,如图 1 所示。

高斯分布(正态分布)详解

qq_37346140的博客

08-23

4635

高斯分布的概念详解以及通俗易懂解释、实际应用等。

高斯分布、高斯混合模型、EM算法详细介绍及其原理详解

IronmanJay的博客

03-06

3123

今天给大家带来的主要内容包括:高斯分布,高斯混合模型,EM算法。废话不多说,下面就是本文的全部内容了!

高斯分布与正态分布

元直的博客

12-04

1万+

高斯分布(Gaussian distribution)

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影...

数学基础--高斯分布

周永行的博客

02-25

3560

关于协方差矩阵在机器学习中的理解

高斯分布

参考资料

参考资料

复高斯分布的数学基础理论.pdf

11-23

复高斯分布的数学基础理论,包括复高斯的随机变量、随机分布,二维分布和随机矢量,莱斯分布的概率密度函数,供参考。

多元高斯分布的边际分布与条件分布

03-30

MCMC算法--Gibbs采样2:多元高斯分布的边际分布与条件分布

python 高斯分布二维高斯分布代码

07-12

本代码为Python3.x,包括高斯分布及二维高斯分布代码,使用了numpy、scipy、matplotlib等包,适合初学者使用

高斯分布函数_将函数图像分成多个高斯函数的波形_matlab

03-31

【达摩老生出品,必属精品,亲测校正,质量保证】

资源名:高斯分布函数_将函数图像分成多个高斯函数的波形_matlab

资源类型:matlab项目全套源码

源码说明: 全部项目源码都是经过测试校正后百分百成功运行的,如果您下载后不能运行可联系我进行指导或者更换。

适合人群:新手及有一定经验的开发人员

Python画图高斯分布的示例

12-31

如下所示:

import matplotlib.pyplot as plt

import numpy as np

import math

def gaussian(sigma, x, u):

y = np.exp(-(x - u) ** 2 / (2 * sigma ** 2)) / (sigma * math.sqrt(2 * math.pi))

return y

#x = np.linspace(220, 230, 10000)

x = np.linspace(-800, 800, 10000)

plt.title('PDF in Horizontal Direction', fon

使用python模拟高斯分布例子

12-23

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution) 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。 若随机变量X服从一个数学...

Python数据可视化实现正态分布(高斯分布)

12-26

正态分布(Normal distribution)又成为高斯分布(Gaussian distribution) 若随机变量X服从一个数学期望为、标准方差为的高斯分布,记为: 则其概率密度函数为: 正态分布的期望值决定了其位置,其标准差决定...

ansys 高斯分布

11-22

ANSYS是一款广泛应用于工程领域的有限元分析软件,而高斯分布则是一种常见的概率分布。在ANSYS中,高斯分布被广泛用于模拟和分析实际系统中的随机变量。

高斯分布,也称为正态分布,具有钟形曲线的特征。它在自然界和许多实际问题中都得到了广泛的应用。高斯分布可以用来描述许多随机变量的概率分布,例如温度、压力、速度和强度等。

在ANSYS中,高斯分布常用于模拟和分析系统中的不确定性。通过假设随机变量具有高斯分布,可以推断出系统中的各种参数以及系统的行为。在进行随机变量敏感性分析时,高斯分布可以用于表示输入变量的不确定性。

ANSYS利用高斯分布可以进行 Monte Carlo 模拟分析。Monte Carlo 方法是一种基于随机数的计算方法,它通过在一定范围内随机生成多个满足高斯分布的随机数,来模拟和分析不确定性量。通过进行大量的模拟运算,可以得到系统输出的概率分布,从而对系统的性能进行评估和优化。

总之,高斯分布在ANSYS中被广泛应用于模拟和分析系统中的不确定性。通过使用高斯分布,我们可以理解系统的行为和性能,并进行优化设计。这使得ANSYS成为了工程领域中重要的分析工具之一。

“相关推荐”对你有帮助么?

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交

Hecttttttttt

CSDN认证博客专家

CSDN认证企业博客

码龄7年

暂无认证

81

原创

22万+

周排名

189万+

总排名

36万+

访问

等级

4370

积分

197

粉丝

524

获赞

244

评论

2447

收藏

私信

关注

热门文章

超详细的Android百度地图开发:在APP上定位并显示出来

32163

高斯分布

27723

树莓派无法打开摄像头的问题

26563

Ubuntu安装之后卡顿解决方法

21898

图像的邻接性、连通性、区域和边界

17257

分类专栏

深度学习

4篇

杂七杂八

2篇

SLAM

10篇

C++

2篇

PaperReading

1篇

ffmpeg

6篇

Math

4篇

realsense

6篇

Leetcode

27篇

Linux

5篇

openwrt

1篇

Android学习

2篇

opencv学习

3篇

STM32学习

2篇

Altium Designer

1篇

Python

4篇

Digital Image Processing

1篇

视觉

4篇

最新评论

vins-mono保存、重载地图、evo工具测试

taotoa_:

运行第四个终端roslaunch benchmark_publisher publish.launch sequence_name:=MH_01_easy

,无法获得ground truth,这是为啥

Realsense D435i RGB+IMU标定

顿学W:

这里启动程序部分,应该找到文件,再加上python3才能启动,如下python3 kalibr_calibrate_imu_camera --target /home/wxh/ORBSLAM/calibration/april_6x6_2.1*2.1cm.yaml --cam /home/wxh/ORBSLAM/calibration/camchain-camd435i.yaml --imu /home/wxh/ORBSLAM/calibration/imu.yaml --bag /home/wxh/ORBSLAM/calibration/dynamic.bag --show-extraction

对‘TIFFLastDirectory@LIBTIFF_4.0’未定义的引用

GUNDAM_EXIA_:

我是conda remove libtiff解决问题

电容通路(被击穿)——导致电源短路

开拓Ktor:

一测发现板子只四五个短路的,我去。

ipad+PDF Expert:买前生产力,买后生产力

阿文131:

请问为什么pdf expert有些可以批注,有些不行呢

您愿意向朋友推荐“博客详情页”吗?

强烈不推荐

不推荐

一般般

推荐

强烈推荐

提交

最新文章

轻量级实时语义分割:ICNet & BiSeNet

轻量级实时语义分割:Guided Upsampling Network for Real-Time Semantic Segmentation

轻量级实时语义分割:ENet & ERFNet

2020年58篇

2019年21篇

2018年2篇

2017年1篇

目录

目录

分类专栏

深度学习

4篇

杂七杂八

2篇

SLAM

10篇

C++

2篇

PaperReading

1篇

ffmpeg

6篇

Math

4篇

realsense

6篇

Leetcode

27篇

Linux

5篇

openwrt

1篇

Android学习

2篇

opencv学习

3篇

STM32学习

2篇

Altium Designer

1篇

Python

4篇

Digital Image Processing

1篇

视觉

4篇

目录

评论 1

被折叠的  条评论

为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

祝福语

请填写红包祝福语或标题

红包数量

红包个数最小为10个

红包总金额

红包金额最低5元

余额支付

当前余额3.43元

前往充值 >

需支付:10.00元

取消

确定

下一步

知道了

成就一亿技术人!

领取后你会自动成为博主和红包主的粉丝

规则

hope_wisdom 发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额

0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

怎样用通俗易懂的文字解释正态分布及其意义? - 知乎

怎样用通俗易懂的文字解释正态分布及其意义? - 知乎首页知乎知学堂发现等你来答​切换模式登录/注册统计学数据分析正态分布概率论概率论与数理统计怎样用通俗易懂的文字解释正态分布及其意义?正态分布(Normal distribution),也称“常态分布”,又名 高斯分布 (Gaussian distribution),最早由A.棣莫弗…显示全部 ​关注者818被浏览1,800,620关注问题​写回答​邀请回答​好问题 62​3 条评论​分享​40 个回答默认排序猴子​中国科学院大学 电子与通信工程硕士​ 关注正态分布别去想神马数学公式,本质上它是一种商业模式。先从这个问题说去:为什么你很努力的上班,却还是当不了公司高管?1. 什么是正态分布个人商业模式?假设你老妈挺操心你单身狗的生活,怕你孤独而死。为了给你寻找优质的相亲对象,就把你的照片放到了相亲网站上。艾玛,这可好一下子吸引来200多个人留言,要与你“私定终身”。老妈可谓是王母娘娘下凡,为了提高筛选效率,于是乎就建了一个微信群,让所有人报一下自己准确的身高。幸亏老妈当年干过些简单的数据统计工作。她以5厘米为单位,数一数每一段5厘米各有多少人。接着用身高为横轴,人数为纵轴,画了下面这张图。仔细看这张图,你和老妈发现一个惊人的秘密:这张图形状是中间高,两边低,长得像一只倒扣的钟。这种数据分布就是正态分布:正态分布像一只倒扣的钟。两头低,中间高,左右对称。大部分数据集中在平均值,小部分在两端。实际上人的身高就是符合正态分布的。2017年我国18岁及以上成年男性平均身高167.1cm。那么根据身高是正态分布,我们就可以快速的知道大部分男性的身高是集中在平均值,有小部分人的身高要么比平均值身高略高,要么略低(例如王祖蓝)。神奇的地方在于,不管是人的身高,手臂长度,肺活量,还是他们的考试成绩,都符合正态分布。2. 正态分布是怎么来的呢?为什么叫正态,而不叫“正点”呢?(小姐,你好正哦 )这要从发明这个东东的人说起。维多利亚时期的学者Francis Galton对数据分布很着迷,他制造了一台可以产生“数据分布”的装置。他发现这种形状适用于用于很多数据,他将其命名为“正态分布”(The Normal Distribution)。正态的英文单词是“normal”,意思是“常见的,典型的”,主要是因为这种分布能恰当代表多种多样的数据类型。3.还有哪些商业现象,符合正态分布呢?1)员工绩效大部分员工的业绩,都是一般的,做得特别好的非常少,做得特别差的也不多见。这就是为什么绩效管理领域,会用“活力曲线”来考核业绩。什么是“活力曲线”呢?员工流失率太高显然不好。据计算,招聘的过程花费,大概是这名员工年薪的50%。过高的员工流失率,意味着失控的招聘成本。离职的业绩损失,大概是这名员工年薪的30%-400%。过高的员工流失率,更意味着巨大的业绩损失。员工流失率太低也不好。极低的员工流失率,通常来自对低绩效的容忍。允许绩效差的员工留在团队,损失的不仅是工资,而是本应获得的业绩。另外,绩效差的员工通常更不愿离开,因为他可能找不到另一份工作。为了安全,他会想办法挤走绩效好的人,你的团队会越来越没有战斗力。通用电气前CEO杰克·韦尔奇认为,大家很容易认识到员工流失率太高的问题,却很难认识到流失率太低的危害,所以,他提出了著名的“末位淘汰制”(也叫“活力曲线”),他把员工分为:20%的优秀员工,70%的中等员工,和10%的末位员工。 末位员工必须提升自己,或者转岗,或者面临淘汰。这个制度,被认为是给通用电气带来无限活力的法宝之一。所以,以后上班别偷懒,小心被老板裁掉。害怕吧?2)产品质量大部分产品的质量,都是平庸的,真正的好产品非常少,但烂到骨子里的产品也不多见。这就是为什么质量管理领域,会用6个标准差(关于标准差在之前的《如何看懂数据》里有讲过)来排除掉不合格的产品。3)快速找到停车位根据《华尔街日报》的报道,美国人甚至连在购物商场停车都呈现出正态分布,正对着商场入口的地方停车数量最多,也就是正态曲线的“峰值”,在入口左右两侧的停车数量逐渐变少,即曲线两端下滑的“尾巴”。你知道这个规律后,下次停车直接选择上次入口两端车少的地方进入,找到停车位的概率就很多了。4)智商大部分人的智商是正常的,只有少数像爱伊斯坦老爷子这样的才会智商发飙。5)预测数据的位置正态分布的一个神奇的地方:可以大概估算出数据的位置。我们先从一个例子开始。假如你选对了个人商业模式,成功开了一家公司,员工有几百早上做地铁去公司上班。你公司可以看做下面图中的中间位置。有的人坐3站地铁可以到公司,有的人坐2站可以到公司,还有很多人住的比较近,坐1站地铁就到公司了。这里的几站地就是表示你离公司还有多远的距离。上面这个图其实就是下面的正态分布图中间的那条线代表平均值(例子中公司的位置)。之前我有讲过标准差是表示数据的波动大小。1个标准差表示距离平均值1个标准差的位置(例子中距离公司1站地),同样的,2个标准差,3个表示距离平均值2个标准差的位置,3个标准表示距离平均值3个标准差的位置。知道这3个标准差于平均值的距离,有什么用呢?这个用处可大了去了。正态分布的“美”好比迈克尔·乔丹在球场上的力量、灵巧和优雅,它来自于一个事实,那就是我们通过上面这个图就能够清楚地知道:有68.2%数值位于平均值1个标准差的范围之内有95.4%的数值位于2个标准差的范围以内还有99.7%的数值位于3个标准差的范围以内这听上去似乎挺傻的,但事实上这就是统计学的基础之一。这也是正态分布最厉害的“杀手锏”,正是这个特点才有了统计概率里的武器”中心极限定理“(这个我会在”猴子统计概率思维“课程里聊到)。一个典型的例子就是,每一次SAT考试(被称为美国高考)都是经过精心设计,以得到一个平均分为500分、标准差为100的成绩的正态分布。这样就会保证公平性,让大部分人可以通过考试,而少部分人通不过考试。我们回到一开始提出的问题:为什么你很努力的上班,却还是当不了公司高管?正态分布是商业界最常见的一种分布。当影响结果(或者成功)的因素特别多,没有哪个因素可以完全左右结果时,这个结果通常就呈现正态分布。很多事物,都可以用正态分布曲线表示,或者辅助思考,比如,科技创新接受度,基本上就符合正态分布……人群中的个体若是按能力划分的话,分布大致应该符合正态分布曲线的样子:其中有一个“鸿沟”,是想说明有很多人能力增长到一定程度,就会遇到无法跨越的鸿沟。比如,对中国程序员来说最普遍的鸿沟是英文。没有英文能力,最新的技术学起来就是落后他人。你去公司上班打工的商业模式,也是符合正态分布的。即大部分是处于中间平均位置的,既不能大富大贵,也不会穷到沦落街头。而成为公司高管是少数人可以做到的事情。因为你的 “边际成本”不为零。什么叫“边际成本”?边际成本,它指的是企业生产产品时,每多生产一个,需要额外产生的成本。你可以简单理解为,边际成本就是:你做一件事,每多一份产出,需要多付出的代价。所以去公司上班并不是一个边际成本为零的收入。你每多赚一块钱的工资收入,你就得多付出相应的劳动。工资收入不仅边际成本不为零,很多时候,它的边际成本是增加的。边际成本增加的意思就是,你得没日没夜的加班,你得牺牲很多和家人朋友相处的时间,你才可能实现工资收入的增长,比如拿到年终奖。我们常说企业要转型,传统企业要升级,要增加高新科技企业的数量。升级和转型的根本,其实就是要把成本结构从递增,改成更有效率的递减,甚至接近于零。“边际成本”越高的行业,越是分散市场,符合正态分布:赚大钱的人少,亏大钱的也少,大部分人都趋向赚取平均利润。回到一开始提出的问题上来:为什么你很努力的上班,却还是当不了公司高管?答案就很简单了,因为你选择的上班领工资是正态分布的个人商业模式,大部分人不可能成为高管。所以,你选择的上班领工资是正态分布的个人商业模式,大部分人不可能成为高管。注意,我这里说的是“大部分”,意外着是从总体的角度来看问题。如果你说身边的某某就是高管,不好意思,你是从特殊样本来看问题。总体代表概率,特殊样本代表思维偏见,而统计概率给我们的智慧就是对大概率事件下注,如果不明白这一点思考问题的正确方式,可以补一下我之前的课程《投资赚钱与概率》。那么问题来了,有没有办法改变你的个人商业模式,从而实现财务自由呢?答案是有的,限于篇幅可以看我写的《幂律分布个人商业模式》编辑于 2020-12-09 09:33​赞同 1956​​102 条评论​分享​收藏​喜欢收起​小尧​​财务话题下的优秀答主​ 关注0.0 神说,要有正态分布,于是就有了正态分布。*0.1 神看正态分布是好的,就让随机误差都随了正态分布。0.2 正态分布的奇妙之处,就是许多看似随机事件竟然服从一个表达式就能表达的分布,如同上帝之手特意为之。[1]——《创世纪·数理统计·正态分布的前世今生》一、神觉得抛硬币是好的,于是定义每个抛出硬币正面记+1分,反面记-1分。创世纪从0分开始,神只抛1次硬币,有2种可能:一半的概率+1分,一半的概率-1分。此时概率分布大概是这样的:一半的概率+1分,一半的概率-1分画图大概是这样子:一半的概率+1分,一半的概率-1分神决定扔10个硬币:一样的做出概率分布当然,同样画个图感受一下:10个硬币的概率分布情况如果是100个,甚至是无穷多个呢?平均分数分布情况大概是什么样呢?画个图感受一下:二、为什么正态分布这么常见呢?因为通常情况下,一个事物的影响因素都是多个,比如每个人的身高,受到多个因素的影响,比如:父母的身高家里面的饮食习惯,每天吃素还是吃荤(当然喜欢吃肉),每天吃牛肉还是吃猪肉(都喜欢)每天是否运动(当然),每天做了什么运动(游泳)等等等的每一个因素,每天的行为,就像刚才抛硬币一样,这些因素要不对身高产生正面影响,要不对身高产生负面影响,最终让整体身高接近正态分布。学过基础统计学的同学大都对正态分布非常熟悉,但是很难用通俗的语言解释什么是正态分布,主要原因是正态分布需要有一个前置知识【中心极限定理】。如果误差可以看成许多微小量的叠加,则根据中心极限定理[1],随机误差理所当然是正态分布[2]。正经的数学:正态分布又名高斯分布(Gaussian distribution)。假设一随机变量X服从一个期望为 μ,方差为 σ2 的正态分布,概率密度函数为正态分布公式则可记为:X∼N(μ,σ2),画图如下图:*神的名字是约翰·卡尔·弗里德里希·高斯,C.F.Gauss,1777年4月30日-1855年2月23日[1]正态分布为什么常见?真正原因是中心极限定理(central limit theorem)。根据中心极限定理,如果一个事物受到多种因素的影响,不管每个因素本身是什么分布,它们加总后,结果的平均值就是正态分布。[2]正态分布只适合各种因素累加的情况,如果这些因素不是彼此独立的,会互相加强影响,那么就不是正态分布了。PS:如果各种因素对结果的影响不是相加,而是相乘,那么最终结果不是正态分布,而是对数正态分布(log normal distribution)编辑于 2019-04-14 20:09​赞同 477​​36 条评论​分享​收藏​喜欢

概率论与统计学2——深入理解高斯分布 - 知乎

概率论与统计学2——深入理解高斯分布 - 知乎首发于人工智能与机器学习切换模式写文章登录/注册概率论与统计学2——深入理解高斯分布做大饼馅儿的韭菜一条想成为大佬的咸鱼高斯分布的公式以及期望方差我们已经很熟悉了,高斯分布可以写成以下形式:\mathcal N(x|\mu,\sigma^2)=\frac{1}{\sqrt{2\pi}\sigma}exp\left( -\frac{(x-\mu)^2}{2\sigma^2} \right) \mu 是均只期望, \sigma^2 是方差,以上形式是基于只有一个变化维度的连续随机变量,因此以上又称为一元高斯分布。当 \mu=0,\sigma^2=1 时,称为标准高斯分布(标准正态分布):\mathcal N(x|0,1)=\frac{1}{\sqrt{2\pi}}exp\left( -\frac{x^2}{2} \right) 多元高斯分布对于具有 D 维的向量 x ,其高斯分布称为多元高斯分布。多元高斯分布的形式是怎样的呢?这里假设 x 维度之间没有相关性,当 x 维度之间具有相关性时,需要多一个步骤,即去相关性,将 x 映射到一个新的坐标系中,并且在该坐标系中, x 各个维度之间去相关性,重新定义期望、协方差矩阵以及协方差逆矩阵,然后求解方式和下文类似。假设有n个变量, x=\left[ x_1,x_2,...,x_n \right]^T ,且变量维度之间不相关,各个维度的均值假设为: E(x)=\left[ \mu_1,\mu_2,...,\mu_n \right]^T ,方差 \sigma(x)=\left[ \sigma_1,\sigma_2,...,\sigma_n \right]^T 。联合概率密度公式:f(x)=p(x_1,x_2,...,x_n)=p(x_1)p(x_2)...p(x_n)=\frac{1}{(\sqrt{2\pi})^n\sigma_1\sigma_2...\sigma_n}exp\left( -\frac{(x_1-\mu_1)^2}{2\sigma_1^2}-\frac{(x_2-\mu_2)^2}{2\sigma_2^2}...-\frac{(x_n-\mu_n)^2}{2\sigma_n^2} \right) 这里令 z^2=\frac{(x_1-\mu_1)^2}{2\sigma_1^2}+\frac{(x_2-\mu_2)^2}{2\sigma_2^2}...+\frac{(x_n-\mu_n)^2}{2\sigma_n^2} ,那么可以写成:f(z)=\frac{1}{(\sqrt{2\pi})^n\sigma_z}exp\left( -\frac{z^2}{2} \right) 不妨从几何的思想角度来考虑问题,将 z^2 转换为矩阵乘积形式: z^2=z^Tz=\left[ x_1-\mu_1,x_2-\mu_2,...,x_n-\mu_n \right]\begin{bmatrix}\frac{1}{\sigma_1^2}&0&...&0\\0&\frac{1}{\sigma_2^2}&...&0\\\vdots&...&...&\vdots\\0&0&\cdots&\frac{1}{\sigma_n^2}\end{bmatrix}\left[ x_1-\mu_1,x_2-\mu_2,...,x_n-\mu_n \right]^T 这里令 x-\mu_x=\left[ x_1-\mu_1,x_2-\mu_2,...,x_n-\mu_n \right]^T ,以及 x 得协方差矩阵 \Sigma :\Sigma=\begin{bmatrix} \sigma_1^2&0&\cdots&0\\0&\sigma_2^2&\cdots&0\\\vdots&\cdots&\cdots&\vdots\\0&0&\cdots&\sigma_n^2\end{bmatrix} ,i 行 j 列的元素就是 x_i,x_j 得协方差。这里我们假设的是 x 的维度之间是相互独立的,因此对角线以外的地方协方差为0(不相关),对角线的协方差就是方差。\Sigma 是一个对角阵,可以得到其逆矩阵: \Sigma^{-1}=\begin{bmatrix}\frac{1}{\sigma_1^2}&0&\cdots&0\\0&\frac{1}{\sigma_2^2}&\cdots&0\\\vdots&\cdots&\cdots&\vdots\\0&0&\cdots&\frac{1}{\sigma_n^2}\end{bmatrix} 根据性质对角阵的行列式就是对角元素的乘积可知:\sigma_z=|\Sigma|^{\frac{1}{2}}=\sigma_1\sigma_2...\sigma_n 最后可以将 z^2 表达式简化为: z^2=z^Tz=(x-\mu_x)^T\Sigma^{-1}(x-\mu_x) 这里的 z 又可以叫做 \mu_x 和 x之间 的马氏距离。马氏距离表示点与一个分布之间的距离,是一种有效的计算两个未知样本集的相似度的方法。当 \Sigma 是单位矩阵时, z 即为 \mu_x 和 x 之间的欧氏距离。带入多元高斯分布函数中最终可以得到:f(z)=\frac{1}{\left( \sqrt{2\pi} \right)^n\sigma_z}exp\left( -\frac{z^2}{2} \right)=\frac{1}{\left( \sqrt{2\pi} \right)^n|\Sigma|^{\frac{1}{2}}}exp\left( -\frac{(x-\mu_x)^T(\Sigma)^{-1}(x-\mu_x)}{2} \right) 高斯分布作为被广泛使用的概率密度模型,仍然有一些局限性:一个通常的对称协方差矩阵 \Sigma 有 \frac{D(D+1)}{2} 个独立参数, \mu_x 有额外的 D 个独立参数。对于 D 维度很高时,参数的总数随着 D 平方形式增长,此时对大矩阵的求解和逆运算会变得不可能。条件高斯分布多元高斯分布的一个重要性质是:如果两组变量是联合高斯分布,那么以一组变量为条件,另一组变量同样是高斯分布,类似地,任何一个变量的边缘分布都是高斯分布。假设 x 是一个服从高斯分布 N(x|\mu,\Sigma) 的 D 维向量。将 x 分成不相交的子集 x_a,x_b ,此时 x=\begin{pmatrix}x_a\\x_b\end{pmatrix} ,对应的均值向量 \mu_x 的划分: \mu_x=\begin{pmatrix}\mu_a\\\mu_b\end{pmatrix} ,协方差矩阵: \Sigma=\begin{pmatrix}\Sigma_{aa}&\Sigma_{ab}\\\Sigma_{ba}&\Sigma_{bb}\end{pmatrix} 。由协方差矩阵对称性可知: \Sigma^T=\Sigma ,说明 \Sigma_{aa},\Sigma_{bb} 也是对称的,并且 \Sigma_{ba}=\Sigma_{ab}^T 。\Lambda\equiv\Sigma^{-1} , \Lambda 为协方差矩阵的逆矩阵,又称为精度矩阵。那么可以得到: \Lambda=\begin{pmatrix}\Lambda_{aa}&\Lambda_{ab}\\\Lambda_{ba}&\Lambda_{bb}\end{pmatrix} 需要求解 p(x_a|x_b) ,根据上文对于 x 划分为 x_a,x_b 的方式,以及在多元高斯分布中 z^2 的几何形式,可以得到如下:\begin{align}-\frac{1}{2}&(x-\mu)^T\Sigma^{-1}(x-\mu)=\\&-\frac{1}{2}(x_a-\mu_a)^T\Lambda_{aa}(x_a-\mu_a)-\frac{1}{2}(x_a-\mu_a)^T\Lambda_{ab}(x_b-\mu_b)\\&-\frac{1}{2}(x_b-\mu_b)^T\Lambda_{ba}(x_a-\mu_a)-\frac{1}{2}(x_b-\mu_b)^T\Lambda_{bb}(x_b-\mu_b)\end{align} 我们知道,要求解 p(x_a|x_b) ,那么就假设 x_b 为已观测的样本,那么为了找到其均值 \mu_{a|b} 和方差 \Sigma_{a|b} ,根据上式,将 x_b 当作常数, 可以找到x_a 的二阶项: -\frac{1}{2}x_a^T\Lambda_{aa}x_a 从以上的二阶项可以看出,方差 \Sigma_{a|b}=\Lambda_{aa}^{-1} 找到所有关于 x_a 的常数项: x_ a^T\{\Lambda_{aa}\mu_a-\Lambda_{ab}(x_b-\mu_b)\} 一般高斯分布 \mathcal N(x|\mu,\Sigma) 的指数项可以写成:-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)=-\frac{1}{2}x^T\Sigma^{-1}x+x^T\Sigma^{-1}\mu+b ,b为常数,与 x 无关项。根据上文中找到的x_a 的常数项,结合一般高斯分布的指数型分解,可以得到:\begin{align}&x_a^T\{\Lambda_{aa}\mu_a-\Lambda_{ab}(x_b-\mu_b)\}=x_a^T\Sigma^{-1}_{a|b}\mu_{a|b}\\&\Rightarrow \{\Lambda_{aa}\mu_a-\Lambda_{ab}(x_b-\mu_b)\}=\Sigma^{-1}_{a|b}\mu_{a|b}\\&\Rightarrow \mu_{a|b}=\Sigma_{a|b}\{\Lambda_{aa}\mu_a-\Lambda_{ab}(x_b-\mu_b)\}\\&\Rightarrow \mu_{a|b}=\mu_a-\Lambda^{-1}_{aa}\Lambda_{ab}(x_b-\mu_b)\end{align} 我们已经知道 \begin{pmatrix}\Sigma_{aa}&\Sigma_{ab}\\\Sigma_{ba}&\Sigma_{bb}\end{pmatrix}^{-1}=\begin{pmatrix}\Lambda_{aa}&\Lambda_{ab}\\\Lambda_{ba}&\Lambda_{bb}\end{pmatrix} ,根据分块矩阵的逆矩阵恒等式:\begin{pmatrix}A&B\\C&D\end{pmatrix}^{-1}=\begin{pmatrix}M&-MBD^{-1}\\-D^{-1}CM&D^{-1}{+D^{-1}CMBD^{-1}}\end{pmatrix} 其中定义: M=(A-BD^{-1}C)^{-1} 得出: \Lambda_{aa}=(\Sigma_{aa}-\Sigma_{ab}\Sigma_{bb}^{-1}\Sigma_{ba})^{-1} \Lambda_{ab}=-(\Sigma_{aa}-\Sigma_{ab}\Sigma_{bb}^{-1}\Sigma_{ba})^{-1}\Sigma_{ab}\Sigma_{bb}^{-1} 最后可以得到:\mu_{a|b}=\mu_a+\Sigma_{ab}\Sigma_{bb}^{-1}(x_b-\mu_b) , \Sigma_{a|b}=\Sigma_{aa}-\Sigma_{ab}\Sigma^{-1}_{bb}\Sigma_{ba} 最终可以得到条件概率分布:p(x_a|x_b)=\mathcal N(x_a|\mu_{a|b},\Lambda_{aa}^{-1}) \mu_{a|b}=\mu_a+\Sigma_{ab}\Sigma_{bb}^{-1}(x_b-\mu_b) 边缘高斯分布如果联合分布 p(x_a,x_b) 是高斯分布,那么条件概率分布 p(x_a|x_b) 也是高斯分布,那么边缘概率分布 p(x_a)=\int_{}^{}p(x_a,x_b)\ dx_b 显然也是一个高斯分布。我们主要研究联合分布的指数项二次型,这次考虑涉及到 x_b 的项,结合条件高斯分布中对 z^2 几何形式关于 x_a,x_b 的分解公式,可以得到:-\frac{1}{2}x_b^T\Lambda_{bb}x_b+x_b^Tm=-\frac{1}{2}(x_b-\Lambda_{bb}^{-1}m)^T\Lambda_{bb}(x_b-\Lambda_{bb}^{-1}m)+\frac{1}{2}m^{T}\Lambda_{bb}^{-1}m 其中 m=\Lambda_{bb}\mu_b-\Lambda_{ba}(x_a-\mu_a) 上式中与 x_b 相关的项转化为一个高斯分布的标准二次型,结合边缘概率公式需要积分:\int exp\left\{ -\frac{1}{2}(x_b-\Lambda_{bb}^{-1}m)^T\Lambda_{bb}(x_b-\Lambda_{bb}^{-1}m) \right\}dx_b 上面只提出了关于 x_b 的二项式,其最后一项 \frac{1}{2}m^T\Lambda_{bb}^{-1}m 为和 x_b 无关但和 x_a 有关的项,结合前文提到的,除 x_b 二次项以外的并和x_a 有关的项结合,得到:\begin{align}&\frac{1}{2}\left[ \Lambda_{bb}\mu_b-\Lambda_{ba}(x_a-\mu_a) \right]^T\Lambda_{bb}^{-1}\left[ \Lambda_{bb}\mu_b-\Lambda_{ba}(x_a-\mu_a) \right]\\&-\frac{1}{2}x_a^T\Lambda_{aa}x_a+x_a^T(\Lambda_{aa}-\Lambda_{ab}\Lambda_{bb}^{-1}\Lambda_{ba})x_a\\&=-\frac{1}{2}x_a^T(\Lambda_{aa}\Lambda_{ab}\Lambda_{bb}^{-1}\Lambda_{ba}x_a)+x_a^T(\Lambda_{aa}-\Lambda_{ab}\Lambda_{bb}^{-1}\Lambda_{ba})\mu_a+b\end{align} b 为常数,是与 x_a 无关的量,那么可以得到边缘概率的协方差矩阵:\Sigma_{a}=(\Lambda_{aa}-\Lambda_{ab}\Lambda_{bb}^{-1}\Lambda_{ba})^{-1} 均值为: \mu_a=\Sigma_a(\Lambda_{aa}-\Lambda_{ab}\Lambda_{bb}^{-1}\Lambda_{ba})\mu_a 前文介绍过分块矩阵逆矩阵的恒等式,那么可以得出:\Sigma_{aa}=(\Lambda_{aa}-\Lambda_{ab}\Lambda_{bb}^{-1}\Lambda_{ba})^{-1} 最后可以得出边缘概率 p (x_a) 的均值和协方差:E\left[ x_a \right]=\mu_a , cov\left[ x_a \right]=\Sigma_{aa} 边缘概率分布:p(x_a)=\mathcal N(x_a|\mu_a,\Sigma_{aa}) 混合高斯分布通过将更基本的概率分布(高斯分布)进行线性组合叠加,然后形式化为概率模型,被称为混合模型。高斯分布的线性组合可以给出相当复杂的概率密度形式。通过使用足够多的高斯分布,并且调节它们的均值和方差以及线性组合的系数、几乎所有的连续概率密度能够以任意的精度近似。考虑 K 个高斯概率密度的叠加,形式为:p(x)=\sum_{k=1}^{K}\pi_k\ \mathcal N(x|\mu_k,\Sigma_k) 称为混合高斯分布,每个高斯概率密度 \mathcal N(x|\mu_k,\Sigma_k) 被称为混个高斯分布的一个成分,并且有自己的均值和协方差 \mu_k,\Sigma_k 。 \pi_k 被称为混合系数,可以得到: \sum_{k=1}^{K}\pi_k=1, 0\leq\pi_k\leq1 。根据概率的加和规则和乘积规则,边缘概率密度为: p(x)=\sum_{k=1}^{K}p(k)p(x|k) 这和上面的混合高斯分布公式是等价的,把 \pi_k=p(k) 看成第k个成分的先验概率,把密度 \mathcal N(x|\mu_k,\Sigma_k)=p(x|k) 看成以k为条件的x的概率。后验概率 p(k|x)=\frac{p(k)p(x|k)}{\Sigma_lp(l)p(x|l)}=\frac{\pi_k\mathcal N(x|\mu_k,\Sigma_k)}{\Sigma_l\pi_l\mathcal N(x|\mu_l,\Sigma_l)} ,表示已知观测点 x ,属于第 k 个成分高斯分布的概率。令 \pi\equiv\{\pi_1,...,\pi_K\},\mu\equiv\{\mu_1,...,\mu_K\},\Sigma\equiv\{\Sigma_1,...,\Sigma_K\} ,对数似然函数为:ln\ p(X|\pi,\mu,\Sigma)=\sum_{n=1}^{N}ln\left\{ x\sum_{k=1}^{K}\pi_k\ \mathcal N(x_n|\mu_k,\Sigma_k)\right\} ,X=\{x_1,...,x_N\} 因为该对数似然函数中对数里含有求和式,不能像一元高斯分布那样可以求得封闭的解析解,可以通过迭代数值优化方法以及期望最大化方法来求解。关于混合概率模型的期望最大化方法(EM)求解会在后续文章中介绍。参考博客:参考书籍:《Pattern Recognition And Machine Learning》——Christopher M. Bishop编辑于 2021-04-02 16:50统计学机器学习数据挖掘​赞同 91​​11 条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录人工智能与机器学习与机器学习和人工智能相关

正態分佈_百度百科

正態分佈_百度百科

Beta

進入詞條

清除歷史記錄關閉

反饋

分享

複製鏈接

請複製以下鏈接發送給好友

https://baike.baidu.hk/item/正態分佈/829892

複製

複製成功

正態分佈

鎖定

正態分佈(Normal distribution),也稱“常態分佈”,又名高斯分佈(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二項分佈的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角度導出了它。P.S.拉普拉斯和高斯研究了它的性質。是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面有着重大的影響力。正態曲線呈鍾型,兩頭低,中間高,左右對稱因其曲線呈鐘形,因此人們又經常稱之為鐘形曲線。若隨機變量X服從一個數學期望為μ、方差為σ2的正態分佈,記為N(μ,σ2)。其概率密度函數為正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。當μ = 0,σ = 1時的正態分佈是標準正態分佈。

中文名

正態分佈

外文名

Normal Distribution

適用領域

概率論

所屬學科

數學

別    名

高斯分佈

發現者

棣莫弗(Abraham de Moivre)

目錄

1

歷史發展

2

定理

3

定義

一維正態分佈

標準正態分佈

4

性質

5

分佈曲線

圖形特徵

參數含義

面積分布

6

研究過程

7

曲線應用

綜述

頻數分佈

綜合素質研究

醫學參考值

正態分佈歷史發展

正態分佈概念是由法國數學家棣莫弗(Abraham de Moivre)於1733年首次提出的,後由德國數學家Gauss率先將其應用於天文學研究,故正態分佈又叫高斯分佈,高斯這項工作對後世的影響極大,他使正態分佈同時有了“高斯分佈”的名稱,後世之所以多將最小二乘法的發明權歸之於他,也是出於這一工作。

[1] 

但德國10馬克的印有高斯頭像的鈔票,其上還印有正態分佈的密度曲線。這傳達了一種想法:在高斯的一切科學貢獻中,其對人類文明影響最大者,就是這一項。在高斯剛作出這個發現之初,也許人們還只能從其理論的簡化上來評價其優越性,其全部影響還不能充分看出來。這要到20世紀正態小樣本理論充分發展起來以後。拉普拉斯很快得知高斯的工作,並馬上將其與他發現的中心極限定理聯繫起來,為此,他在即將發表的一篇文章(發表於1810年)上加上了一點補充,指出如若誤差可看成許多量的疊加,根據他的中心極限定理,誤差理應有高斯分佈。這是歷史上第一次提到所謂“元誤差學説”——誤差是由大量的、由種種原因產生的元誤差疊加而成。後來到1837年,海根(G.Hagen)在一篇論文中正式提出了這個學説。其實,他提出的形式有相當大的侷限性:海根把誤差設想成個數很多的、獨立同分布的“元誤差” 之和,每隻取兩值,其概率都是1/2,由此出發,按棣莫弗的中心極限定理,立即就得出誤差(近似地)服從正態分佈。拉普拉斯所指出的這一點有重大的意義,在於他給誤差的正態理論一個更自然合理、更令人信服的解釋。因為,高斯的説法有一點循環論證的氣味:由於算術平均是優良的,推出誤差必須服從正態分佈;反過來,由後一結論又推出算術平均及最小二乘估計的優良性,故必須認定這二者之一(算術平均的優良性,誤差的正態性) 為出發點。但算術平均到底並沒有自行成立的理由,以它作為理論中一個預設的出發點,終覺有其不足之處。拉普拉斯的理論把這斷裂的一環連接起來,使之成為一個和諧的整體,實有着極重大的意義。

正態分佈定理

由於一般的正態總體其圖像不一定關於y軸對稱,對於任一正態總體,其取值小於x的概率。只要會用它求正態總體在某個特定區間的概率即可。為了便於描述和應用,常將正態變量作數據轉換。將一般正態分佈轉化成標準正態分佈。

[2] 

服從標準正態分佈,通過查標準正態分佈表就可以直接計算出原正態分佈的概率值。故該變換被稱為標準化變換。(標準正態分佈表:標準正態分佈表中列出了標準正態曲線下從-∞到X(當前值)範圍內的面積比例。)

正態分佈定義

正態分佈一維正態分佈

若隨機變量

服從一個位置參數為

、尺度參數為

的概率分佈,且其概率密度函數為

[3] 

則這個隨機變量就稱為正態隨機變量,正態隨機變量服從的分佈就稱為正態分佈,記作

,讀作

服從

,或

服從正態分佈。μ維隨機向量具有類似的概率規律時,稱此隨機向量遵從多維正態分佈。多元正態分佈有很好的性質,例如,多元正態分佈的邊緣分佈仍為正態分佈,它經任何線性變換得到的隨機向量仍為多維正態分佈,特別它的線性組合為一元正態分佈。本詞條的正態分佈是一維正態分佈,此外多維正態分佈參見“二維正態分佈”。

正態分佈標準正態分佈

時,正態分佈就成為標準正態分佈

正態分佈性質

正態分佈的一些性質:

[3] 

(1)如果

且a與b是實數,那麼

(參見期望值和方差)。(2)如果

是統計獨立的正態隨機變量,那麼:它們的和也滿足正態分佈

它們的差也滿足正態分佈

U與V兩者是相互獨立的。(要求X與Y的方差相等)。(3)如果

是獨立正態隨機變量,那麼:它們的積XY服從概率密度函數為p的分佈

其中

是修正貝塞爾函數(modified Bessel function)它們的比符合柯西分佈,滿足

(4)如果

為獨立標準正態隨機變量,那麼

服從自由度為n的卡方分佈。

正態分佈分佈曲線

正態分佈圖形特徵

集中性:正態曲線的高峯位於正中央,即均數所在的位置。對稱性:正態曲線以均數為中心,左右對稱,曲線兩端永遠不與橫軸相交。均勻變動性:正態曲線由均數所在處開始,分別向左右兩側逐漸均勻下降。曲線與橫軸間的面積總等於1,相當於概率密度函數的函數從正無窮到負無窮積分的概率為1。即頻率的總和為100%。關於μ對稱,並在μ處取最大值,在正(負)無窮遠處取值為0,在μ±σ處有拐點,形狀呈現中間高兩邊低,正態分佈的概率密度函數曲線呈鐘形,因此人們又經常稱之為鐘形曲線。

正態分佈參數含義

正態分佈有兩個參數,即期望(均數)μ和標準差σ,σ2為方差。正態分佈具有兩個參數μ和σ^2的連續型隨機變量的分佈,第一參數μ是服從正態分佈的隨機變量的均值,第二個參數σ^2是此隨機變量的方差,所以正態分佈記作N(μ,σ2)。μ是正態分佈的位置參數,描述正態分佈的集中趨勢位置。概率規律為取與μ鄰近的值的概率大,而取離μ越遠的值的概率越小。正態分佈以X=μ為對稱軸,左右完全對稱。正態分佈的期望、均數、中位數、眾數相同,均等於μ。σ描述正態分佈資料數據分佈的離散程度,σ越大,數據分佈越分散,σ越小,數據分佈越集中。也稱為是正態分佈的形狀參數,σ越大,曲線越扁平,反之,σ越小,曲線越瘦高。

正態分佈面積分布

正態函數的不定積分是一個非初等函數,稱為誤差函數。

實際上誤差函數的導數是:

將正態函數換元,誤差函數和“正態函數的積分”的關係是:

1、實際工作中,正態曲線下橫軸上一定區間的面積(誤差函數上下限之差)反映該區間的例數佔總例數的百分比,或變量值落在該區間的概率(概率分佈)。2、正態曲線下,要取到50%概率,橫軸半區間長度為0.67448975σ(該值無法用初等方法求解,是由迭代法取得的近似值。)橫軸區間(μ-σ,μ+σ)內的面積為68.268949%。

橫軸區間(μ-2σ,μ+2σ)內的面積為95.449974%。

橫軸區間(μ-3σ,μ+3σ)內的面積為99.730020%。

“小概率事件”和假設檢驗的基本思想: “小概率事件”通常指發生的概率小於5%的事件,認為在一次試驗中該事件是幾乎不可能發生的。由此可見X落在(μ-3σ,μ+3σ)以外的概率小於千分之三,在實際問題中常認為相應的事件不會發生,基本上可以把區間(μ-3σ,μ+3σ)看作是隨機變量X實際可能的取值區間,這稱之為正態分佈的“3σ”原則。而對於產量更大,試驗次數更多的大規模流水線產品,要達到“萬無一失”(99.99%)就要取到4σ(99.9936%),而要達到更高的水平,則需要取5σ~6σ長度的半區間,此時誤差大約是0.6ppm~0.002ppm,這是工業生產中提出的“六西格瑪(6σ)”原則(管理學書籍中提及的六西格瑪原則的要求是3.4ppm,這個概率值所對的分佈大約在半區間長度4.5σ,這是考慮到系統誤差造成的均值偏移μ=1.5σ的情況)。

正態分佈研究過程

概念及特徵:一、正態分佈的概念由一般分佈的頻數表資料所繪製的直方圖,圖⑴可以看出,高峯位於中部,左右兩側大致對稱。我們

正態分佈研究圖1

設想,如果觀察例數逐漸增多,組段不斷分細,直方圖頂端的連線就會逐漸形成一條高峯位於中央(均數所在處),兩側逐漸降低且左右對稱,不與橫軸相交的光滑曲線圖⑶。這條曲線稱為頻數曲線或頻率曲線,近似於數學上的正態分佈(normal distribution)。由於頻率的總和為100%或1,故該曲線下橫軸上的面積為100%或1。為了應用方便,常對正態分佈變量X作變量變換。

該變換使原來的正態分佈轉化為標準正態分佈(standard normal distribution),亦稱u分佈。u被稱為標準正態變量或標準正態離差(standard normal deviate)。

正態分佈研究圖2

正態分佈研究圖3

實際工作中,常需要了解正態曲線下橫軸上某一區間的面積佔總面積的百分數,以便估計該區間的例數佔總例數的百分數(頻數分佈)或觀察值落在該區間的概率。正態曲線下一定區間的面積可以通過附表1求得。對於正態或近似正態分佈的資料,已知均數和標準差,就可對其頻數分佈作出概約估計。

查附表1應注意:①表中曲線下面積為-∞到u的左側累計面積;②當已知μ、σ和X時先按式u=(X-μ)/σ求得u值,再查表,當μ、σ未知且樣本含量n足夠大時,可用樣本均數X1和標準差S分別代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲線下對稱於0的區間面積相等,如區間(-∞,-1.96)與區間(1.96,∞)的面積相等,④曲線下橫軸上的總面積為100%或1。圖2 正態曲線與標準正態曲線的面積分布正態分佈的應用某些醫學現象,如同質羣體的身高、紅細胞數、血紅蛋白量、膽固醇等,以及實驗中的隨機誤差,呈現為正態或近似正態分佈;有些資料雖為偏態分佈,但經數據變換後可成為正態或近似正態分佈,故可按正態分佈規律處理。

正態分佈面積圖1

正態分佈面積圖2

一般正態分佈與標準正態分佈的區別與聯繫正態分佈也叫常態分佈,是連續隨機變量概率分佈的一種,自然界、人類社會、心理和教育中大量現象均按正態形式分佈,例如能力的高低,學生成績的好壞等都屬於正態分佈。它隨隨機變量的平均數、標準差的大小與單位不同而有不同的分佈形態。標準正態分佈是正態分佈的一種,其平均數和標準差都是固定的,平均數為0,標準差為1。

正態分佈曲線應用

正態分佈綜述

1、估計頻數分佈 一個服從正態分佈的變量只要知道其均數與標準差就可根據公式即可估計任意取值範圍內頻數比例。

[4] 

2、制定參考值範圍(1)正態分佈法 適用於服從正態(或近似正態)分佈指標以及可以通過轉換後服從正態分佈的指標。(2)百分位數法 常用於偏態分佈的指標。表3-1中兩種方法的單雙側界值都應熟練掌握。3、質量控制:為了控制實驗中的測量(或實驗)誤差,常以 作為上、下警戒值,以 作為上、下控制值。這樣做的依據是:正常情況下測量(或實驗)誤差服從正態分佈。/4、正態分佈是許多統計方法的理論基礎。檢驗、方差分析、相關和迴歸分析等多種統計方法均要求分析的指標服從正態分佈。許多統計方法雖然不要求分析指標服從正態分佈,但相應的統計量在大樣本時近似正態分佈,因而大樣本時這些統計推斷方法也是以正態分佈為理論基礎的。

正態分佈頻數分佈

例1.10 某地1993年抽樣調查了100名18歲男大學生身高(cm),其均數=172.70cm,標準差s=4.01cm,①估計該地18歲男大學生身高在168cm以下者佔該地18歲男大學生總數的百分數;②分別求X+-1s、X+-1.96s、X+-2.58s範圍內18歲男大學生佔該地18歲男大學生總數的實際百分數,並與理論百分數比較。本例,μ、σ未知但樣本含量n較大,按式(3.1)用樣本均數X和標準差S分別代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表標準正態曲線下的面積,在表的左側找到-1.1,表的上方找到0.07,兩者相交處為0.1210=12.10%。該地18歲男大學生身高在168cm以下者,約佔總數12.10%。其它計算結果見表3。表3 100名18歲男大學生身高的實際分佈與理論分佈分佈x+-s身高範圍(cm)實際分佈人數實際分佈百分數(%)理論分佈(%)X+-1s168.69~176.716767.0068.27X +-1.96s164.84~180.569595.0095.00X+-2.58s162.35~183.059999.0099.00

正態分佈綜合素質研究

教育統計學統計規律表明,學生的智力水平,包括學習能力,實際動手能力等呈正態分佈。因而正常的考試成績分佈應基本服從正態分佈。考試分析要求繪製出學生成績分佈的直方圖,以“中間高、兩頭低”來衡量成績符合正態分佈的程度。其評價標準認為:考生成績分佈情況直方圖,基本呈正態曲線狀,屬於好,如果略呈正(負)態狀,屬於中等,如果呈嚴重偏態或無規律,就是差的。從概率統計規律看,“正常的考試成績分佈應基本服從正態分佈”是正確的。但是必須考慮人與物的本質不同,以及教育的有所作為可以使“隨機”受到干預,用曲線或直方圖的形狀來評價考試成績就有失偏頗。許多教育專家(如上海顧泠沅、美國布魯姆等)已經通過實踐論證,教育是可以大有作為的,可以做到大多數學生及格,而且多數學生可以得高分,考試成績曲線是偏正態分佈的。但是長期受到“中間高、兩頭低”標準的影響,限制了教師的作為,抑制了多數學生能夠學好的信心。這是很大的誤會。通常正態曲線有一條對稱軸。當某個分數(或分數段)的考生人數最多時,對應曲線的最高點,是曲線的頂點。該分數值在橫軸上的對應點與頂點連接的線段就是該正態曲線的對稱軸。考生人數最多的值是峯值。我們注意到,成績曲線或直方圖實際上很少對稱的,稱之為峯線更合適。

正態分佈醫學參考值

某些醫學現象,如同質羣體的身高、紅細胞數、血紅蛋白量,以及實驗中的隨機誤差,呈現為正態或近似正態分佈;有些指標(變量)雖服從偏態分佈,但經數據轉換後的新變量可服從正態或近似正態分佈,可按正態分佈規律處理。其中經對數轉換後服從正態分佈的指標,被稱為服從對數正態分佈。醫學參考值範圍亦稱醫學正常值範圍。它是指所謂“正常人”的解剖、生理、生化等指標的波動範圍。制定正常值範圍時,首先要確定一批樣本含量足夠大的“正常人”,所謂“正常人”不是指“健康人”,而是指排除了影響所研究指標的疾病和有關因素的同質人羣;其次需根據研究目的和使用要求選定適當的百分界值,如80%,90%,95%和99%,常用95%;根據指標的實際用途確定單側或雙側界值,如白細胞計數過高過低皆屬不正常須確定雙側界值,又如肝功中轉氨酶過高屬不正常須確定單側上界,肺活量過低屬不正常須確定單側下界。另外,還要根據資料的分佈特點,選用恰當的計算方法。常用方法有:(1)正態分佈法:適用於正態或近似正態分佈的資料。雙側界值:X+-u(u)S單側上界:X+u(u)S,或單側下界:X-u(u)S(2)對數正態分佈法:適用於對數正態分佈資料。雙側界值:lg-1[X(lgx)+-u(u)S(lgx)];單側上界:lg-1[X(lgx)+u(u)S(lgx)],或單側下界:lg-1[X(lgx)-u(u)S(lgx)]。常用u值可根據要求由表4查出。(3)百分位數法:常用於偏態分佈資料以及資料中一端或兩端無確切數值的資料。雙側界值:P2.5和P97.5;單側上界:P95,或單側下界:P5。表4常用u值表參考值範圍(%)單側雙側800.8421.282901.2821.645951.6451.960992.3262.576統計的理論基礎:如t分佈、F分佈、分佈都是在正態分佈的基礎上推導出來的,u檢驗也是以正態分佈為基礎的。此外,t分佈、二項分佈、Poisson分佈的極限為正態分佈,在一定條件下,可以按正態分佈原理來處理。概率論中最重要的分佈正態分佈有極其廣泛的實際背景,生產與科學實驗中很多隨機變量的概率分佈都可以近似地用正態分佈來描述。例如,在生產條件不變的情況下,產品的強力、抗壓強度、口徑、長度等指標;同一種生物體的身長、體重等指標;同一種種子的重量;測量同一物體的誤差;彈着點沿某一方向的偏差;某個地區的年降水量;以及理想氣體分子的速度分量,等等。一般來説,如果一個量是由許多微小的獨立隨機因素影響的結果,那麼就可以認為這個量具有正態分佈(見中心極限定理)。從理論上看,正態分佈具有很多良好的性質 ,許多概率分佈可以用它來近似;還有一些常用的概率分佈是由它直接導出的,例如對數正態分佈、t分佈、F分佈等。主要內涵在聯繫自然、社會和思維的實踐背景下,我們以正態分佈的本質為基礎,以正態分佈曲線及面積分布圖為表徵(以後談及正態分佈及正態分佈論就要浮現此圖),進行抽象與提升,抓住其中的主要哲學內涵,歸納正態分佈論(正態哲學)的主要內涵如下:整體論正態分佈啓示我們,要用整體的觀點來看事物。“系統的整體觀念或總體觀念是系統概念的精髓。” 正態分佈曲線及面積分布圖由基區、負區、正區三個區組成,各區比重不一樣。用整體來看事物才能看清楚事物的本來面貌,才能得出事物的根本特性。不能只見樹木不見森林,也不能以偏概全。此外整體大於部分之和,在分析各部分、各層次的基礎上,還要從整體看事物,這是因為整體有不同於各部分的特點。用整體觀來看世界,就是要立足在基區,放眼負區和正區。要看到主要方面,還要看到次要方面,既要看到積極的方面還要看到事物消極的一面,看到事物前進的一面還要看到落後的一面。片面看事物必然看到的是偏態或者是變態的事物,不是真實的事物本身。重點論正態分佈曲線及面積分布圖非常清晰的展示了重點,那就是基區佔68.27%,是主體,要重點抓,此外95%,99%則展示了正態的全面性。認識世界和改造世界一定要抓住重點,因為重點就是事物的主要矛盾,它對事物的發展起主要的、支配性的作用。抓住了重點才能一舉其綱,萬目皆張。事物和現象紛繁複雜,在千頭萬緒中不抓住主要矛盾,就會陷入無限瑣碎之中。由於我們時間和精力的相對有限性,出於效率的追求,我們更應該抓住重點。在正態分佈中,基區佔了主體和重點。如果我們結合20/80法則,我們更可以大膽的把正區也可以看做是重點。發展論聯繫和發展是事物發展變化的基本規律。任何事物都有其產生、發展和滅亡的歷史,如果我們把正態分佈看做是任何一個系統或者事物的發展過程的話,我們明顯的看到這個過程經歷着從負區到基區再到正區的過程。無論是自然、社會還是人類的思維都明顯的遵循這這樣一個過程。準確的把握事物或者事件所處的歷史過程和階段極大的有助於掌握我們對事物、事件的特徵和性質,是我們分析問題,採取對策和解決問題的重要基礎和依據。發展的階段不同,性質和特徵也不同,分析和解決問題的辦法要與此相適應,這就是具體問題具體分析,也是解放思想、實事求是、與時俱樂進的精髓。正態發展的特點還啓示我們,事物發展大都是漸進的和累積的,走漸進發展的道路是事物發展的常態。例如,遺傳是常態,變異是非常態。總之,正態分佈論是科學的世界觀,也是科學的方法論,是我們認識和改造世界的最重要和最根本的工具之一,對我們的理論和實踐有重要的指導意義。以正態哲學認識世界,能更好的認識和把握世界的本質和規律,以正態哲學來改造世界,能更好的在尊重和利用客觀規律,更有效的改造世界。弗朗西斯·高爾頓 [Francis Galton 1822.02.16-1911.01.17],英國探險家、優生學家、心理學家,差異心理學之父,也是心理測量學上生理計量法的創始人。高爾頓對心理學的貢獻,大概可以歸納未差異心理學、心理測量的量化和實驗心理學三方面:心理學研究之量化,始自高爾頓。他發明了許多感官和運動的測試,並以數量代表所測得的心理特質之差異。他認為人的所有特質,不管是物質的還是精神的,最終都可以定量敍述,這是實現人類科學的必要條件,故最先應用統計法處理心理學研究資料,重視數據的平均數與高中差數。他收集了大量資料證明人的心理特質在人口中的分佈如同身高、體重那樣符合正態分佈曲線。他在論及遺傳對個體差異的影響時,為相關係數的概念作了初步提示。如他研究了“居間親”和其成年子女的身高關係,發現居間親和其子女的身高有正相關,即父母的身材較高,其子女的身材也有較高的趨勢。反之,父母的身材較低,其子女也有較矮的趨勢。同時發現子女的身高常與其父母略有差別,而呈現“回中”趨勢,即離開其父母的身高數,而回到一般人身高的平均數。智力、能力理查德·赫恩斯坦 [(Richard J. Herrnstein 1930.05.20-1994.09.13),美國比較心理學家]和默瑞(Charles Murray)合著《正態曲線》一書而聞名,在該書中他們指出人們的智力呈正態分佈。智力主要是遺傳的並因種族的不同而不同,猶太人、東亞人的智商最高,其次為白人,表現最差的是黑人、西班牙裔人。他們檢討了數十年來心理計量學與政策學的研究成果,發現美國社會輕忽了智商的影響愈變愈大的趨勢。他們力圖證明,美國現行的偏向於以非洲裔和南美裔為主的低收入階層的社會政策,如職業培訓、大學教育等,完全是在浪費資源。他們利用應募入伍者的測試結果證明,黑人青年的智力低於白人和黃種人;而且,這些人的智力已經定型,對他們進行培訓收效甚微。因此,政府應該放棄對這部分人的教育,把錢用於包括所有種族在內的啓蒙教育,因為孩子的智力尚未定型,開發潛力大。由於此書涉及黑人的智力問題,一經出版便受到來自四面八方的圍攻。

參考資料

1.

  

楊松林主編,文科數學,蘇州大學出版社,2015.01,第107頁

2.

  

Shaou-Gang Miaou; Jin-Syan Chou. 《Fundamentals of probability and statistics》. 高立圖書. 2012: 第147頁.

3.

  

胡泳. 正態分佈[J]. 商務週刊, 2009 (24): 94-94.

4.

  

Anderson T W, Anderson T W, Anderson T W, et al. An introduction to multivariate statistical analysis[M]. New York: Wiley, 1958.

圖集

正態分佈的概述圖(1張)

詞條統計

瀏覽次數:次

編輯次數:89次歷史版本

最近更新:

傲世风云H再起

(2023-11-14)

1

歷史發展

2

定理

3

定義

3.1

一維正態分佈

3.2

標準正態分佈

4

性質

5

分佈曲線

5.1

圖形特徵

5.2

參數含義

5.3

面積分布

6

研究過程

7

曲線應用

7.1

綜述

7.2

頻數分佈

7.3

綜合素質研究

7.4

醫學參考值

百科協議    隱私協議    意見反饋

Beta

進入詞條

清除歷史記錄關閉

反饋

登錄

概率统计-方差与正态分布(高斯分布)_高斯分布方差-CSDN博客

>

概率统计-方差与正态分布(高斯分布)_高斯分布方差-CSDN博客

概率统计-方差与正态分布(高斯分布)

Hello_Ray

于 2019-08-05 23:37:32 发布

阅读量4.2w

收藏

49

点赞数

22

分类专栏:

数学逻辑

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/Hello_Ray/article/details/96910606

版权

数学逻辑

专栏收录该内容

4 篇文章

0 订阅

订阅专栏

方差

方差表示的是一组数据相对于平均数

μ

\mu

μ的离散程度

在数据统计中,大部分情况下都是不能对总体的数据进行统计。比如统计一批键盘使用寿命,如果键盘都去做寿命测试,那都测坏了没法卖钱养家了。 此时需要从一批键盘中随机挑选一些键盘去代表总数进行测试。即抽取一些样本,对样本的计算结果去估计总体的一些情况。

平均数的计算公式

μ

\mu

μ =

i

=

1

n

x

i

n

\frac {\sum_{i=1}^n x_i} {n}

n∑i=1n​xi​​ , 样本的平均数和总体的平均数求法一致的;

总体方差的计算公式

σ

2

\sigma^2

σ2 =

i

=

1

n

(

x

i

μ

)

2

n

\frac{ {\sum_{i=1}^n} {(x_i - \mu )^2} } {n}

n∑i=1n​(xi​−μ)2​ ;

样本方差计算公式

σ

2

\sigma^2

σ2 =

i

=

1

n

(

x

i

μ

)

2

n

1

\frac{ {\sum_{i=1}^n} {(x_i - \mu )^2} } {n-1}

n−1∑i=1n​(xi​−μ)2​ 。

之所以分母是n-1,在样本数据足够大且无异常数据的情况下,分母可以为n 。 结论:样本估计的方差是总体方差的

n

1

n

\frac {n−1} {n}

nn−1​倍,样本方差的期望是总体方差的一个无偏估计 。 无偏估计:是多次随机取样本计算,此时样本就会无限接近总体计算值,这个过程就是无偏估计。

n

n

1

S

2

\frac {n} {n-1}S^2

n−1n​S2 =

n

n

1

\frac {n} {n-1}

n−1n​

i

=

1

n

(

x

i

μ

)

2

n

\frac {\sum_{i=1}^n (x_i - \mu)^2} {n}

n∑i=1n​(xi​−μ)2​ =

i

=

1

n

(

x

i

μ

)

2

n

1

\frac {\sum_{i=1}^n (x_i - \mu)^2} {n-1}

n−1∑i=1n​(xi​−μ)2​

正态分布(高斯分布)

正态分布,常态分布,高斯分布在不同的文章中会有不同的说法,他们的意义都是一样的。 通过上面的公式, 方差表示的是,观察数据偏离中心趋势(就是平均数)的离散程度。平均数表示观察数据的一般化情况。 知道观察数据的一般化情况和观察数据离散程度,那么就能得出很多特性了。 比如在平均数左右区间范围内,通过这个区间范围与

σ

\sigma

σ 标准差进行比较,就能得出对应的概率是多少,如果这种方式放到计算机中求一些大于某个数的概率是多少,计算机算法复杂度将会降到O(1)。由此就可以引出正态分布这个利器了,正态分布是前人已经整理好的东西,我们直接使用其结论解决问题就可以了。

正态分布的公式

f

(

x

)

f(x)

f(x)

=

=

=

1

σ

2

π

\frac{1} {\sigma \sqrt{2 \pi} }

σ2π

​1​

e

(

x

μ

)

2

2

σ

2

e^{- \frac {(x-\mu)^2} {2 \sigma^2}}

e−2σ2(x−μ)2​ 也可以表示成

f

(

x

)

f(x)

f(x)

=

=

=

1

σ

2

π

\frac{1} {\sigma \sqrt{2 \pi} }

σ2π

​1​ exp{

(

x

μ

)

2

2

σ

2

{- \frac {(x-\mu)^2} {2 \sigma^2}}

−2σ2(x−μ)2​ } 。

得到了计算公式,标准差

σ

\sigma

σ 为 2,平均数为

μ

\mu

μ 为 0。得到如下图。

正态分布高的意义

之前一直好奇,正态分布图像的高是什么意思。可以通过计算得出,根据上面已知的

σ

\sigma

σ和

μ

\mu

μ,带入公式,可以的出

f

(

0

)

f(0)

f(0)等于 0.19947114020071635 。 那么高的意义是什么呢: 正态分布在计算概率密度时候,是根据距离中心值(平均值)的距离,然后求出对应图像的面积即是对应的概率; 如上所述,既然是求得面积得出对应的概率值。有了与中位值的距离,也就是宽。那么也应该需要有高。这里的高就是正态分布曲线存在的意义; 有时候离散程度(

σ

\sigma

σ 标准差)大一点,那么这个纵轴就需要配合着降低点高度。因为图形面积(概率密度)要保证在距离中心位置(

μ

\mu

μ平均数)的

σ

\sigma

σ标准差 范围内是一个固定值;这里也是体现正态分布纵轴(高度)的意义。 从正态分布的特性中,都知道,在距离一个 若干倍的

σ

\sigma

σ 范围内概率 是 固定值 。

下图可以看出,在若干倍的

σ

\sigma

σ 范围内的概率分布。所以正态分布都是前人准备好的,根据横轴就能得出概率密度了。

正态分布函数与函数积分 Java代码实现

为了能够快速验证,把Java代码贴出来。 normfun是正态分布函数

f

(

x

)

f(x)

f(x)

=

=

=

1

σ

2

π

\frac{1} {\sigma \sqrt{2 \pi} }

σ2π

​1​ exp{

(

x

μ

)

2

2

σ

2

{- \frac {(x-\mu)^2} {2 \sigma^2}}

−2σ2(x−μ)2​ } 的代码。

代码的mu变量是公式中的

μ

\mu

μ 平均数,sigma变量是公式中的

σ

\sigma

σ 标准差,x就是变量中的x。

private static double normal(double x, double mu, double sigma) {

double denominator = Math.pow(Math.E, -(((x - mu) * (x - mu)) / (2 * sigma * sigma)));

double numerator = sigma * Math.sqrt(Math.PI * 2);

return denominator / numerator;

}

验证正态分布函数是否满足性质,需要对正态分布函数求定积分,如下代码贴出了正态分布函数的定积分代码。

private static double calculate(double upperLimit, double lowerLimit) {

double distence = 0.01;

double count = (upperLimit - lowerLimit) / distence;

double sum = 0;

for (double i = 0; i < count; i++) {

double calSum = lowerLimit + distence * i;

double fxHigh = normal(calSum, 0, 2);

double fxSquare = fxHigh * distence;

sum += fxSquare;

}

return sum;

}

水平原因,错误难以避免,希望批评并不吝指出,谢谢!

优惠劵

Hello_Ray

关注

关注

22

点赞

49

收藏

觉得还不错?

一键收藏

知道了

2

评论

概率统计-方差与正态分布(高斯分布)

在统计中,方差真正的使用是先算样本方差∑i=0n(xi−μ)x2+1\frac{{\sum_{i=0}^n}{(x_i - \mu )}} {x^2+1}x2+1∑i=0n​(xi​−μ)​

复制链接

扫一扫

专栏目录

2 条评论

您还未登录,请先

登录

后发表或查看评论

Hello_Ray

CSDN认证博客专家

CSDN认证企业博客

码龄9年

暂无认证

128

原创

3万+

周排名

33万+

总排名

51万+

访问

等级

4699

积分

145

粉丝

185

获赞

76

评论

621

收藏

私信

关注

热门文章

解决Failure to find com.xx.jar in http://maven.aliyun.com/ was cached in the local repository

64843

概率统计-方差与正态分布(高斯分布)

42895

解决 clion运行时出现 executable is not specified的问题

20293

RC电路一阶线性微分方程

17421

java中使用线程池并发执行方法

13910

分类专栏

笔记

3篇

相关算法实现

2篇

MCU开发基础

5篇

Java开发相关笔记

12篇

数据分析与存储

2篇

服务器运维脚本

3篇

移动端安全

6篇

安全的基础知识

7篇

电路原理

4篇

mybatis源码解析

5篇

代码生成

1篇

数学逻辑

4篇

正则表达式

4篇

文件I/O

6篇

linux运维

15篇

js脚本笔记

13篇

设计模式与代码开发套路

2篇

最新评论

springboot拦截器处理返回false请求

年少有违:

是这样的 目前网上多数没有说在返回false情况下应该如何处理 一搜全是废文

解决 Linux / Unix – crontab: no crontab for user using an empty one error and solution

菊乐酸奶不酸呀~:

谢谢,解决了

springboot拦截器处理返回false请求

liulanger113:

我这边按照你的写法,在浏览器上没有看到这个请求网络

配置xming xshell clion在ubuntu上开发

qq_44637112:

我想要在window下用clion调试linux下的gui程序也可以用这种方法吗

配置xming xshell clion在ubuntu上开发

qq_44637112:

请问clion是安装完window还是linux呢

您愿意向朋友推荐“博客详情页”吗?

强烈不推荐

不推荐

一般般

推荐

强烈推荐

提交

最新文章

torch中数组使用技巧

双边带抑制载波传输

vs code一键编译运行cmake项目

2022年5篇

2021年20篇

2020年21篇

2019年41篇

2018年40篇

2015年1篇

目录

目录

分类专栏

笔记

3篇

相关算法实现

2篇

MCU开发基础

5篇

Java开发相关笔记

12篇

数据分析与存储

2篇

服务器运维脚本

3篇

移动端安全

6篇

安全的基础知识

7篇

电路原理

4篇

mybatis源码解析

5篇

代码生成

1篇

数学逻辑

4篇

正则表达式

4篇

文件I/O

6篇

linux运维

15篇

js脚本笔记

13篇

设计模式与代码开发套路

2篇

目录

评论 2

被折叠的  条评论

为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

祝福语

请填写红包祝福语或标题

红包数量

红包个数最小为10个

红包总金额

红包金额最低5元

余额支付

当前余额3.43元

前往充值 >

需支付:10.00元

取消

确定

下一步

知道了

成就一亿技术人!

领取后你会自动成为博主和红包主的粉丝

规则

hope_wisdom 发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额

0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

机器学习中的数学——常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)_高斯分布的数据-CSDN博客

>

机器学习中的数学——常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)_高斯分布的数据-CSDN博客

机器学习中的数学——常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)

von Neumann

已于 2022-02-13 13:56:38 修改

阅读量2w

收藏

96

点赞数

18

分类专栏:

机器学习中的数学

文章标签:

机器学习

深度学习

概率论

正态分布

高斯分布

于 2021-10-03 16:03:49 首次发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/hy592070616/article/details/120594984

版权

机器学习中的数学

专栏收录该内容

112 篇文章

711 订阅

订阅专栏

分类目录:《机器学习中的数学》总目录 相关文章: · 常用概率分布(一):伯努利分布(Bernoulli分布) · 常用概率分布(二):范畴分布(Multinoulli分布) · 常用概率分布(三):二项分布(Binomial分布) · 常用概率分布(四):均匀分布(Uniform分布) · 常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布) · 常用概率分布(六):指数分布(Exponential分布) · 常用概率分布(七): 拉普拉斯分布(Laplace分布) · 常用概率分布(八):狄拉克分布(Dirac分布) · 常用概率分布(九):经验分布(Empirical分布) · 常用概率分布(十):贝塔分布(Beta分布) · 常用概率分布(十一):狄利克雷分布(Dirichlet分布) · 常用概率分布(十二):逻辑斯谛分布(Logistic 分布)

实数上最常用的分布就是正态分布,也称为高斯分布:

N

(

x

μ

,

σ

2

)

=

1

2

π

σ

2

e

(

x

μ

)

2

2

σ

2

N(x|\mu,\sigma^2)=\sqrt{\frac{1}{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

N(x∣μ,σ2)=2πσ21​

​e−2σ2(x−μ)2​

其中:

E

[

x

]

=

μ

E[x]=\mu

E[x]=μ

V

a

r

(

x

)

=

p

i

σ

2

Var(x)=pi\sigma^2

Var(x)=piσ2

正态分布由两个参数控制,

μ

R

\mu\in R

μ∈R和

σ

(

0

,

)

\sigma\in(0,\infty)

σ∈(0,∞)。参数

μ

\mu

μ给出了中心峰值的坐标,这也是分布的均值:

E

[

x

]

=

μ

E[x]=\mu

E[x]=μ。分布的标准差用

σ

\sigma

σ表示,方差用

σ

2

\sigma^2

σ2表示。

当我们要对概率密度函数求值时,我们需要对

σ

2

\sigma^2

σ2取倒数。当我们需要经常对不同参数下的概率密度函数求值时,一种更高效的参数化分布的方式是使用参数

β

(

0

,

)

\beta\in(0,\infty)

β∈(0,∞),来控制分布的精度:

N

(

x

μ

,

β

1

)

=

β

2

π

e

1

2

β

(

x

μ

)

2

N(x|\mu,\beta^{-1})=\sqrt{\frac{\beta}{2\pi}}e^{-\frac{1}{2}\beta(x-\mu)^2}

N(x∣μ,β−1)=2πβ​

​e−21​β(x−μ)2

采用正态分布在很多应用中都是一个明智的选择。当我们由于缺乏关于某个实数上分布的先验知识而不知道该选择怎样的形式时,正态分布是默认的比较好的选择,其中有两个原因:

我们想要建模的很多分布的真实情况是比较接近正态分布的。中心极限定理说明很多独立随机变量的和近似服从正态分布。这意味着在实际中,很多复杂系统都可以被成功地建模成正态分布的噪声,即使系统可以被分解成一些更结构化的部分。 在具有相同方差的所有可能的概率分布中,正态分布在实数上具有最大的不确定性。因此,我们可以认为正态分布是对模型加入的先验知识量最少的分布。

正态分布可以推广到

R

n

R^n

Rn)。它的参数是一个正定对称矩阵

Σ

\Sigma

Σ:

N

(

x

μ

,

Σ

)

=

1

(

2

π

)

n

det

(

Σ

)

e

1

2

(

x

μ

)

T

Σ

1

(

x

μ

)

N(x|\mu,\Sigma)=\sqrt{\frac{1}{(2\pi)^n\text{det}(\Sigma)}}e^{-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)}

N(x∣μ,Σ)=(2π)ndet(Σ)1​

​e−21​(x−μ)TΣ−1(x−μ)

参数

μ

\mu

μ仍然表示分布的均值,只不过现在是向量值。参数

Σ

\Sigma

Σ给出了分布的协方差矩阵。和单变量的情况类似,当我们希望对很多不同参数下的概率密度函数多次求值时,协方差矩阵并不是一个很高效的参数化分布的方式,因为对概率密度函数求值时需要对

Σ

\Sigma

Σ求逆。我们可以使用一个精度矩阵

β

\beta

β进行替代:

N

(

x

μ

,

β

1

)

=

det

(

β

)

(

2

π

)

n

e

1

2

(

x

μ

)

T

β

(

x

μ

)

N(x|\mu,\beta^{-1})=\sqrt{\frac{\text{det}(\beta)}{(2\pi)^n}}e^{-\frac{1}{2}(x-\mu)^T\beta(x-\mu)}

N(x∣μ,β−1)=(2π)ndet(β)​

​e−21​(x−μ)Tβ(x−μ)

我们常常把协方差矩阵固定成一个对角阵。一个更简单的版本是各向同性高斯分布,它的协方差矩阵是一个标量乘以单位阵。

关注博主即可阅读全文

优惠劵

von Neumann

关注

关注

18

点赞

96

收藏

觉得还不错?

一键收藏

打赏

知道了

0

评论

机器学习中的数学——常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)

实数上最常用的分布就是正态分布,也称为高斯分布:N(x∣μ,σ2)=12πσ2e−(x−μ)22σ2N(x|\mu,\sigma^2)=\sqrt{\frac{1}{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}N(x∣μ,σ2)=2πσ21​​e−2σ2(x−μ)2​其中:E[x]=μE[x]=\muE[x]=μVar(x)=piσ2Var(x)=pi\sigma^2Var(x)=piσ2正态分布由两个参数控制,μ∈R\mu\in Rμ∈R和σ

复制链接

扫一扫

专栏目录

C++按照正态分布来排列整型数组元素

12-26

题目要求如下:

给定一个数组input[],

如果数组长度n为奇数,则将数组中最大的元素放到output[]数组最中间的位置,

如果数组长度n为偶数,则将数组中最大的元素放到 output[] 数组中间两个位置偏右的那个位置上,

然后再按从大到小的顺序,依次在第一个位置的两边,按照一左一右的顺序,依次存放剩下的数。

这种处理后结果,如果按照元素的值表示一种分布的图形的话,那绘制后的图形应该是正态分布。

关于正态分布:

正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方

在python中画正态分布图像的实例

12-26

1.正态分布简介

正态分布(normal distribtution)又叫做高斯分布(Gaussian distribution),是一个非常重要也非常常见的连续概率分布。正态分布大家也都非常熟悉,下面做一些简单的介绍。

假设随机变量XX服从一个位置参数为μμ、尺度参数为σσ的正态分布,则可以记为:

而概率密度函数为

2.在python中画正态分布直方图

先直接上代码

import numpy as np

import matplotlib.mlab as mlab

import matplotlib.pyplot as plt

def demo1():

mu ,sigma = 0,

参与评论

您还未登录,请先

登录

后发表或查看评论

机器学习 - 正态数据分布(北大大佬整理)

最新发布

th8763的博客

12-26

22

在概率论中,在数学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)提出了这种数据分布的公式之后,这种数据分布被称为正态数据分布或高斯数据分布。从直方图中可以看到,大多数值都在 4.0 到 6.0 之间,最高值大约是 5.0。方法创建的数组(具有 100000 个值)绘制具有 100 栏的直方图。在上一章中,我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。在本章中,我们将学习如何创建一个将值集中在给定值周围的数组。注释:由于正态分布图具有钟形的特征形状,因此也称为钟形曲线。

double_Gaussian_model_高斯分布_双高斯_双高斯分布_

10-01

简单的双高斯分布曲线,绘制双高斯分布曲线。

Python数据可视化实现正态分布(高斯分布)

12-26

正态分布(Normal distribution)又成为高斯分布(Gaussian distribution)

若随机变量X服从一个数学期望为、标准方差为的高斯分布,记为:

则其概率密度函数为:

正态分布的期望值决定了其位置,其标准差决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是的正态分布:

概率密度函数

 

 

代码实现:

# Python实现正态分布

# 绘制正态分布概率密度函数

u = 0 # 均值μ

u01 = -2

sig = math.sqrt(0.2) # 标准差δ

sig01 = mat

Gaussian_Gaussian.com_高斯分布_随机变量_源码

10-02

采用中心极限定理产生高斯分布的随机变量,先用C语言生成高斯分布随机数,再用MATLAB仿真。

数学基础--高斯分布详解

积木的笔记

12-24

2万+

正态分布(Normal Distribution),又名高斯分布(Gaussian Distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。约翰·卡尔·弗里德里希·高斯(Johann Carl Friedrich Gauss)是德国著名数学家、物理学家、天文学家、大地测量学家,他是近代数学奠基者之一,被认为是历史上最重要的数学家之一,并享有“数学王子”的美誉。他的头像也被印在以前德国的官方货币(德国马克 10 马克)上,如图 1 所示。

高斯分布&正态分布

热门推荐

YYY_77的博客

07-11

3万+

文章目录高斯分布定义高斯分布意义高斯分布的证明多元高斯分布

高斯分布又叫正态分布,是统计学中最重要的连续概率分布。研究表明,在物理科学和经济学中,大量数据的分布通常是服从高斯分布,所以当我们对数据潜在分布模式不清楚时,可以优先用高斯分布近似或精确描述。

遵循高斯分布的随机变量是假设在给定范围内的任何值,比如某小学学校学生的身高,它可以取任何值,但是会限制在0到2米范围内,这个限制是根据实际生活中强加的,但是在高斯分布中,没有随机变量这个范围限制,可以扩展到整个实数范围内,最终会得到一个很好的平滑曲线,这样的

高斯分布

qq_42148307的博客

02-07

4088

高斯分布又叫正态分布,是统计学中最重要的连续概率分布。研究表明,在物理科学和经济学中,大量数据的分布通常是服从高斯分布,。高斯分布分为一维高斯分布和多维高斯分布。假设一维随机变量X服从高斯分布如下:它的概率密度函数见公式为:。分布的均值决定了图形中心的位置,标准差决定了图像的高度和宽度。标准差大时,曲线呈现出“矮胖”,标准差小时,曲线呈现出“高瘦”。因此通过改变均值和标准差,根据其概率密度函数得到不同的高斯分布,见下图。时,就得到了标准高斯分布。

RL关键概念

csdnqixiaoxin的博客

11-18

2004

本文内容摘录自OpenAI的深度强化学习资源Spinning Up,进入网址。

智能体与环境

强化学习(RL)主要包括智能体(agent)和环境(environment)两部分。在智能体与环境交互的每一步,智能体获取(或部分获取)环境状态的一个观测(observation),并采取一个动作(action)。环境会在智能体作用于它的时候发生变化(或者自己变化)。

智能体会从环境中获得奖励(...

融合高斯分布

Ronnie_Hu的博客

12-18

4111

(一)数据融合

假设两个传感器的测量结果分别为和,对应的标准差分别为和。

如何根据这两组数据得到最优估计?

估计值取为两个传感器测量结果的线性组合,如下所示:

为了获得最优估计值,需要让估计后的方差最小。

将方差对求导数,并令其等于0,有:

解得:

所以,最优估计如下:

(二)融合高斯分布

假设有如下两个高斯分布(即正态分布):

则这两个高斯分布的概率密度函数的乘积为:

方便起见,令:

继续令:

那么,有:

可以看出,位于和之间,比和都

高斯分布、高斯混合模型、EM算法详细介绍及其原理详解

IronmanJay的博客

03-06

3123

今天给大家带来的主要内容包括:高斯分布,高斯混合模型,EM算法。废话不多说,下面就是本文的全部内容了!

高斯(正态)分布、GDA、Mixtures of Gaussian

aicang3370的博客

09-01

169

(原创文章,转载请注明出处!)

高斯分布的密度函数

一元高斯分布:

p(x;μ,σ2)=(1/{sqrt(2π)*σ}) * exp{-(x-μ)2/(2σ2)}

期望:E(X) = μ;方差:D(X) = σ2

二元高斯分布:

p(x1,x2;μ1,μ2,σ12,σ22)={ 1 / [2π*σ1σ2*sqrt(1-ρ2)] } * exp{ [(...

机器学习中的高斯分布

qq_43753525的博客

12-22

1050

文章目录一、高斯分布的概率密度函数二、一元高斯分布的极大似然估计2.1 μMLE,σMLE\mu_{MLE},\sigma_{MLE}μMLE​,σMLE​ 的求解2.2 验证 μMLE,σMLE\mu_{MLE},\sigma_{MLE}μMLE​,σMLE​ 的无偏性三、多元高斯分布3.1 马氏距离3.2 (x−μ)TΣ−1(x−μ)(x-\mu)^T\Sigma^{-1}(x-\mu)(x−μ)TΣ−1(x−μ) 的求解3.3 实际应用过程的问题四、联合分布 -> 边缘分布 + 条件分布4.1

14-高斯分布基础知识

scar2016的博客

05-15

1150

文章目录1.高斯分布参数估计/样本数据定义2.极大似然法求μMLE,σMLE2\mu_{MLE},\sigma^2_{MLE}μMLE​,σMLE2​2.1 L(θ)表达式L(\theta)表达式L(θ)表达式2.2 极大似然法求μMLE\mu_{MLE}μMLE​2.3无偏估计μMLE\mu_{MLE}μMLE​2.4 极大似然法求σMLE2\sigma^2_{MLE}σMLE2​2.5 有偏估计σMLE2\sigma^2_{MLE}σMLE2​

1.高斯分布参数估计/样本数据定义

定义数据样本D={(x

高斯分布(正态分布)详解

qq_37346140的博客

08-23

4635

高斯分布的概念详解以及通俗易懂解释、实际应用等。

高斯分布-笔记(1)

shouhuxianjian的专栏

03-28

4109

1 -单变量高斯分布单变量高斯分布概率密度函数定义为:

p(x)=12πσ−−−√exp{−12(x−μσ)2}(1.1)p(x)=\frac{1}{\sqrt{2\pi\sigma}}exp\{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2\} \tag{1.1}

式中μ\mu为随机变量xx的期望,σ2\sigma^2为xx的方差,σ\sigma称为标准差:

高斯分布与正态分布

元直的博客

12-04

1万+

高斯分布(Gaussian distribution)

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影...

matlab实现利用高斯Copula函数将独立的标准正态变为相关的正态分布

05-25

在Matlab中,可以使用copulafit和copularnd函数实现利用高斯Copula函数将独立的标准正态变为相关的正态分布。

具体步骤如下:

1. 生成独立的标准正态分布随机变量。可以使用Matlab中的randn函数实现。

2. 指定相关系数矩阵。相关系数矩阵可以通过定义相关系数矩阵或者协方差矩阵来获得。在这里我们假设有两个随机变量,它们的相关系数为0.5。

3. 将相关系数矩阵转化为高斯Copula函数的参数。可以使用Matlab中的copulaparam函数实现。

4. 使用copulafit函数拟合高斯Copula函数,并将独立的标准正态分布随机变量转化为相关的正态分布随机变量。

5. 使用copularnd函数生成相关的正态分布随机变量。

下面是一个简单的示例代码:

```matlab

% 生成两个独立的标准正态分布随机变量

x = randn(1000,1);

y = randn(1000,1);

% 指定相关系数矩阵

rho = 0.5;

sigma = [1 rho; rho 1];

% 将相关系数矩阵转化为高斯Copula函数的参数

theta = copulaparam('Gaussian',sigma);

% 使用copulafit函数拟合高斯Copula函数,并将独立的标准正态分布随机变量转化为相关的正态分布随机变量

u = copularnd('Gaussian',theta,1000);

% 将转化后的随机变量绘制成散点图

scatter(u(:,1),u(:,2),'filled')

```

运行上述代码后可以得到转化后的随机变量的散点图,其中两个变量之间的相关系数为0.5。

“相关推荐”对你有帮助么?

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交

von Neumann

CSDN认证博客专家

CSDN认证企业博客

码龄12年

人工智能领域优质创作者

644

原创

464

周排名

609

总排名

975万+

访问

等级

1万+

积分

4万+

粉丝

5459

获赞

331

评论

1万+

收藏

私信

关注

热门文章

博客目录与概览

414647

Hadoop与Spark等大数据框架介绍

408406

深入理解机器学习——基于决策树(Decision Tree)的模型:分类树和回归树

309920

快速入门Scala(三):循环

280652

快速入门Scala(五):方法与函数

260670

分类专栏

深入理解机器学习

27篇

深入理解深度学习

58篇

深入理解强化学习

59篇

深入理解联邦学习

7篇

机器学习中的数学

112篇

自然语言处理从入门到应用

23篇

大模型从入门到应用

60篇

知识图谱从入门到应用

13篇

深入浅出TensorFlow2函数

25篇

深入浅出Pytorch函数

47篇

深入浅出PaddlePaddle函数

15篇

算法设计与分析

49篇

大数据与数据科学

17篇

Python爬虫从入门到精通

23篇

系统学习Python

94篇

快速入门Scala

8篇

人工智能与大数据面试指南

4篇

最新评论

机器学习中的数学——激活函数(四):Leaky ReLU函数

von Neumann:

输入小于0的时候,输出就是负的,只是斜率非常小,图片不明显而已

机器学习中的数学——距离定义(二十六):Wasserstein距离(Wasserstei Distance)/EM距离(Earth-Mover Distance)

M3l0dy:

我的理解是,p转化为q的方式,每一种方式就对应着一种联合分布

机器学习中的数学——激活函数(四):Leaky ReLU函数

weixin_46396581:

输入小于0的时候,输出也应该是负的

算法设计与分析——动态规划(二):钢条切割

zmisnb666:

第一种思路有重复的情况。第二种思路,我是这样理解的,因为观察所有的切割方法,你会发现,总有一个片段是不切的,那就可以按照这个不切的片段从小到大开始找,这样就没有重复的情况了,emm我理解第二种思路但就是不知道怎么说清楚希望能对你有帮助

大模型从入门到应用——LangChain:回调函数(Callbacks)]

von Neumann:

检查一下callback_manager 这个不应该为None的

您愿意向朋友推荐“博客详情页”吗?

强烈不推荐

不推荐

一般般

推荐

强烈推荐

提交

最新文章

系统学习Python——装饰器:“私有“和“公有“属性案例-[装饰器参数、状态保持和外层作用域]

系统学习Python——装饰器:“私有“和“公有“属性案例-[继承与委托]

系统学习Python——装饰器:“私有“和“公有“属性案例-[实现私有属性的代码主体]

2024

03月

5篇

02月

11篇

01月

33篇

2023年303篇

2022年122篇

2021年114篇

2019年46篇

2018年10篇

目录

目录

分类专栏

深入理解机器学习

27篇

深入理解深度学习

58篇

深入理解强化学习

59篇

深入理解联邦学习

7篇

机器学习中的数学

112篇

自然语言处理从入门到应用

23篇

大模型从入门到应用

60篇

知识图谱从入门到应用

13篇

深入浅出TensorFlow2函数

25篇

深入浅出Pytorch函数

47篇

深入浅出PaddlePaddle函数

15篇

算法设计与分析

49篇

大数据与数据科学

17篇

Python爬虫从入门到精通

23篇

系统学习Python

94篇

快速入门Scala

8篇

人工智能与大数据面试指南

4篇

目录

评论

被折叠的  条评论

为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

祝福语

请填写红包祝福语或标题

红包数量

红包个数最小为10个

红包总金额

红包金额最低5元

余额支付

当前余额3.43元

前往充值 >

需支付:10.00元

取消

确定

下一步

知道了

成就一亿技术人!

领取后你会自动成为博主和红包主的粉丝

规则

hope_wisdom 发出的红包

打赏作者

von Neumann

您的赞赏是我创作最大的动力~

¥1

¥2

¥4

¥6

¥10

¥20

扫码支付:¥1

获取中

扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额

0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

什么是正态分布(Z)

什么是正态分布(Z)

RT

主页/数学/概率/正态分布

正态分布

正态分布是连续概率分布。也称为高斯分布。

正态分布密度函数f(z)被称为钟形曲线,因为它具有类似于钟形的形状。

标准正态分布表用于查找f(z)函数下的面积,以便找到指定分布范围的概率。

正态分布函数

标准正态分布函数

标准正态分布表

正态分布函数

当随机变量X具有正态分布时,

正态分布的概率密度函数和累积分布函数:

 

概率密度函数(pdf)

概率密度函数由下式给出:

X是随机变量。

μ是平均值。

σ是标准偏差(std)值。

e = 2.7182818 ...恒定。

π= 3.1415926 ...恒定

 

累积分布函数

累积分布函数由下式给出:

X是随机变量。

μ是平均值。

σ是标准偏差(std)值。

e = 2.7182818 ...恒定。

π= 3.1415926 ...恒定

标准正态分布函数

什么时候

然后是标准正态分布的概率密度函数和累积分布函数:

概率密度函数

累积分布函数

标准正态分布表

z

Φ(z)

φ(z)

0.00

0.5000

0.3989

0.01

0.5040

0.3989

0.02

0.5080

0.3989

0.03

0.5120

0.3988

0.04

0.5160

0.3986

0.05

0.5199

0.3984

0.06

0.5239

0.3982

0.07

0.5279

0.3980

0.08

0.5319

0.3977

0.09

0.5359

0.3973

0.10

0.5398

0.3970

0.11

0.5438

0.3965

0.12

0.5478

0.3961

0.13

0.5517

0.3956

0.14

0.5557

0.3951

0.15

0.5596

0.3945

0.16

0.5636

0.3939

0.17

0.5675

0.3932

0.18

0.5714

0.3925

0.19

0.5753

0.3918

0.20

0.5793

0.3910

0.21

0.5832

0.3902

0.22

0.5871

0.3894

0.23

0.5910

0.3885

0.24

0.5948

0.3876

0.25

0.5987

0.3867

0.26

0.6026

0.3857

0.27

0.6064

0.3847

0.28

0.6103

0.3836

0.29

0.6141

0.3825

0.30

0.6179

0.3814

0.31

0.6217

0.3802

0.32

0.6255

0.3790

0.33

0.6293

0.3778

0.34

0.6331

0.3765

0.35

0.6368

0.3752

0.36

0.6406

0.3739

0.37

0.6443

0.3725

0.38

0.6480

0.3712

0.39

0.6517

0.3697

0.40

0.6554

0.3683

0.41

0.6591

0.3668

0.42

0.6628

0.3653

0.43

0.6664

0.3637

0.44

0.6700

0.3621

0.45

0.6736

0.3605

0.46

0.6772

0.3589

0.47

0.6808

0.3572

0.48

0.6844

0.3555

0.49

0.6879

0.3538

0.50

0.6915

0.3521

0.51

0.6950

0.3503

0.52

0.6985

0.3485

0.53

0.7019

0.3467

0.54

0.7054

0.3448

0.55

0.7088

0.3429

0.56

0.7123

0.3410

0.57

0.7157

0.3391

0.58

0.7190

0.3372

0.59

0.7224

0.3352

0.60

0.7257

0.3332

0.61

0.7291

0.3312

0.62

0.7324

0.3292

0.63

0.7357

0.3271

0.64

0.7389

0.3251

0.65

0.7422

0.3230

0.66

0.7454

0.3209

0.67

0.7486

0.3187

0.68

0.7517

0.3166

0.69

0.7549

0.3144

0.70

0.7580

0.3123

0.71

0.7611

0.3101

0.72

0.7642

0.3079

0.73

0.7673

0.3056

0.74

0.7704

0.3034

0.75

0.7734

0.3011

0.76

0.7764

0.2989

0.77

0.7794

0.2966

0.78

0.7823

0.2943

0.79

0.7852

0.2920

0.80

0.7881

0.2897

0.81

0.7910

0.2874

0.82

0.7939

0.2850

0.83

0.7967

0.2827

0.84

0.7995

0.2803

0.85

0.8023

0.2780

0.86

0.8051

0.2756

0.87

0.8078

0.2732

0.88

0.8106

0.2709

0.89

0.8133

0.2685

0.90

0.8159

0.2661

0.91

0.8186

0.2637

0.92

0.8212

0.2613

0.93

0.8238

0.2589

0.94

0.8264

0.2565

0.95

0.8289

0.2541

0.96

0.8315

0.2516

0.97

0.8340

0.2492

0.98

0.8365

0.2468

0.99

0.8389

0.2444

1.00

0.8413

0.2420

1.01

0.8438

0.2396

1.02

0.8461

0.2371

1.03

0.8485

0.2347

1.04

0.8508

0.2323

1.05

0.8531

0.2299

1.06

0.8554

0.2275

1.07

0.8577

0.2251

1.08

0.8599

0.2227

1.09

0.8621

0.2203

1.10

0.8643

0.2179

1.11

0.8665

0.2155

1.12

0.8686

0.2131

1.13

0.8708

0.2107

1.14

0.8729

0.2083

1.15

0.8749

0.2059

1.16

0.8770

0.2036

1.17

0.8790

0.2012

1.18

0.8810

0.1989

1.19

0.8830

0.1965

1.20

0.8849

0.1942

1.21

0.8869

0.1919

1.22

0.8888

0.1895

1.23

0.8907

0.1872

1.24

0.8925

0.1849

1.25

0.8944

0.1826

1.26

0.8962

0.1804

1.27

0.8980

0.1781

1.28

0.8997

0.1758

1.29

0.9015

0.1736

1.30

0.9032

0.1714

1.31

0.9049

0.1691

1.32

0.9066

0.1669

1.33

0.9082

0.1647

1.34

0.9099

0.1626

1.35

0.9115

0.1604

1.36

0.9131

0.1582

1.37

0.9147

0.1561

1.38

0.9162

0.1539

1.39

0.9177

0.1518

1.40

0.9192

0.1497

1.41

0.9207

0.1476

1.42

0.9222

0.1456

1.43

0.9236

0.1435

1.44

0.9251

0.1415

1.45

0.9265

0.1394

1.46

0.9279

0.1374

1.47

0.9292

0.1354

1.48

0.9306

0.1334

1.49

0.9319

0.1315

1.50

0.9332

0.1295

1.51

0.9345

0.1276

1.52

0.9357

0.1257

1.53

0.9370

0.1238

1.54

0.9382

0.1219

1.55

0.9394

0.1200

1.56

0.9406

0.1182

1.57

0.9418

0.1163

1.58

0.9429

0.1145

1.59

0.9441

0.1127

1.60

0.9452

0.1109

1.61

0.9463

0.1092

1.62

0.9474

0.1074

1.63

0.9484

0.1057

1.64

0.9495

0.1040

1.65

0.9505

0.1023

1.66

0.9515

0.1006

1.67

0.9525

0.0989

1.68

0.9535

0.0973

1.69

0.9545

0.0957

1.70

0.9554

0.0940

1.71

0.9564

0.0925

1.72

0.9573

0.0909

1.73

0.9582

0.0893

1.74

0.9591

0.0878

1.75

0.9599

0.0863

1.76

0.9608

0.0848

1.77

0.9616

0.0833

1.78

0.9625

0.0818

1.79

0.9633

0.0804

1.80

0.9641

0.0790

1.81

0.9649

0.0775

1.82

0.9656

0.0761

1.83

0.9664

0.0748

1.84

0.9671

0.0734

1.85

0.9678

0.0721

1.86

0.9686

0.0707

1.87

0.9693

0.0694

1.88

0.9699

0.0681

1.89

0.9706

0.0669

1.90

0.9713

0.0656

1.91

0.9719

0.0644

1.92

0.9726

0.0632

1.93

0.9732

0.0620

1.94

0.9738

0.0608

1.95

0.9744

0.0596

1.96

0.9750

0.0584

1.97

0.9756

0.0573

1.98

0.9761

0.0562

1.99

0.9767

0.0551

2.00

0.9772

0.0540

2.01

0.9778

0.0529

2.02

0.9783

0.0519

2.03

0.9788

0.0508

2.04

0.9793

0.0498

2.05

0.9798

0.0488

2.06

0.9803

0.0478

2.07

0.9808

0.0468

2.08

0.9812

0.0459

2.09

0.9817

0.0449

2.10

0.9821

0.0440

2.11

0.9826

0.0431

2.12

0.9830

0.0422

2.13

0.9834

0.0413

2.14

0.9838

0.0404

2.15

0.9842

0.0396

2.16

0.9846

0.0387

2.17

0.9850

0.0379

2.18

0.9854

0.0371

2.19

0.9857

0.0363

2.20

0.9861

0.0355

2.21

0.9864

0.0347

2.22

0.9868

0.0339

2.23

0.9871

0.0332

2.24

0.9875

0.0325

2.25

0.9878

0.0317

2.26

0.9881

0.0310

2.27

0.9884

0.0303

2.28

0.9887

0.0297

2.29

0.9890

0.0290

2.30

0.9893

0.0283

2.31

0.9896

0.0277

2.32

0.9898

0.0270

2.33

0.9901

0.0264

2.34

0.9904

0.0258

2.35

0.9906

0.0252

2.36

0.9909

0.0246

2.37

0.9911

0.0241

2.38

0.9913

0.0235

2.39

0.9916

0.0229

2.40

0.9918

0.0224

2.41

0.9920

0.0219

2.42

0.9922

0.0213

2.43

0.9925

0.0208

2.44

0.9927

0.0203

2.45

0.9929

0.0198

2.46

0.9931

0.0194

2.47

0.9932

0.0189

2.48

0.9934

0.0184

2.49

0.9936

0.0180

2.50

0.9938

0.0175

2.51

0.9940

0.0171

2.52

0.9941

0.0167

2.53

0.9943

0.0163

2.54

0.9945

0.0158

2.55

0.9946

0.0154

2.56

0.9948

0.0151

2.57

0.9949

0.0147

2.58

0.9951

0.0143

2.59

0.9952

0.0139

2.60

0.9953

0.0136

2.61

0.9955

0.0132

2.62

0.9956

0.0129

2.63

0.9957

0.0126

2.64

0.9959

0.0122

2.65

0.9960

0.0119

2.66

0.9961

0.0116

2.67

0.9962

0.0113

2.68

0.9963

0.0110

2.69

0.9964

0.0107

2.70

0.9965

0.0104

2.71

0.9966

0.0101

2.72

0.9967

0.0099

2.73

0.9968

0.0096

2.74

0.9969

0.0093

2.75

0.9970

0.0091

2.76

0.9971

0.0088

2.77

0.9972

0.0086

2.78

0.9973

0.0084

2.79

0.9974

0.0081

2.80

0.9974

0.0079

2.81

0.9975

0.0077

2.82

0.9976

0.0075

2.83

0.9977

0.0073

2.84

0.9977

0.0071

2.85

0.9978

0.0069

2.86

0.9979

0.0067

2.87

0.9979

0.0065

2.88

0.9980

0.0063

2.89

0.9981

0.0061

2.90

0.9981

0.0060

2.91

0.9982

0.0058

2.92

0.9982

0.0056

2.93

0.9983

0.0055

2.94

0.9984

0.0053

2.95

0.9984

0.0051

2.96

0.9985

0.0050

2.97

0.9985

0.0048

2.98

0.9986

0.0047

2.99

0.9986

0.0046

3.00

0.9987

0.0044

3.01

0.9987

0.0043

3.02

0.9987

0.0042

3.03

0.9988

0.0040

3.04

0.9988

0.0039

3.05

0.9989

0.0038

3.06

0.9989

0.0037

3.07

0.9989

0.0036

3.08

0.9990

0.0035

3.09

0.9990

0.0034

3.10

0.9990

0.0033

3.11

0.9991

0.0032

3.12

0.9991

0.0031

3.13

0.9991

0.0030

3.14

0.9992

0.0029

3.15

0.9992

0.0028

3.16

0.9992

0.0027

3.17

0.9992

0.0026

3.18

0.9993

0.0025

3.19

0.9993

0.0025

3.20

0.9993

0.0024

3.21

0.9993

0.0023

3.22

0.9994

0.0022

3.23

0.9994

0.0022

3.24

0.9994

0.0021

3.25

0.9994

0.0020

3.26

0.9994

0.0020

3.27

0.9995

0.0019

3.28

0.9995

0.0018

3.29

0.9995

0.0018

3.30

0.9995

0.0017

3.31

0.9995

0.0017

3.32

0.9995

0.0016

3.33

0.9996

0.0016

3.34

0.9996

0.0015

3.35

0.9996

0.0015

3.36

0.9996

0.0014

3.37

0.9996

0.0014

3.38

0.9996

0.0013

3.39

0.9997

0.0013

3.40

0.9997

0.0012

3.41

0.9997

0.0012

3.42

0.9997

0.0012

3.43

0.9997

0.0011

3.44

0.9997

0.0011

3.45

0.9997

0.0010

3.46

0.9997

0.0010

3.47

0.9998

0.0010

3.48

0.9998

0.0009

3.49

0.9998

0.0009

3.50

0.9998

0.0009

3.51

0.9998

0.0008

3.52

0.9998

0.0008

3.53

0.9998

0.0008

3.54

0.9998

0.0008

3.55

0.9998

0.0007

3.56

0.9998

0.0007

3.57

0.9998

0.0007

3.58

0.9998

0.0007

3.59

0.9998

0.0006

3.60

0.9998

0.0006

3.61

0.9998

0.0006

3.62

0.9999

0.0006

3.63

0.9999

0.0005

3.64

0.9999

0.0005

3.65

0.9999

0.0005

3.66

0.9999

0.0005

3.67

0.9999

0.0005

3.68

0.9999

0.0005

3.69

0.9999

0.0004

3.70

0.9999

0.0004

3.71

0.9999

0.0004

3.72

0.9999

0.0004

3.73

0.9999

0.0004

3.74

0.9999

0.0004

3.75

0.9999

0.0004

3.76

0.9999

0.0003

3.77

0.9999

0.0003

3.78

0.9999

0.0003

3.79

0.9999

0.0003

3.80

0.9999

0.0003

3.81

0.9999

0.0003

3.82

0.9999

0.0003

3.83

0.9999

0.0003

3.84

0.9999

0.0003

3.85

0.9999

0.0002

3.86

0.9999

0.0002

3.87

0.9999

0.0002

3.88

0.9999

0.0002

3.89

0.9999

0.0002

3.90

1.0000

0.0002

3.91

1.0000

0.0002

3.92

1.0000

0.0002

3.93

1.0000

0.0002

3.94

1.0000

0.0002

3.95

1.0000

0.0002

3.96

1.0000

0.0002

3.97

1.0000

0.0002

3.98

1.0000

0.0001

3.99

1.0000

0.0001

 

标准正态分布图(零以上)

 

 

 

也可以看看

概率分布

统计符号

正态分布-维基百科

Advertising

  

概率与统计

基本概率

期望

方差

标准偏差

概率分布

正态分布

统计符号

快速表格

推荐网站

发送反馈

关于

首页| 网页| 数学| 电力| 计算器| 转换器| 工具类

© 2024

RT | 关于| 使用条款| 隐私政策| 管理Cookies

该网站使用Cookie来改善您的体验,分析流量并展示广告。学到更多

确定 管理设置