能用均匀分布近似指数分布吗？

点击联系发帖人 时间：2022-05-24 12:54

均匀分布分布函数怎么求

这种问题让你求概率密度，首先想到的是求Z=X+Y的分布函数，由分布函数求导就可以得到概率密度。
求分布函数，实际就是求概率（由分布函数的定义可知），而求一个连续的型的随机变量的概率，实际求的就是积分区域。求积分区域，这个问题就已经转化为高等数学上的内容了。
F（z）=P(Z<=z)=P(X+Y<=z) X+Y<=z就是所要求的积分区域，对积分区域对z进行分类讨论，再对这个区域进行积分就可以等到z的分布函数。

}

数学分布(泊松分布、二项分布、正态分布、均匀分布、指数分布) 生存分析贝叶斯概率公式全概率公式

}

在笔记（一）中，我们基本上介绍完了概率论中的初等部分的大部分内容。本部分以及之后的主要内容都将围绕分析的部分展开。

我们在高中可能接触到过随机变量，那个时候我们没有概率测度的严格定义与概念，我们认为随机变量就是一个可以取到试验中所有可能值的变量。现在有了概率空间的定义，我们也可以将随机变量进行严格的定义。

后文均假设为可测空间，为概率空间。

一、随机变量，Borel集，随机变量独立性

本章中若仅对应用感兴趣只需要了解随机变量独立的定义即可

在此我们先引入示性函数的定义。

为样本空间，为样本点，为事件，示性函数为上函数。

我们发现给定都是事件。

由此，我们引入随机变量的严格定义。

若上函数满足：（回忆：就意味着为事件），就称为可测空间上的随机变量，通常省略样本点记为。（因为对回答随机变量有着如何的概率分布这个问题并没有帮助）

容易验证若为投掷一次均匀骰子得到的点数为实数域上连续函数，

接下来所要提出的一个自然的问题是：集合要满足什么条件才能使得。即在实数域上，随机变量的所有可能取值的集合至少所应该满足的条件是什么？这样的集合是没有任何限制的吗？

首先我们注意到如果为随机变量，必有。（随机变量定义验证）

我们从这一点出发，假设为所有中左开右闭的集合所组成的集合。假设为中所有元素（即左开右闭区间）经过交集、补集、可列并运算运算及其反复运算所得到的集合所组成的集合。容易验证满足事件域的定义。称为Borel域，中元素为Borel集。

我们不加证明地给出以下定理

由此，我们知道了随机变量所有取值的集合最坏也要是一个Borel集。即对Borel集，才是可以计算的。

类似地，我们可以把Borel集的概念推广到更高维的空间，此处不过多涉及。

这里值得注意的是 也为可测空间。

若函数 满足：，则称其为Borel可测函数。

事实上，我们目前接触到的几乎所有集合都是Borel集，几乎所有函数都是Borel可测函数。

我们很容易得到以下定理（读者自证）：

为随机变量，为Borel可测函数，则

这也正是我们可以利用已有的随机变量造出无穷无尽的随机变量的方法。

以后总是默认所有出现的函数都是Borel可测函数。

事实上Borel集可以作为事件与随机变量之间联系的桥梁，所以由事件独立性的定义，我们可以类似地定义随机变量的独立性。并可以看到Borel集在维系随机变量独立性中的作用。

为随机变量，则称这些随机变量相互独立。

值得强调的是定义中对个实数的选取是任意的！

关于Borel集在维系随机变量独立性中的作用，我们有以下定理。

为随机变量，相互独立，则对任何Borel集，事件也相互独立。

事实上，若定理中均为Borel可测函数，则也相互独立。

此处仅仅是简要介绍，读者若有兴趣可以深入了解。

另外还有一个重要的变换技巧。通过下面的例子说明：

例：为随机变量，证明为事件。

随机变量定义中仅仅告诉我们必定为事件，要如何将两者关联起来呢？

这个时候往往要利用到概率的连续性。

我们略施技巧，利用。

则由事件域的可列并封闭性，马上即可得证。

我们在之后处理含小于等于，小于，等于之间的概率的关系时常常仍会用到这个技巧，是需要牢记的。

若随机变量 只能取到有限个或者可列个不同值，则称

此时用概率分布列来描述随机变量的概率分布。

由概率的完全性和非负性，容易知道。

接下来介绍一些常见离散概率分布并且给出他们对应的实际模型。读者可尝试从模型推导出概率分布。（加深记忆）

读者可以自行验证的性质对于每个概率分布都成立。（必要的练习）

实际模型： 的值为一个随机事件中发生的事件数。这个事件发生的概率为。则服从参数为的两点分布，记作。

次独立重复随机事件中发生的事件数。这个事件每次发生的概率都是。则。

概率分布中的组合数意味着从个独立重复随机事件中选取个事件发生的方法数，切勿遗漏。并且接下来开始我们要开始注意随机变量所可能取值的范围。（在某些概率分布中容易混淆）

值得一提的是，服从二项分布的随机变量可以看作是个服从的独立的随机变量之和。同样地，若，且独立，则有。我们以后称这样的性质为独立条件下二项分布对于其中的参数 具有可加性。关于此条性质的证明，我们暂且搁置，直到后文提及求随机变量的和的分布方法时读者可以给出证明。事实上，更巧妙地，在最后我们给出概率母函数的工具时，我们会给出一个更简单且有普遍性的证明方法。

实际模型： 为某个随机事件发生的次数，假设每次事件发生与否相互独立，且平均事件发生次，则。

这个概率分布较难从实际模型推导得到，我们将在本章的末尾分布之间的关系处给出推导。

另外，此处需要注意的是的取值是包括的，且共有可列个可能取值。

与二项分布类似的是，在独立条件下泊松分布对于其中的参数 具有可加性。即独立，则有。我们同样地将此结论的证明暂且搁置。但是在我们后文阐释了二项分布与泊松分布之间的关联后，读者将能够有更直接的感受。

实际模型：重复进行随机事件，直到事件发生为止才停下。 为首次发生时共做的事件的次数。每次发生的概率均为，则。

此处需要注意的是的最小取值是而不是。（事实上，我更加推荐大家记住概率分布的实际模型，这样无论是概率分布还是随机变量的取值范围都能够在忘记时自己推导）

关于几何分布，我们后文将证明其重要的性质：无记忆性。

实际模型：重复进行随机事件，直到发生 次为止才停止。为到停止为止时事件发生与未发生的次数之和。事件每次发生的概率为，则。

我们容易发现的是当时，该分布与相同。

事实上，一个服从帕斯卡分布的随机变量为个相互独立的服从几何分布的随机变量之和。同样地，暂时搁置这个证明。

与二项分布类似地，在独立的条件下帕斯卡分布对于参数 具有可加性。

我们在此帮助读者验证一下帕斯卡分布满足概率测度所要求的完全性。其余的交给读者自己完成。

由Taylor公式，我们有上式

实际模型： 个产品，其中个次品，从中任取个。为这个中的次品数，则。

对超几何分布，我们只需简单地了解即可。

与离散型相对地，连续型随机变量指随机变量有不可列个不同取值的随机变量。

对于连续型随机变量，若 非负，满足，则称为的概率密度函数，简称密度。

显然地，密度要满足如下性质：

1、（利用概率的连续性证明）

2、（利用定积分第一中值定理）

这告诉我们对连续型随机变量，其在任意单点处取值的概率为 ，即。

故事实上，对连续型随机变量，

下面介绍几个常见的连续型概率分布。概率分布的完全性的验证交给读者自己完成。对于连续型随机变量，我们较难给出准确的实际模型，在此仅大致提到其应用。

若有密度：，则。

为了简便，以后仅在密度的函数中写出的情况，省略为零的情况。（后仍会注明的取值范围）

容易理解地，均匀分布的密度在非零处均为常值，并且保证了上的积分为。

均匀分布常用在计算机中作为产生各种符合其它分布的随机数的基础。

若有密度：，则。

注意指数分布的随机变量是非负的。

重要地，指数分布与几何分布类似，具有无记忆性，我们将在下章介绍。

而且指数分布还与泊松分布有着难解难分的联系，用来描述相邻两次随机事件发生之间的等待时间的分布。指数分布还常用来描述电子元件的寿命分布。

容易发现时，密度与指数分布相同。事实上，服从伽马分布的随机变量可以看成个服从指数分布的独立随机变量之和。这告诉我们在独立的条件下伽马分布关于参数 具有可加性，暂时搁置此证明。伽马分布常用来描述气象学中一段时间之内的降水量分布。

特别地， 被称为标准正态分布，在之后的学习中是十分常用的。

读者可以从正态分布的密度出发证明以下分析上的性质：

3、为拐点。（凹凸性变化的点）

由于正态分布太常用以及重要（后文中的中心极限定理会告诉我们这点），我们很多情况下需要经常计算时，的值。

由密度的定义，不难得到

我们再引入一个与标准正态密度有关的函数来简化这个积分的求解。

则容易知道由于正态密度的对称性与完全性，有

现在我们再来计算上文提到的积分。

结合标准正态分布函数表，即查得这个函数值的数值。

这样的做法的意义在于将求正态分布概率的过程统一化了。我们现在只需要能求出标准正态分布的概率即可求出所有不同正态分布的概率。我们下面将会着重介绍分布函数。届时读者可以再回来理解此处的定义的好处。

为随机变量，则函数称为的概率分布函数，也称为分布函数。

若为离散型随机变量，设概率分布为，则分布函数。

容易知道的是，此时分布函数为阶梯函数且单调递增。且函数值的跳跃发生在所有处，跳跃的幅度为。

若为连续型随机变量，设密度为

此时。则当时，，故此时分布函数连续。另外，与离散的情况类似地，分布函数仍旧具有单调递增的性质。

我们下面进一步给出分布函数的更多性质：（为任一随机变量

3、若 处处连续可微，则 为连续型随机变量，且 为密度。

2、同理地，利用概率的连续性可证明（留给读者）

3、利用密度的定义以及Newton-Lebniz公式，易证。

对于分布函数的第3个性质，我们不禁要问：

处处连续可微这个条件是否能够被削弱呢？因为大量的分布函数都不具备这么好的性质。我们下面不加证明地给出第三个性质的一个推广形式。

推广：为可数集，且其中任意两点之间的距离都大于0。分布函数连续，且在除了中点外之处连续可微，则

关于分布函数的另外值得提及的一点是：概率分布与分布函数一一对应。（读者自证）我们知道同一概率分布密度的密度并不唯一。从某种程度上来说，这是分布函数比密度更加重要之处。

既然分布函数与概率分布一一对应，这便意味着我们可以通过分布函数反过来创造各种各样的随机变量。我们现在了解到离散型随机变量的分布函数是阶梯函数的形式，连续型随机变量的分布函数是连续的。那我们自然地产生了这样一个疑问：是否能创造出一种分布函数，使得其兼具离散型与连续型随机变量的分布函数的特征呢？而这样的分布函数所对应的随机变量又是什么类型的呢？

事实上，通过这样的方法我们得以创造出一种全新的随机变量，它既不是离散型又不是连续型的，我们称其为混合型随机变量。

我们不难发现这样的分布函数对应的随机变量不是连续型的，因为并不连续，密度不存在。但是其也不是离散型的，因为并不仅仅在可列个点处取值。

将拆解，我们会发现，在中，其服从参数的指数分布。而其也会在处有着概率非0的离散取值。这样的随机变量便就是混合型随机变量。

我们可以将混合型随机变量看作若干个离散型随机变量与若干个连续型随机变量的加权平均数，在之后讲到概率论的应用时，我们也会频繁利用到混合型随机变量。

五、概率分布之间的联系

本章中我们主要关注各个概率分布之间的关系以及部分概率分布特有的性质。

首先，我们来研究泊松分布。第一次接触到泊松分布概率分布列的读者可能会感到奇怪：为什么概率分布列是这样一个奇怪的表达式？

事实上，泊松分布本质上是时的二项分布，我们下面给出证明。

定理（泊松分布与二项分布）

我们设法将与拼凑起来。

我们具象地理解这个定理。当足够大，且此时“平均”发生的事件数趋向于常数时，二项分布实质上就是泊松分布。

事实上，二项分布不仅仅与泊松分布有着紧密的联系，还可以由超几何分布进行逼近。

下面我们给出二项分布与超几何分布的联系。

定理（二项分布与超几何分布）

我们先将左侧超几何分布的概率分布列中的组合数全都展开，并且尽量凑出的形式。

同样地，具象地理解这个定理，我们可以认为当总量足够大时，如果次品率趋向于一个常数。那么我们无放回地进行抽取（超几何分布）可以近似为有放回地抽取（二项分布

值得一提的是，当很大时，计算机进行组合数的计算会非常费时，这个时候利用二项分布进行近似能够大幅提高计算速度。

最后，我们要指出指数分布与几何分布所特有的重要性质：无记忆性。

我们同时给出这两个定理，但仅对指数分布进行证明（思路大体相同）。

定理（几何分布的无记忆性）

离散型取正整数值的随机变量 ，则服从几何分布的充要条件是

定理（指数分布的无记忆性）

连续型非负随机变量 ，则服从指数分布的充要条件是

反之，若无记忆性成立，假设。

由数学分析中的结论，可得到。（这一步的具体证明：先证明对所有正整数成立，接着将正整数推广至有理数，再进一步可将有理数推广至实数，即得证）

故可求出分布函数，又由分布函数与概率分布的一一对应性质，可知。

无记忆性是一个有趣的特性。常常被用来描述各种元件的寿命。我们拿人类的寿命举例。若人类的寿命服从指数分布，则一个已经100岁了的人能活到120岁的概率等于他在新生儿时能活到20岁的概率（无疑是很高的）。若果真如此，人类的寿命则几乎就是无限的了。（当然与实际相悖233

事实上，泊松分布、指数分布、伽马分布之间也有着密不可分的关系（等待模型）。

若后续有空余篇幅，我将为大家介绍随机过程中的泊松过程，到时我们可以对其有一个清晰的认识。

六、随机变量的函数的分布

我们现在已经了解了随机变量的常见概率分布。然而常见的概率分布是有限的，但是随机变量却是各不相同的。研究随机变量的函数的分布，事实上是为了以现有的概率分布为基础创造出许多新的概率分布。

由于离散型随机变量与连续型随机变量的函数的分布的求法略有区别，下面分别介绍这两种方法。假定我们已知的概率分布，，现在想求的概率分布。

当为离散型随机变量时，我们直接的想法便就是通过概率分布列来求其函数的分布。

假设有概率分布列，则我们合并中的相同值作为的不同取值

则可得到的概率分布列。

例：随机变量的概率分布列为，求

注意到或，仅有这两个可能取值。

对于离散型随机变量的函数，我们只需要做好相同值的合并，概率分布列是相当容易求的。

而当为连续型随机变量时，我们是否能够效仿离散型时的情况呢？

一种初学者常犯（包括过去的我）的错误是仍旧模仿离散型的情况，错误地认为。然而，这样做的问题在于连续型随机变量在任意单点处取值的概率均为0。连续型随机变量有对应的密度，而回忆密度的定义，关注的是随机变量在一个区间中取值的概率，而非一点。

正确的方法是先求出分布函数，再根据分布函数求出密度。（分布函数之于连续型随机变量等同于概率分布列之于离散型随机变量）下举一例具体阐释。

（这里回忆一下是标准正态的分布函数，由于标准正态分布关于0对称，故）

所以，可见连续，除了处均可微。

（回忆为标准正态密度）

事实上，此处的服从自由度为1的卡方分布。。

通过上例，我们应该对分布函数法有了一个直观的认识。分布函数法是求随机变量的函数的分布的通法。（事实上，对于随机向量仍然如此）

从最本质上来说，求随机变量的函数的分布相当于进行了一次换元。从变量代换的角度看的话，我们可以得到如下定理（不给出证明）

定理（随机变量的变量代换）

有密度，为一个区间，，若满足：

2、所有 可逆，且有连续的导数。

3、设 的值域为，则互不相交。

这个定理看上去复杂，实际的思想却很简单。其将划分为了若干个区域，使得这些区域上与的取值得以通过一一对应。那么在每个区域上，相当于进行了变量代换，与积分的换元法类似的，乘上这个变换的导数即可。

我个人并不是经常用这个定理。事实上，所有的随机变量、向量的函数的分布问题都能够用分布函数法来解决。然而这样的定理为我们提供了一种新的角度看待问题，是具有启发性的。

本章的概率论学习笔记到此为止，谢谢大家阅读！（因为开学事多拖了好久233）

}

淘宝游戏网