这种问题让你求概率密度,首先想到的是求Z=X+Y的分布函数,由分布函数求导就可以得到概率密度。
求分布函数,实际就是求概率(由分布函数的定义可知),而求一个连续的型的随机变量的概率,实际求的就是积分区域。求积分区域,这个问题就已经转化为高等数学上的内容了。
F(z)=P(Z<=z)=P(X+Y<=z) X+Y<=z就是所要求的积分区域,对积分区域对z进行分类讨论,再对这个区域进行积分就可以等到z的分布函数。
[版权声明] 本站所有资料由用户提供并上传,若内容存在侵权,请联系邮箱。资料中的图片、字体、音乐等需版权方额外授权,请谨慎使用。网站中党政主题相关内容(国旗、国徽、党徽)仅限个人学习分享使用,禁止广告使用和商用。
在笔记(一)中,我们基本上介绍完了概率论中的初等部分的大部分内容。本部分以及之后的主要内容都将围绕分析的部分展开。
我们在高中可能接触到过随机变量,那个时候我们没有概率测度的严格定义与概念,我们认为随机变量就是一个可以取到试验中所有可能值的变量。现在有了概率空间的定义,我们也可以将随机变量进行严格的定义。
后文均假设 为可测空间, 为概率空间。
一、随机变量,Borel集,随机变量独立性
本章中若仅对应用感兴趣只需要了解随机变量独立的定义即可
在此我们先引入示性函数的定义。
为样本空间, 为样本点, 为事件,示性函数 为上函数。
我们发现给定 都是事件。
由此,我们引入随机变量的严格定义。
若 上函数满足:(回忆: 就意味着为事件),就称 为可测空间上的随机变量,通常省略样本点记为 。(因为对回答随机变量有着如何的概率分布这个问题并没有帮助)
容易验证若 为投掷一次均匀骰子得到的点数 为实数域上连续函数,
接下来所要提出的一个自然的问题是:集合 要满足什么条件才能使得 。即在实数域上,随机变量的所有可能取值的集合至少所应该满足的条件是什么?这样的集合是没有任何限制的吗?
首先我们注意到如果 为随机变量,必有 。(随机变量定义验证)
我们从这一点出发,假设 为所有 中左开右闭的集合所组成的集合。假设 为 中所有元素(即左开右闭区间)经过交集、补集、可列并运算运算及其反复运算所得到的集合所组成的集合。容易验证满足事件域的定义。称为Borel域,中元素为Borel集。
我们不加证明地给出以下定理
由此,我们知道了随机变量所有取值的集合最坏也要是一个Borel集。即对Borel集 , 才是可以计算的。
类似地,我们可以把Borel集的概念推广到更高维的空间,此处不过多涉及。
这里值得注意的是 也为可测空间。
若函数 满足: ,则称其为Borel可测函数。
事实上,我们目前接触到的几乎所有集合都是Borel集,几乎所有函数都是Borel可测函数。
我们很容易得到以下定理(读者自证):
为随机变量, 为Borel可测函数,则
这也正是我们可以利用已有的随机变量造出无穷无尽的随机变量的方法。
以后总是默认所有出现的函数都是Borel可测函数。
事实上Borel集可以作为事件与随机变量之间联系的桥梁,所以由事件独立性的定义 ,我们可以类似地定义随机变量的独立性。并可以看到Borel集在维系随机变量独立性中的作用 。
为随机变量, 则称这些随机变量相互独立。
值得强调的是定义中对 个实数的选取是任意的!
关于Borel集在维系随机变量独立性中的作用 ,我们有以下定理。
为随机变量,相互独立,则对任何Borel集 ,事件 也相互独立。
事实上,若定理中 均为Borel可测函数,则 也相互独立。
此处仅仅是简要介绍,读者若有兴趣可以深入了解。
另外还有一个重要的变换技巧。通过下面的例子说明:
例: 为随机变量,证明 为事件。
随机变量定义中仅仅告诉我们 必定为事件,要如何将两者关联起来呢?
这个时候往往要利用到概率的连续性。
我们略施技巧,利用 。
则由事件域的可列并封闭性,马上即可得证。
我们在之后处理含小于等于,小于,等于之间的概率的关系时常常仍会用到这个技巧,是需要牢记的。
若随机变量 只能取到有限个或者可列个不同值,则称
此时用概率分布列来描述随机变量的概率分布。
由概率的完全性和非负性,容易知道 。
接下来介绍一些常见离散概率分布并且给出他们对应的实际模型。读者可尝试从模型推导出概率分布。(加深记忆)
读者可以自行验证 的性质对于每个概率分布都成立。(必要的练习)
实际模型: 的值为一个随机事件中发生的事件数。这个事件发生的概率为 。则 服从参数为 的两点分布,记作 。
次独立重复随机事件中发生的事件数。这个事件每次发生的概率都是 。则 。
概率分布中的组合数意味着从 个独立重复随机事件中选取 个事件发生的方法数,切勿遗漏。并且接下来开始我们要开始注意 随机变量所可能取值的范围。(在某些概率分布中容易混淆)
值得一提的是,服从二项分布的随机变量可以看作是 个服从 的独立的随机变量之和。同样地,若 ,且 独立,则有 。我们以后称这样的性质为独立条件下二项分布对于其中的参数 具有可加性。关于此条性质的证明,我们暂且搁置,直到后文提及求随机变量的和的分布方法时读者可以给出证明。事实上,更巧妙地,在最后我们给出概率母函数的工具时,我们会给出一个更简单且有普遍性的证明方法。
实际模型: 为某个随机事件发生的次数,假设每次事件发生与否相互独立,且平均事件发生 次,则 。
这个概率分布较难从实际模型推导得到,我们将在本章的末尾分布之间的关系处给出推导。
另外,此处需要注意的是 的取值是包括 的,且共有可列个可能取值。
与二项分布类似的是,在独立条件下泊松分布对于其中的参数 具有可加性。即 独立,则有 。我们同样地将此结论的证明暂且搁置。但是在我们后文阐释了二项分布与泊松分布之间的关联后,读者将能够有更直接的感受。
实际模型:重复进行随机事件,直到事件发生为止才停下。 为首次发生时共做的事件的次数。每次发生的概率均为 ,则 。
此处需要注意的是 的最小取值是 而不是 。(事实上,我更加推荐大家记住概率分布的实际模型,这样无论是概率分布还是随机变量的取值范围都能够在忘记时自己推导)
关于几何分布,我们后文将证明其重要的性质:无记忆性。
实际模型:重复进行随机事件,直到发生 次为止才停止。 为到停止为止时事件发生与未发生的次数之和。事件每次发生的概率为 ,则 。
我们容易发现的是当 时,该分布与 相同。
事实上,一个服从帕斯卡分布的随机变量为 个相互独立的服从几何分布 的随机变量之和。同样地,暂时搁置这个证明。
与二项分布类似地,在独立的条件下帕斯卡分布对于参数 具有可加性。
我们在此帮助读者验证一下帕斯卡分布满足概率测度所要求的完全性。其余的交给读者自己完成。
由Taylor公式,我们有上式
实际模型: 个产品,其中 个次品,从中任取 个。 为这 个中的次品数,则 。
对超几何分布,我们只需简单地了解即可。
与离散型相对地,连续型随机变量指随机变量有不可列个不同取值的随机变量。
对于连续型随机变量,若 非负,满足 ,则称 为 的概率密度函数,简称密度。
显然地,密度要满足如下性质:
1、 (利用概率的连续性证明)
2、 (利用定积分第一中值定理)
这告诉我们对连续型随机变量,其在任意单点处取值的概率为 ,即 。
故事实上,对连续型随机变量 ,
下面介绍几个常见的连续型概率分布。概率分布的完全性的验证交给读者自己完成。对于连续型随机变量,我们较难给出准确的实际模型,在此仅大致提到其应用。
若 有密度:
我们不难发现这样的分布函数对应的随机变量 不是连续型的,因为 并不连续,密度不存在。但是其也不是离散型的,因为并不仅仅在可列个点处取值。
将 拆解,我们会发现,在 中,其服从参数 的指数分布。而其也会在 处有着概率非0的离散取值。这样的随机变量便就是混合型随机变量。
我们可以将混合型随机变量看作若干个离散型随机变量与若干个连续型随机变量的加权平均数,在之后讲到概率论的应用时,我们也会频繁利用到混合型随机变量。
五、概率分布之间的联系
本章中我们主要关注各个概率分布之间的关系以及部分概率分布特有的性质。
首先,我们来研究泊松分布。第一次接触到泊松分布概率分布列的读者可能会感到奇怪:为什么概率分布列是这样一个奇怪的表达式?
事实上,泊松分布本质上是 时的二项分布,我们下面给出证明。
定理(泊松分布与二项分布)
我们设法将 与 拼凑起来。
我们具象地理解这个定理。当 足够大,且此时“平均”发生的事件数趋向于常数 时,二项分布 实质上就是泊松分布 。
事实上,二项分布不仅仅与泊松分布有着紧密的联系,还可以由超几何分布进行逼近。
下面我们给出二项分布与超几何分布的联系。
定理(二项分布与超几何分布)
我们先将左侧超几何分布的概率分布列中的组合数全都展开,并且尽量凑出 的形式。
同样地,具象地理解这个定理,我们可以认为当总量 足够大时,如果次品率 趋向于一个常数 。那么我们无放回地进行抽取(超几何分布)可以近似为有放回地抽取(二项分布
值得一提的是,当 很大时,计算机进行组合数的计算会非常费时,这个时候利用二项分布进行近似能够大幅提高计算速度。
最后,我们要指出指数分布与几何分布所特有的重要性质:无记忆性。
我们同时给出这两个定理,但仅对指数分布进行证明(思路大体相同)。
定理(几何分布的无记忆性)
离散型取正整数值的随机变量 ,则 服从几何分布的充要条件是
定理(指数分布的无记忆性)
连续型非负随机变量 ,则 服从指数分布的充要条件是
反之,若无记忆性成立,假设 。
由数学分析中的结论,可得到 。(这一步的具体证明:先证明对所有正整数 成立,接着将正整数推广至有理数,再进一步可将有理数推广至实数,即得证)
故可求出分布函数 ,又由分布函数与概率分布的一一对应性质,可知 。
无记忆性是一个有趣的特性。常常被用来描述各种元件的寿命。我们拿人类的寿命举例。若人类的寿命服从指数分布,则一个已经100岁了的人能活到120岁的概率等于他在新生儿时能活到20岁的概率(无疑是很高的)。若果真如此,人类的寿命则几乎就是无限的了。(当然与实际相悖233
事实上,泊松分布、指数分布、伽马分布之间也有着密不可分的关系(等待模型)。
若后续有空余篇幅,我将为大家介绍随机过程中的泊松过程,到时我们可以对其有一个清晰的认识。
六、随机变量的函数的分布
我们现在已经了解了随机变量的常见概率分布。然而常见的概率分布是有限的,但是随机变量却是各不相同的。研究随机变量的函数的分布,事实上是为了以现有的概率分布为基础创造出许多新的概率分布。
由于离散型随机变量与连续型随机变量的函数的分布的求法略有区别,下面分别介绍这两种方法。假定我们已知 的概率分布, ,现在想求 的概率分布。
当 为离散型随机变量时,我们直接的想法便就是通过概率分布列来求其函数的分布。
假设 有概率分布列 ,则我们合并 中的相同值作为 的不同取值
则可得到 的概率分布列 。
例:随机变量 的概率分布列为 ,求
注意到 或 ,仅有这两个可能取值。
对于离散型随机变量的函数,我们只需要做好相同值的合并,概率分布列是相当容易求的。
而当 为连续型随机变量时,我们是否能够效仿离散型时的情况呢?
一种初学者常犯(包括过去的我)的错误是仍旧模仿离散型的情况,错误地认为 。然而,这样做的问题在于连续型随机变量在任意单点处取值的概率均为0。连续型随机变量有对应的密度,而回忆密度的定义,关注的是随机变量在一个区间中取值的概率,而非一点。
正确的方法是先求出分布函数,再根据分布函数求出密度。(分布函数之于连续型随机变量等同于概率分布列之于离散型随机变量)下举一例具体阐释。
(这里回忆一下 是标准正态的分布函数,由于标准正态分布关于0对称,故 )
所以 ,可见 连续,除了 处均可微。
(回忆 为标准正态密度)
事实上,此处的 服从自由度为1的卡方分布。 。
通过上例,我们应该对分布函数法有了一个直观的认识。分布函数法是求随机变量的函数的分布的通法。(事实上,对于随机向量仍然如此)
从最本质上来说,求随机变量的函数的分布相当于进行了一次换元。从变量代换的角度看的话,我们可以得到如下定理(不给出证明)
定理(随机变量的变量代换)
有密度 , 为一个区间, ,若满足:
2、所有 可逆,且有连续的导数。
3、设 的值域为 ,则 互不相交。
这个定理看上去复杂,实际的思想却很简单。其将 划分为了若干个区域,使得这些区域上 与 的取值得以通过 一一对应。那么在每个区域上,相当于进行了变量代换,与积分的换元法类似的,乘上这个变换的导数即可。
我个人并不是经常用这个定理。事实上,所有的随机变量、向量的函数的分布问题都能够用分布函数法来解决。然而这样的定理为我们提供了一种新的角度看待问题,是具有启发性的。
本章的概率论学习笔记到此为止,谢谢大家阅读!(因为开学事多拖了好久233)
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。