前面文章《离散分布的产生》中,主要讲述了如何通过均匀分布来产生各种离散分布。下面我给出一些离散分布之间的关系,从而可以由一种已知的分布来产生另一种分布。
伯努利分布、二项分布与多项分布
伯努利分布
定义:一个离散随机变量$X$的取值仅为$0$和$1$,且其分布律$P(X = 1) = p, P(X = 0) = 1 - p$则此随机变量服从伯努利分布。
实例:抛硬币就是伯努利分布,伯努利分布产生的结果就是$1$或则$0$(正面或则反面)。
二项分布
定义:设$B1,B_2, \cdots ,B_n ( n \in N)$为相互独立的服从参数为$p (p \in [ 0,1 ])$的伯努利分布,定义随机变量:$X = \sum\nolimits{i = 1}^n {B_i} $那么,随机变量$X$服从参数为$(n,p)$的二项分布。
实例:由定义可知,二项分布就是$n$重伯努利分布。形象的说,抛$n$次硬币,出现正面朝上的次数服从二项分布。
多项分布
定义:设$m \in N,pi\in [ 0,1] $,假设$( Y_1,Y_2, \cdots, Y_m)$是一个离散型$m$维随机变量。如果其联合分布律满足:对于$k_1, \cdots, k_m= 0,1,\cdots,n$,当其满足$\sum\nolimits{i = 1}^m k_i = n $时,$ P( Y_1 = k_1, \cdots ,Y_m = k_m) = \frac{n!}{k_1! \cdots k_n!}p_1^{k_1} \cdots p_m^{k_m}$
则称$m$维随机变量$( Y_1,Y_2, \cdots ,Y_m )$服从参数为$( n;p_1, \cdots, p_m)$的$m$项分布。
几何分布与负二项分布
几何分布
定义:设随机变量$Y$具有如下的分布律:$P( Y = k ) = ( 1 - p )^kp$,其中$p\in [ 0,1], k=0,1,\cdots$
则我们称$Y$服从几何分布。实例:几何分布的物理意义就是实验成功前所经历的失败次数。拿掷硬币来说,假设正面朝上视为成功,服从该几何分布的随机变量的物理意义就是不断掷硬币直到出现正面朝上前,出现反面朝上的次数,也即是失败的次数。
重要性质:无记忆性,即对于整数$s >t$,有下式成立:$P( X > s| {X > t} ) = P( X > s - t)$
负二项分布
定义:设$Y1,Y_2, \cdots ,Y_m$是$m$个相互独立且服从相同的几何分布,那么,当随机变量$Z$满足下式:$$Z = \sum\nolimits{i = 1}^m {Y_i} $$此时$Z$服从负二项分布,此时的分布律为:$P( Z = k ) = \frac{( k + m - 1)!}{( m - 1)!k!}{p^m}( 1 - p)^k,k=0,1,\cdots$
实例:由定义可知,可以通过几何分布得到负二项分布。举例来说,若我们掷骰子,掷到$1$即视为成功。则每次掷骰的成功率是$1/6$。要掷出三次1,所需的掷骰次数属于集合${ 3, 4, 5, 6, \cdots }$。掷到三次$1$的掷骰次数即是服从负二项分布的随机变量。
二项分布与泊松分布
关系:对于参数为$(n,p)$的二项分布,如果参数$n$较大,$p$较小,那么我们可以用参数为$\lambda=np$的泊松分布来逼近。
实例:一个盒子里有$144$个鸡蛋,假如每个鸡蛋破碎的概率都为$0.01$,请问恰好有$3$个鸡蛋破碎的概率是多少?
显然,这是一个二项分布的问题。设随机变量$X$表示鸡蛋破碎的个数,那么$X$服从参数为$(n=144,p=0.01)$的二项分布。因此在这$144$个鸡蛋中恰好有$3$个鸡蛋破碎的概率为:$P( X = 3) = C_{144}^3{0.01^3}{0.99^{144 - 3}} = 0.1181$
如果用泊松分布进行逼近的话,可知$X$服从参数为$\lambda=np$的泊松分布,则概率近似等于$P( {X = 3}) = \frac{1.44^3}{3!}{e^{ - 1.44}} = 0.1179$比较上面两种计算概率的方法,很明显第二种方法的计算量要小于第一种,因此当$n$较大,$p$较小时,我们常常用泊松分布来近似计算概率。