给定随机变量X的概率分布——在R语言中模拟此随机变量

文章目录

  • 一、问题重述
  • 二、问题求解
  • 三、证明
  • 四、R语言代码
  • 五、总结


一、问题重述

设随机变量 X X X 的分布为

P [ X = i ] = ( 1 2 ) i + 1 + 2 i − 2 3 i , i = 1 , 2 , … (P) P[X = i] = (\dfrac{1}{2})^{i+1} + \dfrac{2^{i-2}}{3^i}, i = 1, 2, \dots \tag{P} P[X=i]=(21)i+1+3i2i2,i=1,2,(P)

给出模拟此随机变量的方法。


二、问题求解

首先变量 X X X 的分布不符合我们常见的均匀分布、二项分布等常见分布,因此我们无法在R语言中直接模拟它,需要做出对应的变换。假定一个服从 [0, 1] 区间的均匀分布的随机数 U U U,即 U ∼ U ( 0 , 1 ) U \sim U(0, 1) UU(0,1),接着若我们定义

p i = ( 1 2 ) i + 1 + 2 i − 2 3 i p_i = (\dfrac{1}{2})^{i+1} + \dfrac{2^{i-2}}{3^i} pi=(21)i+1+3i2i2

则问题 P P P 改写为如下形式:

P [ X = i ] = p i , i = 1 , 2 , … P[X = i] = p_i,\ i = 1, 2, \dots P[X=i]=pi, i=1,2,

接着我们定义如下分布:

X = { 1 , U < p 1 ; 2 , p 1 ≤ U < p 1 + p 2 ; 3 , p 1 + p 2 ≤ U < p 1 + p 2 + p 3 ; … i , ∑ j = 1 i − 1 p j ≤ U < ∑ j = 1 i p j . (Q) X = \left\{\begin{aligned} &1\ ,\ U < p_1;\\ &2\ ,\ p_1 \le U < p_1 + p_2;\\ &3\ ,\ p_1+p_2 \le U < p_1 + p_2 + p_3;\\ &\dots\\ &i\ ,\ \sum_{j=1}^{i-1}p_j \le U < \sum_{j=1}^{i}p_j. \end{aligned}\right. \tag{Q} X=1 , U<p1;2 , p1U<p1+p2;3 , p1+p2U<p1+p2+p3;i , j=1i1pjU<j=1ipj.(Q)

可以证明分布 Q Q Q 和分布 P P P 是等价的。


三、证明

因为 U U U 服从 [0, 1] 区间的均匀分布,所以我们有如下结论:

∀ 0 < a < b < 1 , P { a ≤ U < b } = b − a . \forall\ 0 < a < b < 1,\ P\{a \le U < b\} = b - a.  0<a<b<1, P{aU<b}=ba.

所以对于分布 Q Q Q,有

P { X = i } = P { ∑ j = 1 i − 1 p j ≤ U < ∑ j = 1 i p j } = ∑ j = 1 i p j − ∑ j = 1 i − 1 p j = p i \begin{aligned} P\{X=i\}&=P\{ \sum_{j=1}^{i-1}p_j \le U < \sum_{j=1}^{i}p_j\}\\ &=\sum_{j=1}^{i}p_j-\sum_{j=1}^{i-1}p_j \\ &=p_i \end{aligned} P{X=i}=P{j=1i1pjU<j=1ipj}=j=1ipjj=1i1pj=pi

和原分布 P P P 等价。


四、R语言代码

定义分布 Q Q Q 的函数如下,其原理即为产生一个 [0, 1] 区间的均匀分布,利用该均匀分布概率值处在那个概率区间来确定 X X X,其代码如下:

Probability <- function(i){P <- 0.5 ^ (i + 1) + 2 ^ (i - 2) / 3 ^ i;return(P);
}DisRand <- function(P, i){c <- as.matrix(1:i);c <- apply(c, 1, Probability);c <- cumsum(c);for (i in 1:i){if (P < c[i]){X = i;break;}}return(X);
}i = 10
u <- as.matrix(runif(i))
R <- apply(u, 1, DisRand, i)
R

这里我们用 10 个服从均匀分布的概率值,模拟出了服从分布 P P P 的随机数,其输出如下:

> R[1] 2 1 3 1 3 1 2 2 5 3

注意这里 i 应当尽可能大,因为概率和为 1 !


五、总结


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部