给定随机变量X的概率分布——在R语言中模拟此随机变量
文章目录
- 一、问题重述
- 二、问题求解
- 三、证明
- 四、R语言代码
- 五、总结
一、问题重述
设随机变量 X X X 的分布为
P [ X = i ] = ( 1 2 ) i + 1 + 2 i − 2 3 i , i = 1 , 2 , … (P) P[X = i] = (\dfrac{1}{2})^{i+1} + \dfrac{2^{i-2}}{3^i}, i = 1, 2, \dots \tag{P} P[X=i]=(21)i+1+3i2i−2,i=1,2,…(P)
给出模拟此随机变量的方法。
二、问题求解
首先变量 X X X 的分布不符合我们常见的均匀分布、二项分布等常见分布,因此我们无法在R语言中直接模拟它,需要做出对应的变换。假定一个服从 [0, 1] 区间的均匀分布的随机数 U U U,即 U ∼ U ( 0 , 1 ) U \sim U(0, 1) U∼U(0,1),接着若我们定义
p i = ( 1 2 ) i + 1 + 2 i − 2 3 i p_i = (\dfrac{1}{2})^{i+1} + \dfrac{2^{i-2}}{3^i} pi=(21)i+1+3i2i−2
则问题 P P P 改写为如下形式:
P [ X = i ] = p i , i = 1 , 2 , … P[X = i] = p_i,\ i = 1, 2, \dots P[X=i]=pi, i=1,2,…
接着我们定义如下分布:
X = { 1 , U < p 1 ; 2 , p 1 ≤ U < p 1 + p 2 ; 3 , p 1 + p 2 ≤ U < p 1 + p 2 + p 3 ; … i , ∑ j = 1 i − 1 p j ≤ U < ∑ j = 1 i p j . (Q) X = \left\{\begin{aligned} &1\ ,\ U < p_1;\\ &2\ ,\ p_1 \le U < p_1 + p_2;\\ &3\ ,\ p_1+p_2 \le U < p_1 + p_2 + p_3;\\ &\dots\\ &i\ ,\ \sum_{j=1}^{i-1}p_j \le U < \sum_{j=1}^{i}p_j. \end{aligned}\right. \tag{Q} X=⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧1 , U<p1;2 , p1≤U<p1+p2;3 , p1+p2≤U<p1+p2+p3;…i , j=1∑i−1pj≤U<j=1∑ipj.(Q)
可以证明分布 Q Q Q 和分布 P P P 是等价的。
三、证明
因为 U U U 服从 [0, 1] 区间的均匀分布,所以我们有如下结论:
∀ 0 < a < b < 1 , P { a ≤ U < b } = b − a . \forall\ 0 < a < b < 1,\ P\{a \le U < b\} = b - a. ∀ 0<a<b<1, P{a≤U<b}=b−a.
所以对于分布 Q Q Q,有
P { X = i } = P { ∑ j = 1 i − 1 p j ≤ U < ∑ j = 1 i p j } = ∑ j = 1 i p j − ∑ j = 1 i − 1 p j = p i \begin{aligned} P\{X=i\}&=P\{ \sum_{j=1}^{i-1}p_j \le U < \sum_{j=1}^{i}p_j\}\\ &=\sum_{j=1}^{i}p_j-\sum_{j=1}^{i-1}p_j \\ &=p_i \end{aligned} P{X=i}=P{j=1∑i−1pj≤U<j=1∑ipj}=j=1∑ipj−j=1∑i−1pj=pi
和原分布 P P P 等价。
四、R语言代码
定义分布 Q Q Q 的函数如下,其原理即为产生一个 [0, 1] 区间的均匀分布,利用该均匀分布概率值处在那个概率区间来确定 X X X,其代码如下:
Probability <- function(i){P <- 0.5 ^ (i + 1) + 2 ^ (i - 2) / 3 ^ i;return(P);
}DisRand <- function(P, i){c <- as.matrix(1:i);c <- apply(c, 1, Probability);c <- cumsum(c);for (i in 1:i){if (P < c[i]){X = i;break;}}return(X);
}i = 10
u <- as.matrix(runif(i))
R <- apply(u, 1, DisRand, i)
R
这里我们用 10 个服从均匀分布的概率值,模拟出了服从分布 P P P 的随机数,其输出如下:
> R[1] 2 1 3 1 3 1 2 2 5 3
注意这里 i 应当尽可能大,因为概率和为 1 !
五、总结
无
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
