C语言计算糖果大战的游戏的获胜的概率怎么计算的?关于规则具体在下面

Problem Description
生日Party结束的那天晚上,剩下了一些糖果,Gandon想把所有的都统统拿走,Speakless于是说:“可以是可以,不过我们来玩24点,你不是已经拿到了一些糖果了吗?这样,如果谁赢一局,就拿走对方一颗糖,直到拿完对方所有的糖为止。”如果谁能算出来而对方算不出来,谁就赢,但是如果双方都能算出或者都不能,就算平局,不会有任何糖果的得失。
Speakless是个喜欢提前想问题的人,既然他发起了这场糖果大战,就自然很想赢啦(不然可就要精光了-_-)。现在他需要你的帮忙,给你他每局赢的概率和Gardon每局赢的概率,请你给出他可能获得这场大战胜利的概率。

Input
每行有四个数,Speakless手上的糖果数N、Gardon手上的糖果数M(0<=N,M<=50)、一局Speakless能解答出来的概率p、一个问题Gardon能解答出来的概率q(0<=p,q<=1)。

Output
每行一个数,表示Speakless能赢的概率(用百分比计算,保留到小数点后2位)。

Sample Input
50 50 0.5 0.5
10 10 0.51 0.5
50 50 0.51 0.5

Sample Output
0.50
0.60
0.88

https://blog.csdn.net/thearcticocean/article/details/48245733

马尔科夫链
用一个p[2][N+M]数组,全部清0,然后设置概率
a=p(1-q),b=q(1-p),c=1-a-b;
首先a[N]=1,设置糖果N位置为起始点。
另外设置两个变量容器speak和gardon;
做一个指针为滚动数组,或者直接用矩阵好了。

规则是:
滚动数组开始填在p[0]这一行,
新的一行全部为0,然后依次处理p[1][n]+=b*p[0][n-1]+a*p[0][n+1]+c*p[0][n],判断边界;
同时边界上speak接受+=a*p[0],gardon接受+=b*p[N+M-1];判断(见下);
p[0]这一行清零,指针指过来;

循环往复到speak+gardon>99.9;
这个时候speak就是结果,输出两位。