C语言计算糖果大战的游戏的获胜的概率怎么计算的？关于规则具体在下面

Problem Description
生日Party结束的那天晚上，剩下了一些糖果，Gandon想把所有的都统统拿走，Speakless于是说：“可以是可以，不过我们来玩24点，你不是已经拿到了一些糖果了吗？这样，如果谁赢一局，就拿走对方一颗糖，直到拿完对方所有的糖为止。”如果谁能算出来而对方算不出来，谁就赢，但是如果双方都能算出或者都不能，就算平局，不会有任何糖果的得失。
Speakless是个喜欢提前想问题的人，既然他发起了这场糖果大战，就自然很想赢啦（不然可就要精光了-_-）。现在他需要你的帮忙，给你他每局赢的概率和Gardon每局赢的概率，请你给出他可能获得这场大战胜利的概率。

Input
每行有四个数，Speakless手上的糖果数N、Gardon手上的糖果数M(0<=N,M<=50)、一局Speakless能解答出来的概率p、一个问题Gardon能解答出来的概率q(0<=p,q<=1)。

Output
每行一个数，表示Speakless能赢的概率（用百分比计算，保留到小数点后2位）。

Sample Input
50 50 0.5 0.5
10 10 0.51 0.5
50 50 0.51 0.5

Sample Output
0.50
0.60
0.88

https://blog.csdn.net/thearcticocean/article/details/48245733

马尔科夫链
用一个p[2][N+M]数组，全部清0，然后设置概率
a=p（1-q），b=q（1-p），c=1-a-b；
首先a[N]=1，设置糖果N位置为起始点。
另外设置两个变量容器speak和gardon；
做一个指针为滚动数组，或者直接用矩阵好了。

规则是：
滚动数组开始填在p[0]这一行，
新的一行全部为0，然后依次处理p[1][n]+=b*p[0][n-1]+a*p[0][n+1]+c*p[0][n]，判断边界；
同时边界上speak接受+=a*p[0]，gardon接受+=b*p[N+M-1]；判断（见下）；
p[0]这一行清零，指针指过来；

循环往复到speak+gardon>99.9；
这个时候speak就是结果，输出两位。