字数统计 的计算问题

Problem Description
  一天,淘气的Tom不小心将水泼到了他哥哥Jerry刚完成的作文上。原本崭新的作文纸顿时变得皱巴巴的,更糟糕的是由于水的关系,许多字都看不清了。可怜的Tom知道他闯下大祸了,等Jerry回来一定少不了一顿修理。现在Tom只想知道Jerry的作文被“破坏”了多少。
  Jerry用方格纸来写作文,每行有L个格子。(图1显示的是L = 10时的一篇作文,’X’表示该格有字,该文有三个段落)。

图1

图2

  图2显示的是浸水后的作文 ,‘O’表示这个位置上的文字已经被破坏。可是Tom并不知道原先哪些格子有文字,哪些没有,他唯一知道的是原文章分为M个段落,并且每个段落另起一行,空两格开头,段落内部没有空格(注意:任何一行只要开头的两个格子没有文字就可能是一个新段落的开始,例如图2中可能有4个段落)。
  Tom想知道至少有多少个字被破坏了,你能告诉他吗?

Input
  测试数据有多组。每组测试数据的第一行有三个整数:N(作文的行数1 ≤ N ≤ 10000),L(作文纸每行的格子数10 ≤ L ≤ 100),M(原文的段落数1 ≤ M ≤ 20),用空格分开。
  接下来是一个N × L的位矩阵(Aij)(相邻两个数由空格分开),表示被破坏后的作文。其中Aij取0时表示第i行第j列没有文字(或者是看不清了),取1时表示有文字。你可以假定:每行至少有一个1,并且所有数据都是合法的。

Output
  对于每组测试输出一行,一个整数,表示至少有多少文字被破坏。

Sample Input
10 10 3
0 0 0 1 1 1 0 1 1 0
1 1 0 0 0 1 1 1 0 0
0 0 1 1 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 0 1 0 1 1 1 0 0 0
1 1 0 0 1 1 1 1 1 1
1 1 1 1 1 1 1 0 0 0
0 0 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1
0 0 0 0 1 1 1 1 1 0

Sample Output
19

一下为MATLAB代码实现:

% Problem Description
%   一天,淘气的Tom不小心将水泼到了他哥哥Jerry刚完成的作文上。原本崭新的作文纸顿时变得皱巴巴的,更糟糕的是由于水的关系,许多字都看不清了。可怜的Tom知道他闯下大祸了,等Jerry回来一定少不了一顿修理。现在Tom只想知道Jerry的作文被“破坏”了多少。
%   Jerry用方格纸来写作文,每行有L个格子。(图1显示的是L = 10时的一篇作文,’X’表示该格有字,该文有三个段落)。
% 
% 图1
% 
% 图2
% 
%   图2显示的是浸水后的作文 ,‘O’表示这个位置上的文字已经被破坏。可是Tom并不知道原先哪些格子有文字,哪些没有,他唯一知道的是原文章分为M个段落,并且每个段落另起一行,空两格开头,段落内部没有空格(注意:任何一行只要开头的两个格子没有文字就可能是一个新段落的开始,例如图2中可能有4个段落)。
%   Tom想知道至少有多少个字被破坏了,你能告诉他吗?
% 
% Input
%   测试数据有多组。每组测试数据的第一行有三个整数:N(作文的行数1 ≤ N ≤ 10000),L(作文纸每行的格子数10 ≤ L ≤ 100),M(原文的段落数1 ≤ M ≤ 20),用空格分开。
%   接下来是一个N × L的位矩阵(Aij)(相邻两个数由空格分开),表示被破坏后的作文。其中Aij取0时表示第i行第j列没有文字(或者是看不清了),取1时表示有文字。你可以假定:每行至少有一个1,并且所有数据都是合法的。
% 
% Output
%   对于每组测试输出一行,一个整数,表示至少有多少文字被破坏。
% 
% Sample Input
% 10 10 3
% 0 0 0 1 1 1 0 1 1 0
% 1 1 0 0 0 1 1 1 0 0
% 0 0 1 1 0 0 1 1 1 1
% 1 1 1 1 1 1 1 1 1 1
% 1 0 1 0 1 1 1 0 0 0
% 1 1 0 0 1 1 1 1 1 1
% 1 1 1 1 1 1 1 0 0 0
% 0 0 1 1 1 1 1 1 1 1
% 1 1 1 1 1 1 1 1 1 1
% 0 0 0 0 1 1 1 1 1 0
% 
% Sample Output
% 19
clear;clc;
data=importdata('wordsData.txt',' ',1);
dataH=data.textdata; dataA=data.data;
dataH_v=str2num(dataH{1}); %#ok<ST2NM>
N=dataH_v(1); L=dataH_v(2); M=dataH_v(3);
paragraphTest=sum(dataA(:,1:2),2);
paragraphIndex=find(paragraphTest==0);
nP=length(paragraphIndex);
paragraphEndIndex=[paragraphIndex(2:end,1)-1;N];
paraEndSpaces=zeros(nP,1);
for indey=1:nP
    for indez=L:-1:1
        if dataA(paragraphEndIndex(indey),indez)==0
            paraEndSpaces(indey)=paraEndSpaces(indey)+1;
        else
            break;
        end
    end
end
lostN=zeros(nP,1);
if nP>=M
    for index=1:nP
        if index==nP
            lostN(index)=sum(dataA(paragraphIndex(index):N,:)==0,'all');
        else
            lostN(index)=sum(dataA(paragraphIndex(index):paragraphIndex(index+1)-1,:)==0,'all');
        end
    end
    [paraEndSpaces_s,initIndex]=sort(paraEndSpaces,'descend');
    maxEndSpaces=sum(paraEndSpaces_s(1:M));
    minLostN=sum(lostN)-M*2-maxEndSpaces
else
    printf('Not enough Paragraphs.\n');
end
            

其中 “wordsData.txt”内容即为:

10 10 3
0 0 0 1 1 1 0 1 1 0
1 1 0 0 0 1 1 1 0 0
0 0 1 1 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 0 1 0 1 1 1 0 0 0
1 1 0 0 1 1 1 1 1 1
1 1 1 1 1 1 1 0 0 0
0 0 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1
0 0 0 0 1 1 1 1 1 0