对中文字符串,用标点符号(如!?:;等)作为分隔符,使用string.split()方法,具体代码如下:
/**********************************************************
[b][color=red]问题:如何在分割后保留分隔符?[/color][/b]
例如:paragraph="经济实力大幅提升。经济保持平稳快速发展,物价基本稳定。社会主义新农村建设扎实推进,区域发展协调性增强。创新型国家建设进展良好,自主创新能力较大提高。"
希望得到分割后的结果为:
result[0]="经济实力大幅提升[color=red]。[/color]";
result[1]="经济保持平稳快速发展,物价基本稳定[color=red]。[/color]";
result[2]="社会主义新农村建设扎实推进,区域发展协调性增强[color=red]。[/color]";
result[3]="创新型国家建设进展良好,自主创新能力较大提高[color=red]。[/color]";
[code="java"]
/*需要分割的文章*/
String str = "第一句。第二句!第三句:第四句;第五句。";
/*正则表达式:句子结束符*/
String regEx=":|。|!|;";
Pattern p =Pattern.compile(regEx);
Matcher m = p.matcher(str);
/*按照句子结束符分割句子*/
String[] words = p.split(str);
/*将句子结束符连接到相应的句子后*/
if(words.length > 0)
{
int count = 0;
while(count < words.length)
{
if(m.find())
{
words[count] += m.group();
}
count++;
}
}
/*输出结果*/
for(int index = 0; index < words.length; index++)
{
String word = words[index];
System.out.println("word = " + word);
}
[/code]
没办法的,我可以参考下string.split()方法的源码,自己扩展一下就行了
:) :idea: