使wps-docx文档中特定字母加粗标红的脚本

有一段字母,想使ATCG之外的英文字母都加粗标红,在wps里面替换很容易,但是用shell或者python脚本更方便一些,因为数据量不小。要求是linux下平台,wps的文档——linux下其他可以标记字母红色的也行。

比如一个test.docx的文档,里面内容是ATCGGATCMDNATCGXY,脚本处理成test-out.docx的文档,里面内容是ATCGGATCMDNATCGXY,这些在处理好的文档里面都加粗变红色就行。只要非ATCG的字符,都加粗变红色。

麻烦的地方在,linux平台下的docx的文档处理,估计只能使用wps或者libreoffice。

使用python-docx库操作试试。示例代码:

from docx import Document
from docx.shared import RGBColor
s= 'ATCGGATCMDNATCGXY'
doc = Document()
par = doc.add_paragraph()
for a in s:
    text = par.add_run(a)
    text.font.name = 'Times New Roman'
    font = text.font
    if a in 'ATCG': 
        font.color.rgb = RGBColor(0,0,0)
    else:        
        text.bold = True # 字体是否加粗
        font.color.rgb = RGBColor(255,0,0)
doc.save('测试文档.docx')

img

请问,文件都是英文还是说要有中文和英文的混合文本?
还有其他格式吗?

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632