用Biopython解析.fasta文件后,使用正则表达式提取Description中[]里面的物种名称建立字典
import pandas as pd
import re
from Bio import SeqIO
s2 = {}
with open('x.fasta') as seqF:
for seqFP in SeqIO.parse(seqF,"fasta"):
seq_id = seqFP.description
seq_an = re.search(r"[([^]]*)]",seq_id)
s2[seqFP.id] = seq_an
da = pd.Series(s2)
XP_003030690.1 <re.Match object; span=(34, 62), match='[Schiz.
尝试采用str()将它转换为字符串,但返回值为空
获得单独的物种名称方便下一步构建表格
用法这样的。
str()将参数转换为字符串类型。
a = 26
print('我有'+str(a)+'个苹果')