brat标注以后进行pipeline 式的关系抽取需要将数据处理成什么格式

brat标注数据以后进行关系抽取的步骤以及如何将标注结果转换为可以直接训练的数据

不知道你这个问题是否已经解决, 如果还没有解决的话:

你可以参考下这篇文章：Pipeline之异常传播

除此之外, 这篇博客: 【机器学习（7）】特征工程：共线性、降维、扩展中的 2.3 提取主成分个数，进行Pipeline整合 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

主成分的个数是如何确定？？？

常用判断标准：保留数据的解释方差累计百分比达到95%的所有特征

# 使用pipeline整合数据标准化、主成分分析与模型
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
# 构建模型工作流
pipe_lm = Pipeline([
        ('sc',StandardScaler()),
        ('pca',PCA(n_components=1)),
        ('lm_regr',LinearRegression())
        ])
print(pipe_lm)

–> 输出的结果为：（构建工作流）

Pipeline(memory=None,
         steps=[('sc',
                 StandardScaler(copy=True, with_mean=True, with_std=True)),
                ('pca',
                 PCA(copy=True, iterated_power='auto', n_components=1,
                     random_state=None, svd_solver='auto', tol=0.0,
                     whiten=False)),
                ('lm_regr',
                 LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None,
                                  normalize=False))],
         verbose=False)

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

brat标注以后 进行pipeline 式的关系抽取需要将数据处理成什么格式

brat标注以后进行pipeline 式的关系抽取需要将数据处理成什么格式