brat标注以后 进行pipeline 式的关系抽取需要将数据处理成什么格式

brat标注数据以后进行关系抽取的步骤 以及如何将标注结果转换为可以直接训练的数据

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 你可以参考下这篇文章:Pipeline之异常传播
  • 除此之外, 这篇博客: 【机器学习(7)】特征工程:共线性、降维、扩展中的 2.3 提取主成分个数,进行Pipeline整合 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

    主成分的个数是如何确定???

    常用判断标准:保留数据的解释方差累计百分比达到95%的所有特征

    # 使用pipeline整合数据标准化、主成分分析与模型
    from sklearn.linear_model import LinearRegression
    from sklearn.preprocessing import StandardScaler
    from sklearn.decomposition import PCA
    from sklearn.pipeline import Pipeline
    # 构建模型工作流
    pipe_lm = Pipeline([
            ('sc',StandardScaler()),
            ('pca',PCA(n_components=1)),
            ('lm_regr',LinearRegression())
            ])
    print(pipe_lm)
    

    –> 输出的结果为:(构建工作流)

    Pipeline(memory=None,
             steps=[('sc',
                     StandardScaler(copy=True, with_mean=True, with_std=True)),
                    ('pca',
                     PCA(copy=True, iterated_power='auto', n_components=1,
                         random_state=None, svd_solver='auto', tol=0.0,
                         whiten=False)),
                    ('lm_regr',
                     LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None,
                                      normalize=False))],
             verbose=False)
    

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^