性能¶
分词模块¶
基础模型在人民日报测试数据上的性能如下:
语料信息:人民日报1998年2月-6月(后10%数据作为开发集)作为训练数据,1月作为测试数据。
F1
测试集
98.5%
词性标注模块¶
基础模型在人民日报数据集上的性能如下:
语料信息:人民日报1998年2月-6月(后10%数据作为开发集)作为训练数据,1月作为测试数据。
ACC
测试集
98.5%
命名实体识别模块¶
基础模型在人民日报数据集上的性能如下:
语料信息:人民日报1998年1月做训练(后10%数据作为开发集),6月前10000句做测试作为训练数据。
F1
测试集
95.4
语义角色标注模块¶
基础模型在CPB3.0上的性能如下:
F1
测试集
80.6%
依存句法分析模块¶
在 Chinese Dependency Treebank(CDT) 数据集上的性能如下。
LAS
测试集
89.5
语义依存分析模块¶
在 CCL2020 数据集上的性能如下。
LAS
测试集
75.2