性能

分词模块

基础模型在人民日报测试数据上的性能如下:

语料信息:人民日报1998年2月-6月(后10%数据作为开发集)作为训练数据,1月作为测试数据。

F1

测试集

98.5%

词性标注模块

基础模型在人民日报数据集上的性能如下:

语料信息:人民日报1998年2月-6月(后10%数据作为开发集)作为训练数据,1月作为测试数据。

ACC

测试集

98.5%

命名实体识别模块

基础模型在人民日报数据集上的性能如下:

语料信息:人民日报1998年1月做训练(后10%数据作为开发集),6月前10000句做测试作为训练数据。

F1

测试集

95.4

语义角色标注模块

基础模型在CPB3.0上的性能如下:

F1

测试集

80.6%

依存句法分析模块

Chinese Dependency Treebank(CDT) 数据集上的性能如下。

LAS

测试集

89.5

语义依存分析模块

CCL2020 数据集上的性能如下。

LAS

测试集

75.2