如果您在使用中遇到了问题?其他人可能也遇到过相似的问题,请先看看这些常见问题能否帮到您。
确认如下指令正确运行。
xcode-select --install
这可能是没有设置头结点标签--root HED
,参数导致的。在启动训练器nndepparser
加上该参数即可正常运行。
这个提示的含义是模型加载失败。
可能原因一 :模型不存在
如果您没有下载模型,请参考 下载部署模型
可能原因二 :模型与ltp版本不对应
ltp在加载模型是会检查模型签名和当前版本号,所以请确定您使用的模型与您使用的ltp版本号对应。
ltp版本号可以用 ./bin/ltp_test --help
查看。
模型版本号可以通过 ltp_data/version
查看。
未知原因
LTP模型使用二进制文件存储。
由于 unsigned long long
在不同编译器下长度不同,可能存在加载出错。
对于这种问题,请在我们项目的issue tracker https://github.com/HIT-SCIR/ltp/issues 里面反馈问题。
在提交issue时,请将您的编译器情况、系统情况(32bit/64bit等)反隐给我们。
ltp的分词(词性标注)模块 并非采用词典匹配的策略 ,外部词典以特征方式加入机器学习算法,并不能保证所有的词都是按照词典里的方式进行切分(标注)。 如果要完全按照词典匹配的方式切词(标注),您可以尝试对结果进行后处理。
使用Java或Python调用ltp请参考ltp4j和pyltp这两个项目以及文档中 使用其他语言调用ltp 部分。
可能原因一 :句子过长
为了保证处理效率,ltp对于输入句子长度进行了限制。现在的限制是最大句子长度 1024字 ,切词结果最多 256词 。
可能原因二 :编码错误
ltp只接受UTF8编码输入。如果您的输入是GBK编码,请转为 UTF8无bom编码 。
方案一 :使用 xxxcmdline
您可以使用 xxx_cmdline
作为替代。xxx_cmdline
的分词模块、词性标注模块和命名实体识别模块是没有长度限制的。
句法分析模块限制长度为1024词。
方案二 :修改 src/ltp/Ltp.h
修改src/ltp/Ltp.h
中#define MAX_SENTENCE_LEN 1024
和#define MAX_WORDS_NUM 256
两个宏,重新编译。