常见问题

如果您在使用中遇到了问题?其他人可能也遇到过相似的问题,请先看看这些常见问题能否帮到您。

这可能是没有设置头结点标签--root HED,参数导致的。在启动训练器nndepparser加上该参数即可正常运行。

这个提示的含义是模型加载失败。

可能原因一 :模型不存在

如果您没有下载模型,请参考 下载部署模型

可能原因二 :模型与ltp版本不对应

ltp在加载模型是会检查模型签名和当前版本号,所以请确定您使用的模型与您使用的ltp版本号对应。 ltp版本号可以用 ./bin/ltp_test --help 查看。 模型版本号可以通过 ltp_data/version 查看。

未知原因

LTP模型使用二进制文件存储。 由于 unsigned long long 在不同编译器下长度不同,可能存在加载出错。 对于这种问题,请在我们项目的issue tracker https://github.com/HIT-SCIR/ltp/issues 里面反馈问题。 在提交issue时,请将您的编译器情况、系统情况(32bit/64bit等)反隐给我们。

ltp的分词模块 并非采用词典匹配的策略 ,外部词典以特征方式加入机器学习算法,并不能保证所有的词都是按照词典里的方式进行切分。 如果要完全按照词典匹配的方式切词,您可以尝试对切词结果进行后处理。

使用Java或Python调用ltp请参考ltp4j和pyltp这两个项目以及文档中 使用其他语言调用ltp 部分。

可能原因一 :句子过长

为了保证处理效率,ltp对于输入句子长度进行了限制。现在的限制是最大句子长度 1024字 ,切词结果最多 256词

可能原因二 :编码错误

ltp只接受UTF8编码输入。如果您的输入是GBK编码,请转为 UTF8无bom编码

方案一 :使用 xxxcmdline

您可以使用 xxx_cmdline 作为替代。xxx_cmdline 的分词模块、词性标注模块和命名实体识别模块是没有长度限制的。 句法分析模块限制长度为1024词。

方案二 :修改 src/ltp/Ltp.h

修改src/ltp/Ltp.h#define MAX_SENTENCE_LEN 1024#define MAX_WORDS_NUM 256 两个宏,重新编译。

  • 您可以在我们的Google group https://groups.google.com/forum/#!forum/ltp-cloud 中发帖提问。
  • 提问前,请再次确认您的问题没有现成的答案。并在提问时保持礼貌风度。
  • 有关提问的艺术,请参考池建强老师的博客 http://macshuo.com/?p=367 。