分词工具使用

pyltp使用

介绍

pyltp是LTP的python封装

LTP介绍

  • 哈工大社会计算与信息检索研究中心开发
  • 提供了一整套自底向上的丰富而且高效的中文语言处理模块(包括词法、句法、语义等6项中文处理核心技术),以及基于动态链接库(Dynamic Link Library, DLL)的应用程序接口,可视化工具,并且能够以网络服务(Web Service)的形式进行使用。

LTP功能

  • 针对单一自然语言处理任务,生成统计机器学习模型的工具
  • 针对单一自然语言处理任务,调用模型进行分析的编程接口
  • 使用流水线方式将各个分析工具结合起来,形成一套统一的中文自然语言处理系统
  • 系统可调用的,用于中文语言处理的模型文件
  • 针对单一自然语言处理任务,基于云端的编程接口

LTP使用

必须包含两个部分

进行编译

  • 双击cmake-gui.exe

此方法不通,出现问题,无法configure

安装

  • 出现问题 pip install pyltp
  • 使用从源码中进行安装解决
$ git clone https://github.com/HIT-SCIR/pyltp
  • 安装wheel也有问题 pip install 文件名.whl

安装最终解决

版本对应

  • pyltp 版本:0.2.0
  • LTP 版本:3.4.0
  • 模型版本:3.4.0

示例


  • 结果
你好			觉得	这个	例子		哪里				当然	还是	直接	复制	官方	文档		然后				这里	得到		

你好/i
/wp
/r
觉得/v
这个/r
例子/n
/p
哪里/r
/v
/u
/wp
当然/d
还是/d
直接/a
复制/v
官方/n
文档/n
/wp
然后/c
/v
/u
/nd
这里/r
得到/v
/u
/wp
=============================
你好/O
/O
/O
觉得/O
这个/O
例子/O
/O
哪里/O
/O
/O
/O
当然/O
还是/O
直接/O
复制/O
官方/O
文档/O
/O
然后/O
/O
/O
/O
这里/O
得到/O
/O
/O
======================
0:HED	1:WP	4:SBV	1:COO	6:ATT	9:SBV	9:ADV	7:POB	4:VOB	9:RAD	4:WP	15:ADV	15:ADV	15:ADV	4:COO	17:ATT	15:VOB	15:WP	20:ADV	15:COO	20:RAD	23:ATT	24:SBV	20:VOB	24:RAD	1:WP

jieba使用

参考网址

打赏一个呗

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦