2020
10-09
10-09
用python实现前向分词最大匹配算法的示例代码
理论介绍分词是自然语言处理的一个基本工作,中文分词和英文不同,字词之间没有空格。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。可以将中文分词方法简单归纳为:1.基于词表的分词方法2.基于统计的分词方法3....
继续阅读 >