本篇文章将主要介绍在《分词算法的原理及简单实现(一)》中提及的分词相关的各种算法。包括但不仅限于结巴分词。
注:下文中提及的jieba分词源码指的是 v0.39 版本的代码。
继续阅读分词算法的原理及简单实现(二)本篇文章将主要介绍在《分词算法的原理及简单实现(一)》中提及的分词相关的各种算法。包括但不仅限于结巴分词。
注:下文中提及的jieba分词源码指的是 v0.39 版本的代码。
继续阅读分词算法的原理及简单实现(二)分词工具也算是接触过一点了,目前工作上主要用到的一个是MMSEG,另一个是jieba分词。对于分词,可不能就简单的调调接口,所以现在就来看一看分词算法的相关原理,并尝试实现一个简单的分词工具。
继续阅读分词算法的原理及简单实现(一)