请大神帮忙用Python 的中文分词jieba进行分词模块,统计《天龙八部》出场前十的人物

以统计水浒传人物出场次数为例列出出场次数最高的前三名。

以三国演义为例将同一人物的不同称呼进行合并统计,使用if…elif…else

}

jieba进行分词是一个中文分词组件鈳用于中文句子/词性分割、词性标注、未登录词识别,支持用户词典等功能该组件的分词精度达到了97%以上。下载介绍在Python里安装jieba进行分词

3)点击电脑桌面的左下角的【开始】—》运行 —》输入: cmd —》切换到jieba进行分词所在的目录,比如,D:TDDownloadjieba进行分词依次使用如下命令:

图(3) jieba进行分詞进行中文分词的效果
}

我要回帖

更多关于 jieba进行分词 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信