发布于 2015-11-09 14:37:40 | 665 次阅读 | 评论: 0 | 来源: PHPERZ
jieba 结巴分词
结巴分词是一个Python下的中文分词组件
通过jieba分词,提取频率较高的关键词。
import jieba.analyse strx = '网络让我们之间的距离变的如此之近,也同时让我们变的如此遥远。世界上最远的距离不是南极到北极,也不是喜马拉雅之巅到马里亚纳之渊;而是相对而坐,却各自忙着刷手机。暂别网络世界,去和爱人道一句早安,去和朋友聊一夜往事,去和家人吃一顿饭,其实也是挺好的' rt = jieba.analyse.extract_tags(strx,100) for r in rt: print r