发布于 2015-11-09 14:37:40 | 665 次阅读 | 评论: 0 | 来源: PHPERZ

这里有新鲜出炉的精品教程,程序狗速度看过来!

jieba 结巴分词

结巴分词是一个Python下的中文分词组件


通过jieba分词,提取频率较高的关键词。

import jieba.analyse
strx = '网络让我们之间的距离变的如此之近,也同时让我们变的如此遥远。世界上最远的距离不是南极到北极,也不是喜马拉雅之巅到马里亚纳之渊;而是相对而坐,却各自忙着刷手机。暂别网络世界,去和爱人道一句早安,去和朋友聊一夜往事,去和家人吃一顿饭,其实也是挺好的'
rt = jieba.analyse.extract_tags(strx,100)
for r in rt:
   print r


最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务