欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python smallseg分詞用法實(shí)例分析

 更新時(shí)間:2015年05月28日 12:14:53   作者:imzoer  
這篇文章主要介紹了Python smallseg分詞用法,以實(shí)例形式分析了Python實(shí)現(xiàn)分析的相關(guān)技巧,需要的朋友可以參考下

本文實(shí)例講述了Python smallseg分詞用法。分享給大家供大家參考。具體分析如下:

#encoding=utf-8 
#import psyco 
#psyco.full() 
words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] 
from smallseg import SEG 
seg = SEG() 
print('Load dict...') 
seg.set(words) 
print("Dict is OK.") 
def cuttest(text): 
  wlist = seg.cut(text) 
  wlist.reverse() 
  tmp = " ".join(wlist) 
  print(tmp) 
  print("================================") 
if __name__=="__main__": 
  cuttest("這是一個(gè)伸手不見(jiàn)五指的黑夜。我愛(ài)Python和C++。") 
  cuttest("我不喜歡黑夜。") 
  cuttest("回歸人間。") 
  cuttest("技術(shù)性器件的安裝工作") 
  cuttest("我需要租房") 
  cuttest("服裝飾品有限公司") 
  cuttest("我愛(ài)美食") 
  cuttest("abc") 
  cuttest("馬爾可夫") 
  cuttest("這是個(gè)好網(wǎng)站") 
  cuttest("“Microsoft”一詞由“MICROcomputer(微型計(jì)算機(jī))”和“SOFTware(軟件)”兩部分組成") 
  cuttest("今年的流行詞匯是什么") 
  cuttest("總店") 
  cuttest("中國(guó)科學(xué)院計(jì)算技術(shù)研究所") 
  cuttest("羅密歐與朱麗葉") 
  cuttest("我購(gòu)買(mǎi)了道具和服裝")

smallseg分詞,在python3.3上運(yùn)行稍微有些問(wèn)題。py代碼xrange在3.*中已經(jīng)改名字為range了。另外,3.*中也沒(méi)有decode函數(shù)了。

修改了上面的兩個(gè)地方,代碼就可移植性了。效果還可以。

希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。

相關(guān)文章

最新評(píng)論