Python中文分詞實現方法(安裝pymmseg)
本文實例講述了Python中文分詞實現方法。分享給大家供大家參考,具體如下:
在Python這pymmseg-cpp 還是十分方便的!
環(huán)境 ubuntu10.04 , python2.65
步驟:
1 下載mmseg-cpp的源代碼 http://code.google.com/p/pymmseg-cpp/
2 執(zhí)行:
tar -zxf pymmseg-cpp*.tar.gz //解壓后得到pymmseg 目錄 cd pymmseg\mmseg-cpp python build.py #生成 mmseg.so文件
3 將 pymmseg 目錄復制到 /usr/local/lib/python2.6/dist-packages 中
4 測試有沒有成功:
test.py文件:
from pymmseg import mmseg mmseg.dict_load_defaults() text = '今天的天氣真好啊,我們一起出去玩一下吧' algor = mmseg.Algorithm(text) for tok in algor: print '%s [%d..%d]' % (tok.text, tok.start, tok.end)
更多關于Python相關內容感興趣的讀者可查看本站專題:《Python圖片操作技巧總結》、《Python數據結構與算法教程》、《Python Socket編程技巧總結》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設計有所幫助。
相關文章
深入淺析Python獲取對象信息的函數type()、isinstance()、dir()
這篇文章主要介紹了Python獲取對象信息的函數type()、isinstance()、dir()的相關知識,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2018-09-09