欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python jieba庫分詞模式實(shí)例用法

 更新時(shí)間:2021年01月13日 16:17:56   作者:十一  
在本篇文章里小編給大家分享的是一篇關(guān)于Python jieba庫分詞模式實(shí)例用法,有興趣的朋友們可以學(xué)習(xí)參考下。

在中文分詞中,jiebe庫是最為常見的,主要的原因還是它獨(dú)特的支持分詞模式如:精確模式、全模式搜索引擎模式。也對應(yīng)著三種方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就為大家實(shí)例操作這些分詞模式,以及方法的使用,一起來了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市長江大橋歡迎你。", cut_all=True)
print(type(seg_list),seg_list)

精確模式:

seg_list1 = jieba.lcut("南京市長江大橋歡迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市長江大橋歡迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精確模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

輸出結(jié)果:

全模式:南京/ 南京市/ 京市/ 市長/ 長江/ 長江大橋/ 大橋/ 歡迎/ 你/ 。

精確模式:南京市/ 長江大橋/ 歡迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 長江/ 大橋/ 長江大橋/ 歡迎/ 你/ 。

內(nèi)容擴(kuò)展:

獲取詞性

我們還可以通過jiaba這個(gè)庫把詞性進(jìn)行區(qū)分,比如動詞,名詞等

import jieba.posseg as psg

seg_list = psg.cut("我要進(jìn)行關(guān)鍵詞提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('進(jìn)行', 'v'), ('關(guān)鍵詞', 'n'), ('提取', 'v')]

我們還可以提取動詞或者名詞,我們來提取下里面的動詞

import jieba.posseg as psg

seg_list = psg.cut("我要進(jìn)行關(guān)鍵詞提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此這篇關(guān)于Python jieba庫分詞模式實(shí)例用法的文章就介紹到這了,更多相關(guān)Python jieba庫分詞模式怎么用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python3如何使用tabulate打印數(shù)據(jù)

    Python3如何使用tabulate打印數(shù)據(jù)

    這篇文章主要介紹了Python3如何使用tabulate打印數(shù)據(jù),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-09-09
  • Python實(shí)現(xiàn)分段讀取和保存遙感數(shù)據(jù)

    Python實(shí)現(xiàn)分段讀取和保存遙感數(shù)據(jù)

    當(dāng)遇到批量讀取大量遙感數(shù)據(jù)進(jìn)行運(yùn)算的時(shí)候,如果不進(jìn)行分段讀取操作的話,電腦內(nèi)存可能面臨著不夠使用的情況,所以我們要進(jìn)行分段讀取數(shù)據(jù)然后進(jìn)行運(yùn)算,運(yùn)算結(jié)束之后把這段數(shù)據(jù)保存成tif文件,本文介紹了Python實(shí)現(xiàn)分段讀取和保存遙感數(shù)據(jù),需要的朋友可以參考下
    2023-08-08
  • pyinstaller打包可執(zhí)行文件出現(xiàn)KeyError的問題

    pyinstaller打包可執(zhí)行文件出現(xiàn)KeyError的問題

    這篇文章主要介紹了pyinstaller打包可執(zhí)行文件出現(xiàn)KeyError的問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-11-11
  • 關(guān)于Python dict存中文字符dumps()的問題

    關(guān)于Python dict存中文字符dumps()的問題

    這篇文章主要介紹了關(guān)于Python dict存中文字符dumps()的問題,本文給大家分享問題及解決方案,給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-10-10
  • 基于python實(shí)現(xiàn)檢索標(biāo)記敏感詞并輸出

    基于python實(shí)現(xiàn)檢索標(biāo)記敏感詞并輸出

    這篇文章主要介紹了基于python實(shí)現(xiàn)檢索敏感詞并輸出,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-05-05
  • 如何利用Matplotlib庫繪制動畫及保存GIF圖片

    如何利用Matplotlib庫繪制動畫及保存GIF圖片

    這篇文章主要給大家介紹了關(guān)于如何利用Matplotlib庫繪制動畫及保存GIF圖片的相關(guān)資料,matplotlib模塊提供了很高級和非常友好的使用方式,使用起來也是非常方便的,需要的朋友可以參考下
    2021-06-06
  • Python實(shí)現(xiàn)修改Excel文件的元數(shù)據(jù)

    Python實(shí)現(xiàn)修改Excel文件的元數(shù)據(jù)

    這篇文章將通過使用Python、Openpyxl模塊以及wxPython庫,實(shí)現(xiàn)創(chuàng)建一個(gè)GUI界面來輸入元數(shù)據(jù),然后將這些元數(shù)據(jù)與Excel文件一起保存,感興趣的可以了解一下
    2023-04-04
  • PyTorch平方根報(bào)錯(cuò)的處理方案

    PyTorch平方根報(bào)錯(cuò)的處理方案

    這篇文章主要介紹了PyTorch平方根報(bào)錯(cuò)的處理方案,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • python如何實(shí)現(xiàn)DES加密

    python如何實(shí)現(xiàn)DES加密

    這篇文章主要介紹了python如何實(shí)現(xiàn)DES加密,幫助大家更好的理解和學(xué)習(xí)密碼學(xué),感興趣的朋友可以了解下
    2020-09-09
  • Pytorch使用PIL和Numpy將單張圖片轉(zhuǎn)為Pytorch張量方式

    Pytorch使用PIL和Numpy將單張圖片轉(zhuǎn)為Pytorch張量方式

    這篇文章主要介紹了Pytorch使用PIL和Numpy將單張圖片轉(zhuǎn)為Pytorch張量方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-05-05

最新評論