欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取

 更新時(shí)間:2020年12月17日 16:37:26   作者:霧霾王者  
這篇文章主要介紹了python 利用jieba.analyse進(jìn)行關(guān)鍵詞提取的方法,幫助大家更好的利用python,感興趣的朋友可以了解下

1、簡(jiǎn)單應(yīng)用

代碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 趙路倉
# @Date : 2020/3/14
# @Desc : 提取關(guān)鍵字
# @Contact : 398333404@qq.com

import jieba.analyse


text='安全、防止水合物和段塞生成的重要措施之一。因此,針對(duì)未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開'
Key=jieba.analyse.extract_tags(text,topK=3)
print(Key)

2、含參使用

keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 
  • 第一個(gè)參數(shù):待提取關(guān)鍵詞的文本
  • 第二個(gè)參數(shù):返回關(guān)鍵詞的數(shù)量,重要性從高到低排序
  • 第三個(gè)參數(shù):是否同時(shí)返回每個(gè)關(guān)鍵詞的權(quán)重
  • 第四個(gè)參數(shù):詞性過濾,為空表示不過濾,若提供則僅返回符合詞性要求的關(guān)鍵詞

代碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 趙路倉
# @Date : 2020/3/14
# @Desc : 提取關(guān)鍵字
# @Contact : 398333404@qq.com

import jieba.analyse


# 字符串前面加u表示使用unicode編碼
content = u'安全、防止水合物和段塞生成的重要措施之一。因此,針對(duì)未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開'

keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
# 訪問提取結(jié)果
for item in keywords:
  # 分別為關(guān)鍵詞和相應(yīng)的權(quán)重
  print(item[0], item[1])

以上就是python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取的詳細(xì)內(nèi)容,更多關(guān)于python 關(guān)鍵詞提取的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

最新評(píng)論