python學(xué)習(xí)之SpaCy庫(kù)的高級(jí)特性詳解
一、詞向量
SpaCy庫(kù)支持詞向量,也稱為Word Vectors或Word Embeddings,這是一種使用神經(jīng)網(wǎng)絡(luò)將詞語(yǔ)映射到多維空間的技術(shù),詞語(yǔ)的語(yǔ)義相似度可以通過(guò)它們的向量的空間距離來(lái)衡量。
加載包含詞向量的模型:
nlp = spacy.load('en_core_web_md')
獲取詞向量:
tokens = nlp("dog cat banana") for token in tokens: print(token.text, token.has_vector, token.vector_norm, token.is_oov)
計(jì)算詞語(yǔ)相似度:
tokens = nlp("dog cat banana") for token1 in tokens: for token2 in tokens: print(token1.text, token2.text, token1.similarity(token2))
二、依賴性解析
依賴性解析是識(shí)別句子中各個(gè)詞語(yǔ)之間的依賴關(guān)系的過(guò)程。SpaCy能夠識(shí)別句子的句法結(jié)構(gòu),并提供了可視化的工具。
from spacy import displacy doc = nlp("This is a sentence.") displacy.serve(doc, style='dep')
三、自定義組件
SpaCy允許你添加自定義的處理組件,這些組件將會(huì)被加入到處理管道中,你可以使用它們對(duì)文檔進(jìn)行各種各樣的處理。
下面的例子展示了如何添加一個(gè)自定義的組件,這個(gè)組件會(huì)在每個(gè)詞后面添加一個(gè)感嘆號(hào):
def add_exclamation(doc): for token in doc: token.text += "!" return doc nlp.add_pipe(add_exclamation, before='ner') doc = nlp("This is a sentence.") print([(token.text, token.ent_type_) for token in doc])
在這篇中級(jí)指南中,我們學(xué)習(xí)了SpaCy庫(kù)的一些高級(jí)特性,包括詞向量、依賴性解析和自定義組件。這些特性都極大的擴(kuò)展了SpaCy在自然語(yǔ)言處理領(lǐng)域的應(yīng)用能力。
到此這篇關(guān)于python學(xué)習(xí)之SpaCy庫(kù)的高級(jí)特性詳解的文章就介紹到這了,更多相關(guān)python SpaCy庫(kù)特性內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python腳本完成post接口測(cè)試的實(shí)例
今天小編就為大家分享一篇Python腳本完成post接口測(cè)試的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-12-12利用Anaconda完美解決Python 2與python 3的共存問(wèn)題
Anaconda 是 Python 的一個(gè)發(fā)行版,如果把 Python 比作 Linux,那么 Anancoda 就是 CentOS 或者 Ubuntu,下面這篇文章主要給大家介紹了利用Anaconda完美解決Python 2與python 3共存問(wèn)題的相關(guān)資料,文中介紹的非常詳細(xì),需要的朋友可以參考借鑒。2017-05-05Python閉包實(shí)現(xiàn)計(jì)數(shù)器的方法
這篇文章主要介紹了Python閉包實(shí)現(xiàn)計(jì)數(shù)器的方法,分析了閉包的概念及實(shí)現(xiàn)計(jì)數(shù)器的相關(guān)技巧,需要的朋友可以參考下2015-05-05python讀取并顯示圖片的三種方法(opencv、matplotlib、PIL庫(kù))
這篇文章主要給大家介紹了關(guān)于python讀取并顯示圖片的三種方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04如何利用pandas工具輸出每行的索引值、及其對(duì)應(yīng)的行數(shù)據(jù)
這篇文章主要介紹了如何利用pandas工具輸出每行的索引值、及其對(duì)應(yīng)的行數(shù)據(jù),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03詳解python環(huán)境安裝selenium和手動(dòng)下載安裝selenium的方法
這篇文章主要介紹了詳解python環(huán)境安裝selenium和手動(dòng)下載安裝selenium的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-03-03