基于Python實(shí)現(xiàn)西西成語接龍小助手
介紹
代碼地址:https://github.com/taishan1994/chinese_chengyujielong
讀完該文,你可以收獲:
- python爬蟲的簡單使用。
- 構(gòu)建前綴樹以進(jìn)行搜索提示。
- 構(gòu)建一個(gè)簡單的成語接龍小程序。
爬蟲模塊
首先展示下我們最終獲得的成語的數(shù)據(jù):
,成語,拼音,成語解釋,典故出處,近義詞,反義詞,常用程度,感情色彩,語法用法,成語結(jié)構(gòu),產(chǎn)生年代,英文翻譯,成語謎面 0,阿匼取容,ē ǎn qǔ róng,阿匼:一味迎合的樣子。一味巴結(jié)別人以求得他們的喜歡,《新唐書 楊再思傳》:“居宰相十余年,阿匼取容,無所薦達(dá)?!?阿諛取容,剛正不阿,生僻,貶義詞,作謂語、定語;用于人,聯(lián)合式,古代,, 1,阿姑阿翁,ā gū ā wēng,阿:名詞的前綴。姑:丈夫的母親。翁:丈夫的父親。指公公婆婆。,見:“阿家阿翁”。,阿家阿翁,,一般,褒義詞,作主語、賓語;指公公婆婆,聯(lián)合式,近代,father-in-law and mother-in-law, 2,阿嬌金屋,ā jiāo jīn wū,阿嬌:指漢武帝劉徹的姑母(長公主劉嬌)的女兒。原指漢武帝劉徹要用金屋接納阿嬌為婦。這里泛指美麗高貴的女子。,語出舊題漢·班固《漢武故事》:漢武帝幼時(shí)曾對姑母長公主說:“若得阿嬌(姑母之女)作婦,當(dāng)以金屋貯之?!?金屋藏嬌,,一般,褒義詞,作賓語、定語;多用于女性,偏正式,古代,, 3,阿家阿翁,ā jiā ā wēng,阿:名詞的前綴。家:通“姑”,丈夫的母親。翁:丈夫的父親。指公公婆婆。,唐·趙璘《因話錄》卷一:“郭暖嘗與升平公主琴瑟不調(diào)。尚父拘暖,自詣朝童結(jié)罪。上召而慰之曰:‘諺云:不癡不聾,不作阿家阿翁。'”,阿公阿婆,,一般,褒義詞,作主語、賓語;指公公婆婆,聯(lián)合式,古代,husband's father and mother, 4,阿平絕倒,ā píng jué dǎo,以之比喻對對方的言論極為佩服。亦用為譏諷言論極為乖謬,常貽笑大方。,據(jù)《晉書·衛(wèi)玠傳》及《王澄傳》載:玠好言玄理。瑯玡王澄字平子,兄昵稱之曰:“阿平”。有高名,少所推許,每聞玠言,輒嘆息絕倒。故時(shí)為之語曰:“衛(wèi)玠談道,平子絕倒。”,,,一般,,,,,, 5,阿斗太子,ā dǒu tài zǐ,阿斗:三國蜀漢劉備之子劉禪的小名。此人庸碌無能,雖有諸葛亮等人全力扶助,也不能振興蜀漢。指懦弱無能的人,高陽《胡雪巖全傳 燈火樓臺》:“丈夫是個(gè)阿斗太子,哪怕你是諸葛亮,也只好嘆口氣。”,扶不起的阿斗,,常用,貶義詞,作主語、賓語、定語;多用于比喻句,偏正式,現(xiàn)代,an ignorant and incapable man <good-for-nothing fellow>,劉禪
每條成語包含以下屬性:成語,拼音,成語解釋,典故出處,近義詞,反義詞,常用程度,感情色彩,語法用法,成語結(jié)構(gòu),產(chǎn)生年代,英文翻譯,成語謎面。具體獲取成語的方式在spider,py里面,直接運(yùn)行parse_url3_detail()即可得到以上數(shù)據(jù)。這里我們?nèi)タ匆幌戮W(wǎng)頁:
我們要先獲取每一頁的初始信息,在get_all_chengyu3()里面注釋的部分就是,在得到之后已經(jīng)將其存儲下來了,接著隨便點(diǎn)擊一個(gè)成語,進(jìn)入到具體的詳情頁:
會發(fā)現(xiàn)所有的信息都在帶有class屬性為view_con clearfix的div下,我們可以通過BeautifulSoup的find函數(shù)找到這些標(biāo)簽,比如:div = soup.find("div", {"class":"view_con clearfix"})
,然后再進(jìn)一步獲取該標(biāo)簽下的一些數(shù)據(jù):
dl = div.find("dl") dts = dl.find_all("dt") dds = dl.find_all("dd") for dt,dd in zip(dts, dds): cate = dt.text.replace('[', '') cate = cate.replace(']', '') cate = cate.strip() content = dd.text content = content.strip()
我們可以通過.text來獲取標(biāo)簽包裹的文本,比如
作謂語、定語;用于人
可以得到作謂語、定語;用于人。
前綴樹搜索提示
代碼位于trie.py里面。前綴樹的構(gòu)建很簡單,我們從頭遍歷每一個(gè)成語,分別將成語存儲到每一個(gè)比字或詞當(dāng)中,在搜索的時(shí)候以該字或詞為鍵,直接得到值即可:
# coding:utf-8 """ 利用前綴樹進(jìn)行搜索提示 """ class TrieTree(object): def __init__(self): self.dict_trie = dict() def add_node(self, word): word = word.strip() tree = self.dict_trie for i in range(1, len(word)+1): char = word[:i] if char not in tree: tree[char] = [word] else: tree[char].append(word) def build_trie_tree(self, cy_list): """ 創(chuàng)建 trie 樹 """ for word in cy_list: self.add_node(word) def search(self, word): """ 搜索給定 word 字符串中與詞典匹配的 entity, 返回值 None 代表字符串中沒有要找的實(shí)體, 如果返回字符串,則該字符串就是所要找的詞匯的類型 """ tree = self.dict_trie res = tree.get(word, None) return res if __name__ == '__main__': import pandas as pd from pprint import pprint trie = TrieTree() data = pd.read_csv("data/cycd.csv") cys = data["成語"].values.tolist() trie.build_trie_tree(cys) # pprint(trie.dict_trie) print(trie.search("略")) ['略不世出', '略地侵城', '略地攻城', '略施小計(jì)', '略無忌憚', '略知一二', '略知皮毛', '略窺一斑', '略勝一籌', '略見一斑', '略遜一籌', '略高一籌', '略識之無', '略跡原心', '略跡原情', '略跡論心']
成語接龍
程序在cyjl.py里面,運(yùn)行之后,我們得到:
============================== === 歡迎進(jìn)行西西嘛呦成語接龍游戲 === 請選擇難度(輸入1(簡單),輸入2(困難)) 難度:2
這里的困難模式指西西助手在回答的時(shí)候會考慮成語最后一個(gè)字在語料庫中開頭出現(xiàn)的次數(shù),返回出現(xiàn)次數(shù)最少的成語來讓你盡可能的回答不上來。然后就會出一個(gè)字:
出題: 株
此時(shí),你可以輸入提示來獲取一階段提示,主要是其中一個(gè)答案的解釋,還不會,再輸入再提示,會給出該成語的前三個(gè)字。還是不會,則輸入看看,則會展示可能的一些結(jié)果(需要注意的是提示的成語可能沒在這個(gè)結(jié)果中,因?yàn)槲覀冎环祷厍?個(gè))。接著我們想了解該成語,輸入介紹 成語名,就會展示出該成語的一些信息。其它的一些注意的是,對于輸入空值和不正確的值都進(jìn)行了處理,不會影響程序的運(yùn)行。
出題: 袖 你的回答:提示 提示:成語解釋-- 袖手:藏手于袖中;充耳:塞住耳朵。指不聞不問,漠然置之 你的回答:再提示 提示:前三個(gè)字-- 袖手充... 你的回答:看看 ['袖中揮拳', '袖手傍觀', '袖手充耳', '袖手旁觀', '袖里乾坤'] 你的回答:介紹 袖手充耳 ============================== 成語:袖手充耳 拼音:xiù shǒu chōng ěr 成語解釋:袖手:藏手于袖中;充耳:塞住耳朵。指不聞不問,漠然置之 典故出處:清·夏燮《中西紀(jì)事·江上議款》:“既不能誓師討賊,視其力之所能為,則當(dāng)袖手充耳,姑聽命于發(fā)蹤指示之人。” 近義詞:袖手旁觀、充耳不聞、漠然置之 反義詞:nan 常用程度:一般 感情色彩:褒義詞 語法用法:作謂語、定語;用于處事 成語結(jié)構(gòu):聯(lián)合式 產(chǎn)生年代:近代 英文翻譯:nan 成語謎面:nan ============================== 你的回答:
到此這篇關(guān)于基于Python實(shí)現(xiàn)西西成語接龍小助手 的文章就介紹到這了,更多相關(guān)Python成語接龍內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python matplotlib超詳細(xì)教程實(shí)現(xiàn)圖形繪制
matplotlib 模塊不僅提供了繪制統(tǒng)計(jì)圖表的功能,還支持繪制圓形、正方形、矩形等各種圖形。這篇文章主要為大家詳細(xì)介紹了利用matplotlib.patches 繪制一些基本圖形,快來跟隨小編一起學(xué)習(xí)吧2021-12-12python實(shí)現(xiàn)保存網(wǎng)頁到本地示例
這篇文章主要介紹了python實(shí)現(xiàn)保存網(wǎng)頁到本地示例,需要的朋友可以參考下2014-03-03Python Spyder 調(diào)出縮進(jìn)對齊線的操作
這篇文章主要介紹了Python Spyder 調(diào)出縮進(jìn)對齊線的操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-02-02通過python爬蟲mechanize庫爬取本機(jī)ip地址的方法
python中的mechanize算是一個(gè)比較古老的庫了,在python2的時(shí)代中,使用的多一些,在python3以后就很少使用了,現(xiàn)在已經(jīng)是2202年了,可能很多人都沒聽說過mechanize,這不要緊,我們先來簡單的講解一下,如何使用mechanize,感興趣的朋友一起看看吧2022-08-08在Python中使用CasperJS獲取JS渲染生成的HTML內(nèi)容的教程
這篇文章主要介紹了在Python中使用CasperJS獲取JS渲染生成的HTML內(nèi)容的教程,需要先用JavaScript創(chuàng)建一個(gè)接口文件,需要的朋友可以參考下2015-04-04Python入門教程(十一)Python中的運(yùn)算符
這篇文章主要介紹了Python入門教程(十一)Python中的運(yùn)算符,Python是一門非常強(qiáng)大好用的語言,也有著易上手的特性,本文為入門教程,需要的朋友可以參考下2023-04-04