欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

教你使用Python pypinyin庫實現(xiàn)漢字轉拼音

 更新時間:2021年05月27日 09:59:43   作者:數(shù)據(jù)分析與統(tǒng)計學之美  
今天,發(fā)現(xiàn)了一個好玩兒的庫,叫做 “pypinyin ”,用于幫助我們實現(xiàn)漢字轉拼音,文中有非常詳細的代碼示例,對正在學習python的小伙伴們很有幫助,需要的朋友可以參考下

一、前言

這里我先為大家提供一個中文網(wǎng)站,大家可以下去更深入的學習。

https://pypi.org/project/pypinyin/

pypinyin庫,主要有幾下幾個特性:

  • 智能匹配最正確的拼音;
  • 支持多音字、繁體字;
  • 支持多種不同拼音、注音風格;

該庫屬于第三方Python庫,因此在使用之前,需要提前安裝。

pip install pypinyin

然后,導入該庫即可。

import pypinyin
from pypinyin import pinyin

二、pypinyin庫的使用

先來看一個最基本的例子。

from pypinyin import pinyin
pinyin("吃飯")

結果如下:

在這里插入圖片描述

有些字,可能是多音字,再看下面這個例子。

from pypinyin import pinyin
pinyin('馮',heteronym=True)
pinyin('朝',heteronym=True)
pinyin('同',heteronym=True)

結果如下:

在這里插入圖片描述

仔細觀察上述打印結果,生成的都是二維列表嵌套,這樣解析起來,真費勁!

能不能生成一維列表呢?

from pypinyin import lazy_pinyin
lazy_pinyin("數(shù)據(jù)分析與統(tǒng)計學之美")

結果如下:

在這里插入圖片描述

問題又來了!

這里雖然是一維列表,但是沒有聲調了,這不尷尬了嗎?

這里面就涉及到一個風格轉換的問題了。

from pypinyin import lazy_pinyin,Style
lazy_pinyin("數(shù)據(jù)分析與統(tǒng)計學之美",style=Style.TONE)

結果如下:

在這里插入圖片描述

原來這里有一個Style類,供我們選擇風格,常用的風格有下面這14種。

#: 普通風格,不帶聲調。如: 中國 -> ``zhong guo``
NORMAL  =  0

#: 標準聲調風格,拼音聲調在韻母第一個字母上(默認風格)。如: 中國 -> ``zhōng guó``
TONE  =  1

#: 聲調風格2,即拼音聲調在各個韻母之后,用數(shù)字 [1-4] 進行表示。如: 中國 -> ``zho1ng guo2``
TONE2  =  2

#: 聲調風格3,即拼音聲調在各個拼音之后,用數(shù)字 [1-4] 進行表示。如: 中國 -> ``zhong1 guo2``
TONE3  =  8

#: 聲母風格,只返回各個拼音的聲母部分(注:有的拼音沒有聲母,詳見 `#27`_)。如: 中國 -> ``zh g``
INITIALS  =  3

#: 首字母風格,只返回拼音的首字母部分。如: 中國 -> ``z g``
FIRST_LETTER  =  4

#: 韻母風格,只返回各個拼音的韻母部分,不帶聲調。如: 中國 -> ``ong uo``
FINALS  =  5

#: 標準韻母風格,帶聲調,聲調在韻母第一個字母上。如:中國 -> ``ōng uó``
FINALS_TONE  =  6

#: 韻母風格2,帶聲調,聲調在各個韻母之后,用數(shù)字 [1-4] 進行表示。如: 中國 -> ``o1ng uo2``
FINALS_TONE2  =  7

#: 韻母風格3,帶聲調,聲調在各個拼音之后,用數(shù)字 [1-4] 進行表示。如: 中國 -> ``ong1 uo2``
FINALS_TONE3  =  9

#: 注音風格,帶聲調,陰平(第一聲)不標。如: 中國 -> ``ㄓㄨㄥ ㄍㄨㄛˊ``
BOPOMOFO  =  10

#: 注音風格,僅首字母。如: 中國 -> ``ㄓ ㄍ``
BOPOMOFO_FIRST  =  11

#: 漢語拼音與俄語字母對照風格,聲調在各個拼音之后,用數(shù)字 [1-4] 進行表示。如: 中國 -> ``чжун1 го2``
CYRILLIC  =  12

#: 漢語拼音與俄語字母對照風格,僅首字母。如: 中國 -> ``ч г``
CYRILLIC_FIRST  =  13

如果你的文字中,除了漢字,還有其它符號以及英文,會打印出怎么樣的效果呢?

from pypinyin import lazy_pinyin
lazy_pinyin('Hello,我是😀',style=Style.TONE)

結果如下:

在這里插入圖片描述

漢字打印出來就行,英文、表情符號不用打印出來最好,應該怎么辦呢?

這里有一個errors參數(shù)呢,來看看例子。

from pypinyin import lazy_pinyin

lazy_pinyin('Hello,我是😀',style=Style.TONE,errors='ignore')

結果如下:

在這里插入圖片描述

如果你對pypinyin庫的返回結果不滿意,可以自定義一個庫呀!這里可以使用load_phrases_dict 方法。

我們先來看一個例子:

from pypinyin import lazy_pinyin

lazy_pinyin("黃同學",style=Style.TONE)

結果如下:

在這里插入圖片描述

“黃同學” 的同,明明是二聲,這里成了四聲。

from pypinyin import lazy_pinyin,  load_phrases_dict

personalized_dict = {'黃同學':  [['huáng'], ['tòng'], ['xué']]}

load_phrases_dict(personalized_dict)

lazy_pinyin("黃同學",style=Style.TONE)

結果如下:

在這里插入圖片描述

到此這篇關于教你使用Python pypinyin庫實現(xiàn)漢字轉拼音的文章就介紹到這了,更多相關Python pypinyin庫內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • 簡單示例入門了解WxPython教程

    簡單示例入門了解WxPython教程

    這篇文章主要通過演示簡單示例帶大家入門了解WxPython,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-11-11
  • Python進階之高級用法詳細總結

    Python進階之高級用法詳細總結

    今天帶各位小伙伴學習一下Python高級語法,主要有Lambda表達式,map函數(shù),filter函數(shù),reduce函數(shù),三大推導式等,文中有非常詳細的介紹,需要的朋友可以參考下
    2021-05-05
  • 跟老齊學Python之再深點,更懂list

    跟老齊學Python之再深點,更懂list

    對于list,由于她的確非常非常龐雜,在python中應用非常廣泛,所以,雖然已經(jīng)介紹完畢了基礎內容,這里還要用一講深入一點點,往往越深入越...
    2014-09-09
  • 詳解基于python-django框架的支付寶支付案例

    詳解基于python-django框架的支付寶支付案例

    這篇文章主要介紹了基于python-django框架的支付寶支付案例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-09-09
  • pycharm 在debug循環(huán)時快速debug到指定循環(huán)次數(shù)的操作方法

    pycharm 在debug循環(huán)時快速debug到指定循環(huán)次數(shù)的操作方法

    在 PyCharm 中,可以使用條件斷點來實現(xiàn)在特定循環(huán)次數(shù)后停止調試,本文重點介紹pycharm 在debug循環(huán)時快速debug到指定循環(huán)次數(shù)的操作方法,需要的朋友可以參考下
    2024-04-04
  • Python寫UI自動化之playwright(點擊操作)詳解

    Python寫UI自動化之playwright(點擊操作)詳解

    這篇文章主要介紹了Playwright庫中click()方法的參數(shù)及其使用場景,包括選擇器、修飾鍵、點擊位置、鼠標按鈕、點擊次數(shù)、延遲、超時、強制點擊、試點擊和不等待導航等選項,文中通過代碼介紹的非常詳細,需要的朋友可以參考下
    2025-02-02
  • python實現(xiàn)書法碑帖圖片分割

    python實現(xiàn)書法碑帖圖片分割

    這篇文章主要為大家詳細介紹了python實現(xiàn)書法碑帖圖片分割,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-03-03
  • Opencv常見圖像格式Data Type及代碼實例

    Opencv常見圖像格式Data Type及代碼實例

    這篇文章主要介紹了Opencv常見圖像格式Data Type及代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-11-11
  • python實現(xiàn)向ppt文件里插入新幻燈片頁面的方法

    python實現(xiàn)向ppt文件里插入新幻燈片頁面的方法

    這篇文章主要介紹了python實現(xiàn)向ppt文件里插入新幻燈片頁面的方法,涉及Python操作ppt文檔添加幻燈片的相關技巧,非常具有實用價值,需要的朋友可以參考下
    2015-04-04
  • numpy系列之數(shù)組重塑的實現(xiàn)

    numpy系列之數(shù)組重塑的實現(xiàn)

    本文主要介紹了numpy數(shù)組重塑。所謂數(shù)組重塑就是更改數(shù)組的形狀,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-09-09

最新評論