欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 批量將中文名轉換為拼音

 更新時間:2021年02月07日 11:52:03   作者:劉早起  
這篇文章主要介紹了python 批量將中文名轉換為拼音,幫助大家更好的理解和使用python,感興趣的朋友可以了解下

有時在處理文件時候,我們需要將中文姓名轉換為拼音,或者是轉換為拼音首字母,本文將介紹三種Python實現(xiàn)的方法,最后給一個批量操作的代碼案例!

 一、xpinyin

開門見山,Python中文字轉拼音可以使用xpinyin,直接使用pip安裝即可?

pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

接著導入xpinyin下的 Pinyin 方法如下

from xpinyin import Pinyin

首先試試中文名轉拼音,

p = Pinyin()
result1 = p.get_pinyin('葉伏天')
result1

結果如下:

'ye-fu-tian'

tone_marks可以顯示聲調

result2 = p.get_pinyin('葉伏天', tone_marks='marks')

結果如下:

'yè-fú-tiān'

去掉空格?

s = result1.split('-')
result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize()
result3

結果如下:
'Ye Futian'

有時需要中文名轉拼音首字母,也很簡單?

二、pypinyin

另一種方法是使用pypinyin,安裝同樣可以使用pip

# 安裝
pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

直接導入就行?

import pypinyin

再來看看中文名轉拼音的實現(xiàn)辦法

result1 = pypinyin.pinyin('葉庭云', style=pypinyin.NORMAL)
result1

結果如下:

[['ye'], ['ting'], ['yun']]

啟用多音節(jié)來實現(xiàn)聲調

result2 = pypinyin.pinyin('葉庭云', heteronym=True)
result2

結果如下:

[['yè', 'xié'], ['tíng'], ['yún']]

因為返回的是一個嵌套的list,所以需要簡單調整一下

result_ = [i[0] for i in result1]
result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
result3

結果如下:

'Ye Tingyun'

啟用多音字模式時,竟然發(fā)現(xiàn) ‘葉' 也是多音字,查詢了資料發(fā)現(xiàn)確實是這樣,漲知識啦!

下面是中文名轉拼音首字母的方法

三、snownlp

最后一種辦法是使用snownlp,同樣的pip安裝與導入如下:

# 安裝
pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
# 導入
from snownlp import SnowNLP

中文名轉拼音?

s = SnowNLP('葉庭云')
s.pinyin

結果如下:

['ye', 'ting', 'yun']

將list轉為字符串

result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize()
result4

結果如下:

'Ye Tingyun'

最后是中文名轉拼音首字母

四、批量將中文名轉換成拼音

現(xiàn)在,掌握了基本使用后,我們就能利用批量操作來解放雙手

import pypinyin
import pandas as pd

df = pd.read_excel('學生名單_test.xls')
df.head()

先導入一份學生名單如下

下面是使用pypinyin批量將全部學生的中文姓名轉換為拼音

pinyin_name = []
first_pinyin = []
for i in df['姓名']:
  result = pypinyin.pinyin(i, style=pypinyin.NORMAL)
  result_ = [i[0] for i in result]
  result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
  result3 = ''.join([i[0].upper() for i in result_])
  print(result2, i, sep=' ')
  pinyin_name.append(result2)
  first_pinyin.append(result3)
  
df['英文名'] = pinyin_name
df['拼音首字母'] = first_pinyin
df.head()

或者是轉換為拼音首字母,運行結果如下:

以上就是python 批量將中文名轉換為拼音的詳細內容,更多關于python 中文名轉換為拼音的資料請關注腳本之家其它相關文章!

相關文章

最新評論