python將中文數(shù)字轉化成阿拉伯數(shù)字的簡單方法
正則表達式提取文本中的數(shù)字
這里演示一下文本中提取中文年份
import re
m0 = "在一九四九年新中國成立比一九九零年低百分之五點二人一九九六年擊敗俄軍,取得實質獨立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}'
time1 = re.findall(pattrern1,m0)#轉化數(shù)字
提取年份如:‘1949', ‘1990', ‘1996'
這里給出許多正則表達式的樣例:example
中文轉化成阿拉伯數(shù)字
創(chuàng)建一個字典然后講數(shù)字進項匹配:
CN_NUM = {
'〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
'壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,}
for i in range(len(time1)):
new_str = ''
for j in time1[i]:
new_str += str(CN_NUM[j])
time1[i] = new_str
time1
這樣結果就出來啦,成功將上文例子中文年份轉化成阿拉伯數(shù)字:‘1949', ‘1990', ‘1996'
完整代碼
# 2、將句子中年份的大寫數(shù)字改為阿拉伯數(shù)字
import re
m0 = "在一九四九年新中國成立比一九九零年低百分之五點二人一九九六年擊敗俄軍,取得實質獨立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}'
time1 = re.findall(pattrern1,m0)#轉化數(shù)字
CN_NUM = {
'〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
'壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,}
for i in range(len(time1)):
new_str = ''
for j in time1[i]:
new_str += str(CN_NUM[j])
time1[i] = new_str
time1
總結
到此這篇關于python將中文數(shù)字轉化成阿拉伯數(shù)字的文章就介紹到這了,更多相關python中文數(shù)字轉阿拉伯數(shù)字內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python?NumPy教程之數(shù)據(jù)類型對象詳解
每個?ndarray?都有一個關聯(lián)的數(shù)據(jù)類型?(dtype)?對象。這個數(shù)據(jù)類型對象(dtype)告訴我們數(shù)組的布局。本文將通過示例詳細講講NumPy的數(shù)據(jù)類型對象,需要的可以參考一下2022-08-08
Python實現(xiàn)批量填補遙感影像的無效值NoData
這篇文章主要為大家介紹了如何基于Python中ArcPy模塊,對大量柵格遙感影像文件批量進行無效值(NoData值)填充的方法,感興趣的小伙伴可以了解一下2023-06-06
Python Numpy 實現(xiàn)交換兩行和兩列的方法
今天小編就為大家分享一篇Python Numpy 實現(xiàn)交換兩行和兩列的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06
python3對接mysql數(shù)據(jù)庫實例詳解
這篇文章主要介紹了python3對接mysql數(shù)據(jù)庫,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-04-04

