欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python讀取中文txt文本的方法

 更新時(shí)間:2018年04月12日 15:57:53   作者:jingyi130705008  
下面小編就為大家分享一篇python讀取中文txt文本的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

對(duì)于python2.7

字符串在Python2.7內(nèi)部的表示是unicode編碼,因此,在做編碼轉(zhuǎn)換時(shí),通常需要以u(píng)nicode作為中間編碼,即先將其他編碼的字符串解碼成unicode,再?gòu)膗nicode編碼成另一種編碼。

先用一些編輯器(如editplus )看一下你的txt文件保存的是utf-8,還是gb2312或其他的。當(dāng)你讀行時(shí)可以這樣

line = (file1.readline()).decode('utf-8').encode('gb2312')或
line = (file1.readline()).decode('gb2312').encode('utf-8')

注意:txt使用utf8編碼的時(shí)候會(huì)默認(rèn)在文件開(kāi)頭插入三個(gè)不可見(jiàn)字符。這個(gè)是windows用來(lái)判斷txt編碼是否為utf8的。所以如果你直接使用decode('utf-8')的話(huà)是得不到正確結(jié)果的。

必須先判斷前三個(gè)字符是否是windows插入的那三個(gè)。這個(gè)python已經(jīng)定義了一個(gè)常量了,可以直接和這個(gè)常量比較,如果一樣就刪除前三個(gè)字符然后再decode。

import codecs 
 data = open("Test.txt").read() 
 if data[:3] == codecs.BOM_UTF8:  
  data = data[3:] 
  print data.decode("utf-8") 

延伸:

因?yàn)閐ecode的函數(shù)原型是decode([encoding], [errors='strict']),可以用第二個(gè)參數(shù)控制錯(cuò)誤處理的策略,默認(rèn)的參數(shù)就是strict,代表遇到非法字符時(shí)拋出異常;

如果設(shè)置為ignore,則會(huì)忽略非法字符;

如果設(shè)置為replace,則會(huì)用?取代非法字符;

如果設(shè)置為xmlcharrefreplace,則使用XML的字符引用。

對(duì)于Python3

python3下比較簡(jiǎn)單,打開(kāi)的時(shí)候指定encoding參數(shù)即可:open("txt.txt", encoding="gbk").read()。

以上這篇python讀取中文txt文本的方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 利用python解決mysql視圖導(dǎo)入導(dǎo)出依賴(lài)的問(wèn)題

    利用python解決mysql視圖導(dǎo)入導(dǎo)出依賴(lài)的問(wèn)題

    這篇文章主要給大家介紹了關(guān)于利用python解決mysql視圖導(dǎo)入導(dǎo)出依賴(lài)的問(wèn)題,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。
    2017-12-12
  • python向MySQL數(shù)據(jù)庫(kù)插入數(shù)據(jù)的操作方法

    python向MySQL數(shù)據(jù)庫(kù)插入數(shù)據(jù)的操作方法

    這篇文章主要介紹了python向MySQL數(shù)據(jù)庫(kù)插入數(shù)據(jù),本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2022-11-11
  • Python深度學(xué)習(xí)TensorFlow神經(jīng)網(wǎng)絡(luò)基礎(chǔ)概括

    Python深度學(xué)習(xí)TensorFlow神經(jīng)網(wǎng)絡(luò)基礎(chǔ)概括

    這篇文章主要為大家介紹了Python深度學(xué)習(xí)中TensorFlow神經(jīng)網(wǎng)絡(luò)基礎(chǔ)概括,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步
    2021-10-10
  • 淺談Python在pycharm中的調(diào)試(debug)

    淺談Python在pycharm中的調(diào)試(debug)

    今天小編就為大家分享一篇淺談Python在pycharm中的調(diào)試(debug),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-11-11
  • python實(shí)現(xiàn)簡(jiǎn)單購(gòu)物商城

    python實(shí)現(xiàn)簡(jiǎn)單購(gòu)物商城

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)簡(jiǎn)單購(gòu)物商城的相關(guān)資料,具有實(shí)用性和一定的參考價(jià)值,感興趣的朋友可以參考一下
    2016-05-05
  • python中異常報(bào)錯(cuò)處理方法匯總

    python中異常報(bào)錯(cuò)處理方法匯總

    之前在學(xué)習(xí)python的時(shí)候有整理過(guò)python異常處理的文章,不夠簡(jiǎn)單也不夠完整,所以決定再整理一篇,算做補(bǔ)充,大家學(xué)習(xí)一下,就可以自己思考解決方法了,希望對(duì)大家能夠有所幫助
    2016-11-11
  • pandas dataframe中雙中括號(hào)和單中括號(hào)的區(qū)別及說(shuō)明

    pandas dataframe中雙中括號(hào)和單中括號(hào)的區(qū)別及說(shuō)明

    這篇文章主要介紹了pandas dataframe中雙中括號(hào)和單中括號(hào)的區(qū)別及說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • Python中利用ItsDangerous快捷實(shí)現(xiàn)數(shù)據(jù)加密

    Python中利用ItsDangerous快捷實(shí)現(xiàn)數(shù)據(jù)加密

    這篇文章主要介紹了Python中利用ItsDangerous快捷實(shí)現(xiàn)數(shù)據(jù)加密,通過(guò)使用Python庫(kù)ItsDangerous,我們就可以高效快捷地完成數(shù)據(jù)加密/解密的過(guò)程,本文結(jié)合實(shí)例代碼給大家講解的非常詳細(xì),需要的朋友可以參考下
    2022-11-11
  • Python中l(wèi)ist列表添加元素的3種方法總結(jié)

    Python中l(wèi)ist列表添加元素的3種方法總結(jié)

    這篇文章主要介紹了Python中l(wèi)ist列表添加元素的3種方法總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-01-01
  • Python調(diào)用飛書(shū)發(fā)送消息的示例

    Python調(diào)用飛書(shū)發(fā)送消息的示例

    這篇文章主要介紹了Python調(diào)用飛書(shū)發(fā)送消息的示例,幫助大家更好的理解和學(xué)習(xí)python編程語(yǔ)言的用法,感興趣的朋友可以了解下
    2020-11-11

最新評(píng)論