Python實(shí)現(xiàn)針對(duì)含中文字符串的截取功能示例
本文實(shí)例講述了Python實(shí)現(xiàn)針對(duì)含中文字符串的截取功能。分享給大家供大家參考,具體如下:
對(duì)于含多字節(jié)的字符串,進(jìn)行截?cái)嗟臅r(shí)候,要判斷截?cái)嗵幨菐鬃止?jié)字符,不能將多字節(jié)從中分割,避免截?cái)嗪髞y碼
下面給出utf8和gb18030上的實(shí)現(xiàn), 用任何一種都可以,可以先進(jìn)行轉(zhuǎn)碼,用encode, decode;
方法1:對(duì)utf8:
def subString(string,length): if length >= len(string): return string result = '' i = 0 p = 0 while True: ch = ord(string[i]) #1111110x if ch >= 252: p = p + 6 #111110xx elif ch >= 248: p = p + 5 #11110xxx elif ch >= 240: p = p + 4 #1110xxxx elif ch >= 224: p = p + 3 #110xxxxx elif ch >= 192: p = p + 2 else: p = p + 1 if p >= length: break; else: i = p return string[0:i]
方法2:對(duì)gb18030編碼
def cut_string_off(string,s_len): if len(string)==0 or s_len <=0: return string elif len(string)==1 or s_len >= len(string): return string elif s_len < len(string): len_num=0 while len_num < s_len: tmp_c=ord(string[len_num]) if tmp_c >0 and tmp_c <=0x7F: len_num+=1 continue tmp_nextc=ord(string[len_num+1]) if tmp_c >= 0x81 and tmp_c <=0xFE and tmp_nextc>=0x40 and tmp_nextc<=0xFE: len_num+=2 continue else: len_num +=1; continue break tmp = string[0:len_num] # print utf2gbk(tmp) return tmp
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python編碼操作技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python數(shù)組操作技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python入門與進(jìn)階經(jīng)典教程》及《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》
希望本文所述對(duì)大家Python程序設(shè)計(jì)有所幫助。
- python 截取 取出一部分的字符串方法
- Python字符串拼接、截取及替換方法總結(jié)分析
- Python中的字符串切片(截取字符串)的詳解
- Python 字符串操作實(shí)現(xiàn)代碼(截取/替換/查找/分割)
- Python 字符串操作(string替換、刪除、截取、復(fù)制、連接、比較、查找、包含、大小寫轉(zhuǎn)換、分割等)
- Python實(shí)現(xiàn)簡(jiǎn)單截取中文字符串的方法
- Python中文字符串截取問(wèn)題
- Python 字符串、列表、元組的截取與切片操作示例
- python 用下標(biāo)截取字符串的實(shí)例
- Python截取字符串的簡(jiǎn)單方法實(shí)例
相關(guān)文章
python使用PySimpleGUI設(shè)置進(jìn)度條及控件使用
PySimpleGUI是一個(gè)在tkinter基礎(chǔ)上的,足夠簡(jiǎn)單,方便,pythonic的GUI庫(kù).本文給大家介紹python使用PySimpleGUI設(shè)置進(jìn)度條的方法及進(jìn)度條控件使用代碼,感興趣的朋友跟隨小編一起看看吧2021-06-06keras小技巧——獲取某一個(gè)網(wǎng)絡(luò)層的輸出方式
這篇文章主要介紹了keras小技巧——獲取某一個(gè)網(wǎng)絡(luò)層的輸出方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05python進(jìn)程管理工具supervisor安裝使用
supervisor是一個(gè)用python語(yǔ)言編寫的進(jìn)程管理工具,它可以很方便的監(jiān)聽、啟動(dòng)、停止、重啟一個(gè)或多個(gè)進(jìn)程,本文給大家介紹python進(jìn)程管理工具supervisor安裝使用配置教程,感興趣的朋友一起看看吧2023-08-08pyspark?dataframe列的合并與拆分實(shí)例
這篇文章主要介紹了pyspark?dataframe列的合并與拆分實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-03-03python使用多線程+socket實(shí)現(xiàn)端口掃描
這篇文章主要為大家詳細(xì)介紹了python使用多線程+socket實(shí)現(xiàn)端口掃描,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-05-05python使用Psutil模塊實(shí)現(xiàn)獲取計(jì)算機(jī)相關(guān)信息
psutil 是一個(gè)跨平臺(tái)的庫(kù),用于獲取進(jìn)程和系統(tǒng)運(yùn)行狀態(tài)的信息,這篇文章主要為大家詳細(xì)介紹了python如何調(diào)用psutil模塊實(shí)現(xiàn)獲取計(jì)算機(jī)相關(guān)信息,有需要的小伙伴可以了解下2023-11-11