欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python2.x和3.x下maketrans與translate函數(shù)使用上的不同

 更新時(shí)間:2015年04月13日 12:17:20   投稿:goldensun  
這篇文章主要介紹了Python2.x和3.x下maketrans與translate函數(shù)使用上的不同,這兩個(gè)函數(shù)建立映射來(lái)替換內(nèi)容是Python學(xué)習(xí)當(dāng)中的基礎(chǔ)知識(shí),需要的朋友可以參考下

maketrans和translate函數(shù)是進(jìn)行字符串字符編碼的常用方法。本文著重點(diǎn)在于演示其基本用法和在不同版本下操作的差異。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。
    2.X版本把字符串基本分為兩種:unicode字符串和8位字符串str,后者包含字節(jié)數(shù)據(jù)和我們常見(jiàn)的ASCII碼數(shù)據(jù);而3.X版本則重新對(duì)字符串進(jìn)行了劃分,分為了字節(jié)字符串bytes和文本字符串str,兩者都是不可變的,所以添加了一個(gè)可變的字節(jié)字符串類型bytearray。
     2.X版本中string類型和str、unicode類型大量方法是重復(fù)的,所以3.X版本不提倡使用string模塊中與str重復(fù)的方法。string模塊中還有很多有用的常量和方法,比如string.digits,可以在字符串編碼中方便地使用。

     2.X中maketrans和translate函數(shù)的簽名:

  string.maketrans(from, to)

  string.translate(s, table[, deletechars])
  str.translate(table[, deletechars])
  unicode.translate(table)

    3.X中maketrans和translate函數(shù)的簽名:

  static str.maketrans(x[, y[, z]])
  static bytes.maketrans(from, to)
  static bytearray.maketrans(from, to)

  str.translate(map)
  bytes.translate(table[, delete])
  bytearray.translate(table[, delete])

    從中可以看出,相對(duì)于2.X的string模塊的maketrans方法,3.X中分別提供了三個(gè)靜態(tài)方法用于創(chuàng)建映射表。
   下面讓我們看一個(gè)簡(jiǎn)單的例子來(lái)說(shuō)明字符串轉(zhuǎn)換的過(guò)程:
    2.X下的演示過(guò)程:

  >>> import string                     #導(dǎo)入string模塊
  >>> map = string.maketrans('123', 'abc') #建立映射表,將字符串中含有的'1','2','3'替換為'a','b','c'
  >>> s = '54321123789'                #轉(zhuǎn)換前的字符串
  >>> s.translate(map)                  #用創(chuàng)建的映射表map轉(zhuǎn)換字符串
  '54cbaabc789'                        #轉(zhuǎn)換后的字符串

    3.X下的演示過(guò)程:

  >>> map = str.maketrans('123','abc')
  >>> s = '54321123789'
  >>> s.translate(map)
  '54cbaabc789'

    2.X使用了string的maketrans函數(shù),而3.X使用了str的maketrans函數(shù),除了這一點(diǎn),使用方法是基本相同的。若指定字符串中要?jiǎng)h除的字符時(shí),使用就會(huì)略有不同,如下:
    2.X下的演示過(guò)程:

  >>> import string
  >>> map = string.maketrans('123', 'abc')
  >>> s = '54321123789'
  >>> s.translate(map, '78')        #除了轉(zhuǎn)換,還要?jiǎng)h除字符串中的字符'7','8'
  '54cbaabc9'               #轉(zhuǎn)換后的字符串沒(méi)有字符'7','8'

    3.X下的演示過(guò)程:

  >>> map = str.maketrans('123','abc', '78')#要?jiǎng)h除的字符需要在這指定
  >>> s = '54321123789'
  >>> s.translate(map)
  '54cbaabc9'

    我在讀《Python Cookbook》遇到了一個(gè)基于2.X版本的例子,如下

  import string
  def translator(frm='', to='', delete='', keep=None):
    if len(to) == 1:
      to = to * len(frm)
    trans = string.maketrans(frm, to)
    if keep is not None:
      allchars = string.maketrans('', '')
      delete = allchars.translate(allchars, keep.translate(allchars,delete))
    def translate(s):
      return s.translate(trans, delete)
    return translate

    allchars應(yīng)該是一個(gè)返回的映射表,為什么還可以調(diào)用translate方法,所以它應(yīng)該是一個(gè)str類型,測(cè)試如下:

  >>> import string
  >>> map = string.maketrans('123', 'abc')
  >>> type(map)
  <type 'str'>

    在3.X版本中這個(gè)方法不能正常通過(guò)運(yùn)行,那么錯(cuò)在什么地方呢,我們看看映射表是什么類型:

  >>> map = str.maketrans('123','abc')
  >>> type(map)
  <class 'dict'>

    知道了映射表的類型了,我們就可以對(duì)其進(jìn)行“后期加工”,像上面《Python Cookbook》中的例子一樣,來(lái)滿足我們的編碼要求。

   上面討論的例子用的字符串是ASCII字符組成的,如果是字節(jié)類型,2.X版本中操作是一樣的,3.X中調(diào)用bytes或bytearray的函數(shù);若是unicode類型的,2.X需要用unicode的translate方法,注意下面的代碼

 

  >>> print u"hallo".translate({97:u'e'})
  hello
  >>> print u"hallo".translate({'a':u'e'})
  hallo
  >>> print u"hallo".translate({u'a':u'e'})
  hallo

    結(jié)果之所以不一樣,查閱手冊(cè)可知unicode的translate方法的映射表也就是字典的鍵必須是unicode的位序數(shù),值可以是unicode的位序數(shù)、unicode字符串或這None。

相關(guān)文章

最新評(píng)論