python 判斷字元串中是否只有中文字元
首先,在Python中字元串的表示是 用unicode編碼。所以在做編碼轉換時,通常要以unicode作為中間編碼。
decode的作用是將其他編碼的字元串轉換成unicode編碼,比如 a.decode("utf-8"),表示將utf-8編碼的字元串轉換成unicode編碼
encode的作用是將unicode編碼的字元串轉換成其他編碼格式的字元串,比如b.encode("utf-8"),表示將unicode編碼格式轉換成utf-8編碼格式的字元串
判斷一個字元串中是否含有中文字元:
好了,有了以上知識,就可以很容易的解決這個問題了。這是代碼
1 #-*- coding:utf-8 -*- 2 3 import sys 4 reload(sys) 5 sys.setdefaultencoding("utf8") 6 7 def check_contain_chinese(check_str): 8 for ch in check_str.decode("utf-8"): 9 if u"u4e00" <= ch <= u"u9fff":10 return True11 return False12 13 if __name__ == "__main__":14 print check_contain_chinese("中國")15 print check_contain_chinese("xxx")16 print check_contain_chinese("xx中國")17 18 結果:19 True20 False21 True
本文轉載自http://www.cnblogs.com/changzhi/p/3376140.html,轉載內容純粹為了方便查看和回顧,如有侵犯請見諒!
推薦閱讀:
※Python小白的日常練習之Codewars
※從字元串中提取頭銜
※Diff應用:從LCS到UICollectionView