日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
Python文本亂碼發(fā)生時的解決方案

Python文本亂碼這個問題在我們使用的時候會發(fā)生在很多地方,其實我們需要不斷的進行相關代碼的調整,在下面的文章中你會找到相關的解決方法。希望大家詳仔細的學習。

在處理utf8文本格式的時候,由于這些文本是含BOM(byte order mark)的utf8文本,編譯時產生一個Error,”UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\ufeff’ in position 0: illegal multibyte sequence”

原來,某些軟件,如notepad,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。 因此我們在讀取時需要自己去掉這些字符,Python中的codecs module定義了這個常量:

查看源代碼打印幫助

 
 
 
  1. import codecs 
  2. data = open("Test.txt").read() 
  3. if data[:3] == codecs.BOM_UTF8: 
  4. datadata = data[3:] 
  5. print data.decode("utf-8") 

以上就是對Python文本亂碼發(fā)生時代碼修改的詳細介紹。


分享標題:Python文本亂碼發(fā)生時的解決方案
本文URL:http://www.5511xx.com/article/dhcjpsg.html