日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
python 編程語言在操作文件編碼格式的應(yīng)用

本文主要是對python 編程語言操作不同文件的編碼格式的文件時,所需用到的相關(guān)實際應(yīng)用方案的介紹,以及python 編程語言的相關(guān)代碼的示例,以下就是文章的相關(guān)內(nèi)容的具體介紹。

建立一個文件test.txt,文件格式用ANSI,內(nèi)容為:abc中文用python來讀取

 
 
 
  1. # coding=gbk 
  2. print open("Test.txt").read()  
  3.  

結(jié)果:abc中文把文件格式改成UTF-8:顯然,這里需要解碼:

 
 
 
  1. # coding=gbk 
  2. import codecs  
  3. print open("Test.txt").read().decode("utf-8")  
  4.  

結(jié)果:abc中文上面的test.txt我是用Editplus來編輯的,但當(dāng)我用Windows自帶的記事本編輯并存成UTF-8格式時,運行時報錯:

 
 
 
  1. Traceback (most recent call last):  
  2. File "ChineseTest.py", line 3, in   
  3. print open("Test.txt").read().decode("utf-8")  
  4. UnicodeEncodeError: 'gbk' codec can't encode 
    character u'\ufeff' in position 0: illegal multibyte 
    sequence   

原來,某些軟件,如notepad,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。因此我們在讀取時需要自己去掉這些字符,python中的codecs module定義了這個常量:

 
 
 
  1. # coding=gbk 
  2. import codecs  
  3. data = open("Test.txt").read()  
  4. if data[:3] == codecs.BOM_UTF8:  
  5. datadata = data[3:]  
  6. print data.decode("utf-8")  

結(jié)果:abc中文以上的文章就是對 python 編程語言操作不同文件的編碼格式的文件的實際操作步驟介紹。

【編輯推薦】

  1. Python環(huán)境的實際應(yīng)用方案介紹與代碼詳解
  2. Python矩陣轉(zhuǎn)置的實際應(yīng)用操作方案與代碼詳解
  3. 對Python編程語言歷史發(fā)展的介紹
  4. 對python腳本語言在實際應(yīng)用的優(yōu)點介紹
  5. Python數(shù)據(jù)結(jié)構(gòu)如何進行內(nèi)建詳解

分享題目:python 編程語言在操作文件編碼格式的應(yīng)用
路徑分享:http://www.5511xx.com/article/cdephjo.html