新聞中心
這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
創(chuàng)新互聯(lián)Python教程:pythonchardet檢測(cè)編碼
1、當(dāng)我們拿到一個(gè)bytes時(shí),就可以對(duì)其檢測(cè)編碼。用chardet檢測(cè)編碼,只需要一行代碼:

創(chuàng)新互聯(lián)建站主營(yíng)相山網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,成都app開(kāi)發(fā),相山h5小程序開(kāi)發(fā)搭建,相山網(wǎng)站營(yíng)銷推廣歡迎相山等地區(qū)企業(yè)咨詢
>>> chardet.detect(b'Hello, world!')
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}檢測(cè)出的編碼是ascii,注意到還有個(gè)confidence字段,表示檢測(cè)的概率是1.0(即100%)。
2、檢測(cè)GBK編碼的中文
>>> data = '離離原上草,一歲一枯榮'.encode('gbk')
>>> chardet.detect(data)
{'encoding': 'GB2312', 'confidence': 0.7407407407407407, 'language': 'Chinese'}檢測(cè)的編碼是GB2312,注意到GBK是GB2312的超集,兩者是同一種編碼,檢測(cè)正確的概率是74%,language字段指出的語(yǔ)言是'Chinese'。
以上就是python chardet檢測(cè)編碼的方法,希望對(duì)大家有所幫助。更多Python學(xué)習(xí)指路:創(chuàng)新互聯(lián)python教程
本文標(biāo)題:創(chuàng)新互聯(lián)Python教程:pythonchardet檢測(cè)編碼
標(biāo)題URL:http://www.5511xx.com/article/djpspej.html


咨詢
建站咨詢
