亚洲天堂91av,99中文字幕日无码,日本性感毛片国产在线观看h

新聞中心

這里有您想知道的互聯(lián)網營銷解決方案

csv 文件讀寫亂碼問題的一個簡單解決方法

今天扼要總結一個處理csv文件亂碼問題，可能你有類似經歷，用excel打開一個csv文件，中文全部顯示亂碼。然后，手動用notepad++打開，修改編碼為utf-8并保存后，再用excel打開顯示正常。

建網站原本是網站策劃師、網絡程序員、網頁設計師等，應用各種網絡程序開發(fā)技術和網頁設計技術配合操作的協(xié)同工作。成都創(chuàng)新互聯(lián)公司專業(yè)提供做網站、成都網站建設,網頁設計,網站制作(企業(yè)站、響應式網站開發(fā)、電商門戶網站)等服務,從網站深度策劃、搜索引擎友好度優(yōu)化到用戶體驗的提升,我們力求做到極致!

今天使用Python，很少代碼就能將上面過程自動化。首先，導入3個模塊：

 
 
 
   
  
  
  # coding: utf-8   
  
  
  # @author: zhenguo   
  
  
  # @date: 2020-12-16   
  
  
  # @describe: functions about automatic file processing   
  
  
     
  
  
  import pandas as pd     
  
  
  import os    
  
  
  import chardet

chardet 模塊用于得到文件的編碼格式，pandas 按照這個格式讀取，然后保存為xlsx格式。

獲取filename文件的編碼格式：

 
 
 
   
  
  
  def get_encoding(filename):   
  
  
      """   
  
  
      返回文件編碼格式   
  
  
      """   
  
  
      with open(filename,'rb') as f:   
  
  
          return chardet.detect(f.read())['encoding']

保存為utf-8編碼xlsx格式文件，支持csv, xls, xlsx 格式的文件亂碼處理。需要注意，如果讀入文件為csv格式，保存時要使用xlsx格式：

 
 
 
   
  
  
  def to_utf8(filename):   
  
  
      """   
  
  
      保存為 to_utf-8   
  
  
      """   
  
  
      encoding = get_encoding(filename)   
  
  
      ext = os.path.splitext(filename)   
  
  
      if ext[1] =='.csv':   
  
  
          if 'gb' in encoding or 'GB' in encoding:   
  
  
              df = pd.read_csv(filename,engine='python',encoding='GBK')   
  
  
          else:   
  
  
              df = pd.read_csv(filename,engine='python',encoding='utf-8')   
  
  
          df.to_excel(ext[0]+'.xlsx')   
  
  
      elif ext[1]=='.xls' or ext[1] == '.xlsx':   
  
  
          if 'gb' in encoding or 'GB' in encoding:   
  
  
              df = pd.read_excel(filename,encoding='GBK')   
  
  
          else:   
  
  
              df = pd.read_excel(filename,encoding='utf-8')   
  
  
          df.to_excel(filename)   
  
  
      else:   
  
  
          print('only support csv, xls, xlsx format')

上面函數(shù)實現(xiàn)單個文件轉化，下面batch_to_utf8 實現(xiàn)目錄 path 下所有后綴為ext_name文件的批量亂碼轉化：

 
 
 
   
  
  
  def batch_to_utf8(path,ext_name='csv'):   
  
  
      """   
  
  
      path下，后綴為 ext_name的亂碼文件，批量轉化為可讀文件   
  
  
      """   
  
  
      for file in os.listdir(path):   
  
  
          if os.path.splitext(file)[1]=='.'+ext_name:   
  
  
              to_utf8(os.path.join(path,file))

調用：

 
 
 
   
  
  
  if __name__ == '__main__':   
  
  
    batch_to_utf8('.') # 對當前目錄下的所有csv文件保存為xlsx格式,utf-8編碼的文件

文件讀寫時亂碼問題，經常會遇到，相信今天這篇文章里的to_utf8，batch_to_utf8函數(shù)會解決這個問題，你如果后面遇到，不妨直接引用這兩個函數(shù)嘗試下。

分享名稱：csv 文件讀寫亂碼問題的一個簡單解決方法
網址分享：http://www.5511xx.com/article/ccsegpd.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

其他資訊