熱線電話:13121318867

登錄
首頁大數據時代讓python在后臺自動解壓各種壓縮文件!
讓python在后臺自動解壓各種壓縮文件!
2020-11-09
收藏

作者: 陳熹

公眾號:早起Python

一、需求描述

編寫一個python程序,每次下載壓縮包形式的文件后,自動將內部文件解壓到當前文件夾后將壓縮包刪除,通過本案例可以學到的知識點:

  • os 模塊綜合應用
  • glob 模塊綜合應用
  • 利用 gzip zipfile rarfile tarfile 模塊解壓文件

二、步驟分析和前置知識

碼代碼之前需要將復雜問題解釋成多個明確的要求,即這個程序實現的邏輯為:

  1. 定時檢測某個文件夾(如 download 文件夾)是否存在壓縮文件
  2. 如果有新出現的壓縮文件則將其解壓到當前文件夾內的新文件夾中 刪除壓縮文件
  3. 提到壓縮文件就要分不同壓縮格式進行討論,主要有以下4種:

提到壓縮文件就要分不同壓縮格式進行討論,主要有以下4種:

.gz: 即gzip,通常只能壓縮一個文件

.tar: 本質上不是壓縮工具而是打包工具,可以跟.gz配合形成.tar.gz的打包壓縮格式

.zip: 和.tar.gz很類似但可以打包壓縮多個文件

.rar: 打包壓縮文件,最初用于DOS

因此,文件是否為壓縮文件的判斷邏輯可以如下:

  1. 建立一個含壓縮包后綴的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
  2. 目標文件夾下的所有文件名運行filename.split(.)[-1]獲取后綴名
  3. 判斷后綴名是否在compressed_lst中,如果存在則運行后續的解壓代碼
  4. 如果是以gz結尾的文件,解壓后需要再次判斷是否是以.tar結尾,并進行相應處理

不同壓縮文件的解壓代碼各不相同,在后續代碼操作中具體展開。

三、代碼實現

首先是獲取 download 文件夾下所有文件的文件名

import glob

import os

path = r'C:xxxxdownload'

file_lst = glob.glob(path + '/*')

# 列表推導式

filename_lst = [os.path.basename(i) for i in file_lst]

print(filename_lst)

接下來根據文件的后綴名判斷是否需要壓縮,先看一下代碼框架

for i in filename_lst:

if '.' in i:

# 獲取后綴名

suffix = i.split('.')[-1]

# 逐個將后綴名和各格式的壓縮后綴匹配

if suffix == 'gz':

pass

if ...: # 再次判斷新產生的文件名是否以 .tar 結尾

pass

if suffix == 'tar':

pass

if suffix == 'zip':

pass

if suffix == 'rar':

pass

這里有2個注意點:

  1. 有些文件沒有后綴名,因此可能不存在 .,這時用 filename.split('.')[-1]會報錯,因此需要先判斷
  2. 以.gz 結尾的文件,解壓后需要再次判斷是否是以 .tar 結尾,然后我們就可以分別將四種壓縮文件的解壓代碼寫成函數,符合時候單獨調用即可

處理.gz 文件

import gzip

def ungz(filename):

filename = filename[:-3] # gz文件的單文件解壓就是去掉 filename 后面的 .gz

gz_file = gzip.GzipFile(filename)

with open(filename, "w+") as file:

file.write(gz_file.read())

return filename # 這個gzip的函數需要返回值以進一步配合untar函數

前面反復提及的gz文件有可能跟tar文件配合,因此解壓gz文件后需要再判斷是否有必要解開tar文件

這里就可以先把tar文件的函數寫出來


——熱門課程推薦:

想學習PYTHON數據分析與金融數字化轉型精英訓練營,您可以點擊>>>“人才轉型”了解課程詳情;

想從事業務型數據分析師,您可以點擊>>>“數據分析師”了解課程詳情;

想從事大數據分析師,您可以點擊>>>“大數據就業”了解課程詳情;

想成為人工智能工程師,您可以點擊>>>“人工智能就業”了解課程詳情;

想了解Python數據分析,您可以點擊>>>“Python數據分析師”了解課程詳情;

想咨詢互聯網運營,你可以點擊>>>“互聯網運營就業班”了解課程詳情; 

想了解更多優質課程,請點擊>>>

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢