热线电话:13121318867

登录
首页大数据时代让python在后台自动解压各种压缩文件!
让python在后台自动解压各种压缩文件!
2020-11-09
收藏

作者: 陈熹

公众号:早起Python

一、需求描述

编写一个python程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识点:

  • os 模块综合应用
  • glob 模块综合应用
  • 利用 gzip zipfile rarfile tarfile 模块解压文件

二、步骤分析和前置知识

码代码之前需要将复杂问题解释成多个明确的要求,即这个程序实现的逻辑为:

  1. 定时检测某个文件夹(如 download 文件夹)是否存在压缩文件
  2. 如果有新出现的压缩文件则将其解压到当前文件夹内的新文件夹中 删除压缩文件
  3. 提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:

提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:

.gz: 即gzip,通常只能压缩一个文件

.tar: 本质上不是压缩工具而是打包工具,可以跟.gz配合形成.tar.gz的打包压缩格式

.zip: 和.tar.gz很类似但可以打包压缩多个文件

.rar: 打包压缩文件,最初用于DOS

因此,文件是否为压缩文件的判断逻辑可以如下:

  1. 建立一个含压缩包后缀的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
  2. 目标文件夹下的所有文件名运行filename.split(.)[-1]获取后缀名
  3. 判断后缀名是否在compressed_lst中,如果存在则运行后续的解压代码
  4. 如果是以gz结尾的文件,解压后需要再次判断是否是以.tar结尾,并进行相应处理

不同压缩文件的解压代码各不相同,在后续代码操作中具体展开。

三、代码实现

首先是获取 download 文件夹下所有文件的文件名

import glob

import os

path = r'C:xxxxdownload'

file_lst = glob.glob(path + '/*')

# 列表推导式

filename_lst = [os.path.basename(i) for i in file_lst]

print(filename_lst)

接下来根据文件的后缀名判断是否需要压缩,先看一下代码框架

for i in filename_lst:

if '.' in i:

# 获取后缀名

suffix = i.split('.')[-1]

# 逐个将后缀名和各格式的压缩后缀匹配

if suffix == 'gz':

pass

if ...: # 再次判断新产生的文件名是否以 .tar 结尾

pass

if suffix == 'tar':

pass

if suffix == 'zip':

pass

if suffix == 'rar':

pass

这里有2个注意点:

  1. 有些文件没有后缀名,因此可能不存在 .,这时用 filename.split('.')[-1]会报错,因此需要先判断
  2. 以.gz 结尾的文件,解压后需要再次判断是否是以 .tar 结尾,然后我们就可以分别将四种压缩文件的解压代码写成函数,符合时候单独调用即可

处理.gz 文件

import gzip

def ungz(filename):

filename = filename[:-3] # gz文件的单文件解压就是去掉 filename 后面的 .gz

gz_file = gzip.GzipFile(filename)

with open(filename, "w+") as file:

file.write(gz_file.read())

return filename # 这个gzip的函数需要返回值以进一步配合untar函数

前面反复提及的gz文件有可能跟tar文件配合,因此解压gz文件后需要再判断是否有必要解开tar文件

这里就可以先把tar文件的函数写出来


——热门课程推荐:

想学习PYTHON数据分析与金融数字化转型精英训练营,您可以点击>>>“人才转型”了解课程详情;

想从事业务型数据分析师,您可以点击>>>“数据分析师”了解课程详情;

想从事大数据分析师,您可以点击>>>“大数据就业”了解课程详情;

想成为人工智能工程师,您可以点击>>>“人工智能就业”了解课程详情;

想了解Python数据分析,您可以点击>>>“Python数据分析师”了解课程详情;

想咨询互联网运营,你可以点击>>>“互联网运营就业班”了解课程详情; 

想了解更多优质课程,请点击>>>

数据分析咨询请扫描二维码

若不方便扫码,搜微信号:CDAshujufenxi

最新资讯
更多
客服在线
立即咨询