
相信大多数数据分析师在入手python的时候,在学习到time库与datetime库时,都会对两个库里面长得很像,又相互有关联的各种类和方法感到非常窝心。当接触到pandas处理时间序列的方法时,再次发现其中各种类和方法又和前面两个时间库的方法“长得好像又似乎有点不同”,此时,想必每个强迫症学习着内心早已经发出“土拨鼠呐喊”。
趁着宅在家躲疫情的间隙,托福司机重新对这3块知识内容重新梳理,及时制止内心的土拨鼠继续呐喊,现分享给大家。
(一) time库
1. time库与datetime库的关系
在 Python 文档里,time是归类在Generic Operating System Services中,换句话说,它提供的功能是更加接近于操作系统层面的。
而datetime库比time库高级了不少,提供了更多实用的方法,可以理解为datetime基于time进行了封装。
我们先看一下time库。
time库主要围绕unix时间戳进行操作,主要包含一个类:struct_time。
那什么是unix时间戳?它是指格林威治时间1970年01月01日00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数,比如格林威治时间1970年01月01日00分01秒就以数值1来记载。
time库中只要有四个函数可以获得时间函数,其中time.time()方法就可以获得当前时间戳:
比如我们想获得当前unix时间戳,unix时间戳以浮点数记载:
获得当地时区的unix时间戳:
这里我们会发现,上面的unix时间戳不再以浮点数记载,而是struct_time对象,里面一共记载了九个时间元素,分别是年月日时分秒,tm_wday是这周的第几天(周一是0),tm_yday是这年的第几天,tm_isdst是夏令时。
除此以外,time.localtime()还可以把unix时间戳转化为struct_time格式:
2. struct_time对象的格式化
time库中对时间进行格式化的方法主要是通过time.strftime()方法,基本用法如下:
l time.strftime(tpl,ts)
§ tpl:格式化模块字符串,用来定义输出效果
§ ts:计算机内部时间类型变量,一般使用struct_time对象
该方法返回的对象其实是字符串,比如将上面的struct_time对象gmtime进行时间格式转化:
上面的'%Y-%m-%d %H:%M:%S'是用来转化strcut_time对象的格式化字符串,除此以外还有:
这个表很重要,我们后面在datetime库中的对象以及pandas的datetime型Series对象在日期格式化操作的时候,都能用得上。
而如果我们想要将字符型的时间转化为struct_time对象,可以用time.strptime()方法,格式刚好与time.strftime()方法对应。
比如,如果有字符串时间'2020-02-01 16:49:11',要将其转化为struct_time对象:
3. time库中的休眠时间
time库中最常用的方法还有time.sleep(),比如,如果我们想要程序等待3.3秒之后再输出,可以写time.sleep(3.3)
time.sleep()方法在爬虫等各种程序中应用较广,再次不在累述。
(二) datetime库
datetime库可以说是time库的高级封装,在各种日期数据处理方面,相对于time库,datetime库作了进一步的升级。
datetime库主要记载时间的类有datetime.date类、datetime.time、datetime.datetime类。
1. datetime.date类
在datetime库中,可以通过datetime.date()方法生成年、月、日时间,返回的对象是datetime.date类。
这里要注意,datetime.date类只记录年、月、日这三个时间元素,不记录时分秒等其他时间元素。
通过datetime.date()方法中的参数year、month、day指定年、月、日三个时间元素。
我们可以通过datetime.date.today()方法来获得当前的日期,该方法返回的对象也是datetime.date类。
(1) datetime.date类的属性
另外,datetime.date类常用的属性有year、month、day。参数都为整数:
(2) datetime.date类时间格式化方法
datetime.date类的时间格式化方法也叫strftime(),比如当前我们有datetime.date对象date_samp如下:
通过datetime.date对象直接调用.strftimie()方法进行指定时间格式转换如下:
而格式化字符串可以参考前面time库的表格。这里大家会发现,虽然格式化方法的strftime()的名字和前面一样,且格式化字符串也和前面time库的是一样的,但是其调用方式却又不相同,这也是为什么很多同学两个时间库的格式化方法总是不小心写错的原因。
当然,像上面这种常见的字符串日期类型,每次都要使用这么复杂的格式化字符串来转换,未免太过繁琐,其实datetime.date对象可以直接使用方法.isoformat()来转化:
和datetime.date类的属性相似,datetime.time类也有类似的属性:
而时间格式化的方法和datetime.date类一样,也是通过datetime.time对象的.strftime()方法来调用:
(3) unix时间戳转换
time库中的unix时间戳,如何转化为datetime.date类?用实例的方法.fromtimestamp()即可,比如我们有当前的时间戳current_timestamp:
上面的时间戳我们如果想获得其中的日期的话,可以使用
datetime.date.fromtimestamp()方法直接转换:
当然,返回来的也是datetime.date类的对象。
4. datetime.time类
datetime库中的datetime.time类用来记载时间,包括时、分、秒、毫秒。
datetime.time()方法可以创建datetime.time类的对象,参数包括hour、minute、second、microsecond。
datetime.time类的属性:
而时间格式化的方法和datetime.date类一样,也是通过datetime.time对象的.strftime()方法来调用:
上面可以看到,datetime.time对象的.strftime()方法返回来的对象也是字符串。
同样地,datetime.time对象也有.isoformat()方法:
但是需要留意的是, datetime.time对象并没有.fromtimestamp()方法来进行时间戳转换。
5. datetime.datetime类
datetime.datetime类的对象主要是用作记录年月日、时分秒等时间单位,我们可以把它看做是datetime.date类和datetime.time类的“结合体”。
创建datetime.datetime类对象的方法和datetime.time类也是基本一致的,参数包含year、month、day、hour、minute、second、microsecond。 但是至少要包含year、month、day三个参数。
而datetime.datetime类的时间格式化的方法,也是.strftime(),格式化字符串和前面也是一致的:
datetime.datetime对象的.isoformat()方法返回结果会有点“与众不同”,日期和时间之间多了一个字符‘T’:
而如果想快速获得当前的日期时间,可以使用datetime.datetime.now():
6. datetime.timedelta类
datetime.timedelta类用来记录时间间隔类,给一个时间点加减此类,即可得到一个新的时间。
datetime.timedelta()方法可以用来创建datetime.timedelta对象,参数包含days、hours、minutes、seconds、microseconds。
比如我们创建一个45天零6小时的时间间隔:
时间间隔对象生成后,就可以使用datetime对象对其进行加减:
(三) time库与datetime库时间对象互转
看到这里,相信很多同学内心的土拨鼠都在惨叫:太多东西要记了,我太难啦~
确实,使用Python写爬虫等程序时,时常需要用到time库与datetime库中的各种时间对象,最为头疼的地方往往是各种时间格式转换。其实,在了解time库和datetime库的各种类和属性方法后,记住下面这张图可以事半功倍:
我们通过一下过程捋一下思路:
字符串型时间转datetime.datetime对象,用
datetime.datetime.strptime()方法:
datetime.datetime转字符串,用datetime.datetime实例的.strftime()方法:
字符串型时间转struct_time,用time.strptime()方法:
struct_time转字符串型时间,用time.strftime()方法:
struct_time转unix时间戳,用time.mktime()方法:
unix时间戳转struct_time,用time.gmtime()或time.localtime()方法:
今天我们把python中time库与datetime库几个主要的时间对象的方法都理清楚了,同时将其互转的规律也作了总结和归纳。篇幅有限,我们在下一系列的文章里,继续探讨pandas库中的时间对象和time库、datetime库的对象相互之间的关联性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11