京公网安备 11010802034615号
经营许可证编号:京B2-20210330
来源:Python爬虫与数据挖掘
作者: Python进阶者
大家好,我是Python进阶者。
前言
我们在进行Python编程的时候,时常要将一些数据保存起来,其中最方便的莫过于保存在文本文件了。但是如果保存的文件太大,用文本文件就不太现实了,毕竟打开都是个问题,这个时候我们需要用到数据库。提到数据库,相信大部分人都不会陌生,今天我们要学的就是数据库中小编自认为最棒的Mysql数据库了。
为了让Python与Mysql 交互,这里我们需要用到Pymsql模块才行。
下载模块:
pip install pymysql
导入模块:
import pymysql
打开数据库连接软件 SqlYong,如图:
输入命令:
CREATE DATABASE IF NOT EXISTS people;
这样就创建了一个people 数据库。
USE people; CREATE TABLE IF NOT EXISTS student(id INT PRIMARY KEY AUTO_INCREMENT,NAME CHAR(10) UNIQUE,score INT NOT NULL,tim DATETIME)ENGINE=INNOBASE CHARSET utf8; INSERT INTO student(NAME,score,tim)VALUES('fasd',60,'2020-06-01') SELECT * FROM student;
通过上述操作便创建了一个数据表Student并向其中写入了数据,结果如下:
我们可以一行代码删除这个插入的 数据:
TRUNCATE student;
将下图中的参数依次填入初始化参数中,
db=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='people')
这样就连接到了people数据库,可以看下连接成功的打印信息:
可以看到我们打印了Mysql的版本和Host信息。
1.创建游标
cur=db.cursor
2.编写插入数据表达式
sql="INSERT INTO student(NAME,score,tim)VALUES('任性的90后boy',100,now())"
3.开启游标事件
cur.begin()
4.执行数据库语句,异常判断
try:
cur.execute(sql) 执行数据库语句
except Exception as e: print(e)
db.rollback() 发生异常进行游标回滚操作 else:
db.commit() 提交数据库操作 finally:
cur.close() 关闭游标
db.close() 关闭数据库
5,执行插入操作
数据库建立好后,我们可以对它们进行插入数据的操作。
import time
db=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='people')
cur=db.cursor()
db.begin()
sql="INSERT INTO student(NAME,score,tim) VALUES ('%s',%d,'%s')" data=('HW',90,tt) try:
cur.execute(sql%data)
except Exception as e:
print(e)
db.rollback() else:
db.commit() finally:
cur.close()
db.close()
这样就可以将数据插入进去了。我们还可以自定义插入:
import pymysql
import time tt=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
db=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='people')
cur=db.cursor()
db.begin()
s=input('string:')
d=input('number:')
sql="INSERT INTO student(NAME,score,tim)VALUES('%s','%s','%s')" try:
data=(s,d,tt)
cur.execute(sql%data)
except Exception as e: print(e)
db.rollback() else:
db.commit()
finally:
cur.close()
db.close()
另外,我们也可以同时插入多条数据,只需先定义好所有的数据,然后在调用即可,这里需要用到插入多条数据的函数Executemany,在这里我插入十万条数据,并测试插入时间,步骤如下:
import pymysql
import time start=time.time()
tt=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
db=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='people')
cur=db.cursor()
db.begin() sql="insert into student(NAME,score,tim)values(%s,%s,%s)" def get():
ab=[] for y in range(1,100000): if y>=100: data=('user-'+str(y),str(str(float('%.f'%(y%100)))),tt) else: data=('user-'+str(y),str(y),tt)
ab.append(data) return ab
try: data=get()
cur.executemany(sql,data) except Exception as e:
print(e)
db.rollback() else:
db.commit()
finally:
print('插入数据完毕')
cur.close()
db.close() end=time.time()
print('用时:',str(end-start))
6.执行更新操作
有些数据我们觉得它过时了,想更改,就要更新它的数据。
import time
db=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='people')
cur=db.cursor()
db.begin()
sql="update student set name='zjj' where score=100 " 当分数是100分的时候将名字改为zjj try:
cur.execute(sql%data) except Exception as e:
print(e)
db.rollback() else:
db.commit() finally:
cur.close()
db.close()
7.执行删除操作
有时候一些数据如果对于我们来说没有任何作用了的话了,我们就可以将它删除了,不过这里是删除数据表中的一条记录。
import pymysql
db=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='people')
cur=db.cursor()
db.begin()
sql="delete from student where name='fasd';" 当名字等于‘fasd’的时候删除这个记录 try:
cur.execute(sql) except Exception as e:
print(e)
db.rollback() else:
db.commit() finally:
cur.close()
db.close()
你也可以删除表中所有的数据,只需将Sql语句改为:
sql='TRUNCATE student;'
当然你也可以删除表,但是一般不建议这样做,以免误删:
DROP TABLE IF EXISTS student;
8.执行查询操作
有时候我们需要对数据库中的数据进行查询,Python也能轻松帮我们搞定。
import pymysql
import time tt=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
db=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='people')
cur=db.cursor()
db.begin()
sql="select * from student;" try:
cur.execute(sql)
res=cur.fetchall() 查询数据库中的数据 for y in res: print(y) 打印数据库中标的所有数据,以元祖的形式
except Exception as e: print(e)
db.rollback() else:
db.commit()
finally:
cur.close()
db.close()
在我们进行网络爬虫的时候,需要保存大量数据,这个时候数据库就派上用场了,可以更方便而且更快捷保存数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29