热线电话：13121318867

SQL答疑：如何使用关联子查询解决组内筛选的问题

2021-10-09

<a href='/map/sql/' style='color:#000;font-size:inherit;'>SQL</a>答疑：如何使用关联子查询解决组内筛选的问题

CDA数据分析师出品

导读：本文主要介绍SQL环境下的关联子查询，如何理解关联子查询，以及如何使用关联子查询解决组内筛选的问题。

什么是关联子查询

关联子查询是指和外部查询有关联的子查询，具体来说就是在这个子查询里使用了外部查询包含的列。

因为这种可以使用关联列的灵活性，将SQL查询写成子查询的形式往往可以极大的简化SQL语句，也使得SQL查询语句更方便理解。

关联子查询的执行逻辑

在关联子查询中，对于外部查询返回的每一行数据，内部查询都要执行一次。另外，在关联子查询中是信息流是双向的。外部查询的每行数据传递一个值给子查询，然后子查询为每一行数据执行一次并返回它的记录。然后，外部查询根据返回的记录做出决策。

关联子查询主要分为三步进行处理：

1、外部查询得到一条记录并传递到内部查询中；

2、内部查询基于输入值执行，并将返回值传递到外部查询中；

3、外部查询基于这个返回值再进行查询，并做出决策。

关联子查询与普通子查询的区别

在普通子查询中，执行顺序是由内到外，先执行内部查询再执行外部查询。内部查询的执行不依赖于外部查询，且内部查询只处理一次，外部查询基于内部查询返回值再进行查询，就查询完毕了。

而在关联子查询中，信息传播是双向而不是单向的。内部查询利用关联子查询涉及外部查询提供的信息，外部查询也会根据内部查询返回的记录进行决策。内部查询的执行依赖于外部查询，不能单独执行。

应用场景

在细分的组内进行比较时，需要使用关联子查询。

比如查询三门课程分数相同的学生，需要将各科考试成绩的记录按照学生进行分组，同一个学生的三科成绩分为一组，对组内的三科成绩进行比较是否相同，来筛选满足条件的学生。

再比如查询价格低于该品类平均价格的商品，需要将各品类的商品信息按照品类进行分组，同一个品类的商品记录分为一个组，对组内的多个商品计算平均价格，来筛选满足条件的商品。

例题精讲

员工表的表结构如下：

表中数据如下：

要解决的问题：

查询工资高于同职位的平均工资的员工信息

普通子查询的做法

遇到此类问题，首先想到的思路是对职位分组，这样就能分别得到各个职位的平均工资，再比较每个员工的工资与其对应职位的平均工资，大于则被筛选出来。

因此，第一步：分组统计各职位的平均工资

第二步：比较每个员工的工资与其对应职位的平均工资

因为子查询返回结果是5行，因此这段代码根本无法执行。

关联子查询的做法

通过设置表别名的方法，将一个表虚拟成两个表进行自连接，并且使用关联子查询，内部查询返回的结果，传递给外部查询进行比较筛选。

这段代码的执行步骤如下：

第一步：先执行外部查询，select* from emp e也就是遍历表中的每一条记录，而因为子查询中用到了自连接（where job=e.job），所以将外部查询的第一条记录，也就是

传递给子查询。

第二步：进入子查询后，传递给子查询的这条记录的job是clerk，子查询执行select avg(sal) from empwhere job=e.job 时，就会筛选出所有job='clerk'的员工，计算出平均工资。相当于执行了

将这个计算值传递给外部查询。

第三步：外部查询基于1037.5进行筛选，找出同职位工资高于1037.5的员工。相当于执行了

循环执行：

第一步：执行外部查询，即select* from emp e将外部查询的第二条记录，也就是

传递给子查询。

第二步：进入子查询后，传递给子查询的这条记录的job是salesman，子查询执行select avg(sal) from empwhere job=e.job时，就会筛选出所有job='salesman'的员工，计算出平均工资。相当于执行了

将这个计算值传递给外部查询。

第三步：外部查询基于1400进行筛选，找出同职位工资高于1400的员工。相当于执行了

继续循环直到表中的最后一条记录，最终返回满足条件的员工信息。

总结

普通子查询的内部查询独立于外部查询，可以单独执行，但子查询仅执行一次，外部查询基于返回值再进行查询和筛选，整个查询过程就结束了。

在关联子查询中，内部查询依赖于外部查询，不能单独执行。外部查询执行一次并传递一条记录给子查询，子查询就要执行一次并将返回值传递给外部查询，外部查询再执行筛选并决策，如此循环直到表中最后一条记录。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

SQL 表结构数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇国富如荷与中软国际教育签署战略合作协议，共育数字化人才

下一篇高校认可 | 北方民族大学数信学院师生在CDA认证考试中取得优异成绩

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

SQL答疑：如何使用关联子查询解决组内筛选的问题

什么是关联子查询

关联子查询的执行逻辑

关联子查询与普通子查询的区别

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据清洗全指南：基础核心+常用工具实操 ...

【CDA干货】数据挖掘与数据分析：区别、联系与职场 ...

CDA数据分析师：精通统计制图，让数据规律直观可感 ...

【CDA干货】MySQL分区键后，其他索引还生效吗？真相 ...

【CDA干货】Tableau同比环比增长率实操全指南：从入 ...

CDA数据分析师：特征处理实操指南，打通数据到价值 ...

【CDA干货】机器学习算法工程实用案例解析：从落地 ...

【CDA干货】卷积神经网络与无迹卡尔曼滤波融合：原 ...

CDA数据分析师：数据清洗实操指南，筑牢数据分析的 ...

【CDA干货】决策树模型变量重要性排序：原理、方法 ...

【CDA干货】Excel卡方检验实操全指南：从原理到落地 ...

CDA数据分析师：数据整合实操指南，打破数据孤岛， ...

【CDA干货】数据分析全流程常见问题：成因、危害与 ...

【CDA干货】维度表与事实表：数据仓库的核心双子星 ...

CDA数据分析师：数据读取实操指南，打通数据价值转 ...

【CDA干货】用户行为分析中泛化性指标：计算方法、 ...

【CDA干货】以数为鉴，读懂用户：三大行业用户行为 ...

CDA数据分析师：量化策略分析框架，解锁数据驱动决 ...

【CDA干货】随机森林模型训练全解析：从参数调优到 ...

【CDA干货】随机森林算法重要性分析：原理、实操与 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载