SQL数据分析之子查询

运维 数据库运维
子查询用于为主查询返回其所需数据,或者对检索数据进行进一步的限制,通常将一个查询(子查询)的结果作为另一个查询(主查询)的数据来源或判断条件,常见的子查询有WHERE子查询,HAVING子查询,FROM子查询,SELECT子查询,EXISTS子查询。

[[408468]]

子查询用于为主查询返回其所需数据,或者对检索数据进行进一步的限制,通常将一个查询(子查询)的结果作为另一个查询(主查询)的数据来源或判断条件,常见的子查询有WHERE子查询,HAVING子查询,FROM子查询,SELECT子查询,EXISTS子查询。

子查询是一种嵌套在其他 SQL 查询的 WHERE 子句中的查询,可以在 SELECT、INSERT、UPDATE 和 DELETE 语句中,同逻辑运算符一起使用。

示例工具:MySQL8.0、Navicat Premium 12

本文讲解内容:SQL子查询

适用范围:子查询在SQL数据分析中的应用

使用子查询必须遵循以下几个规则:

  • 子查询必须括在圆括号中。
  • 子查询的 SELECT 子句中只能有一个列,除非主查询中有多个列,用于与子查询选中的列相比较。
  • 子查询不能使用 ORDER BY,不过主查询可以。在子查询中,GROUP BY 可以起到同 ORDER BY 相同的作用。
  • 返回多行数据的子查询只能同多值操作符一起使用,比如 IN 操作符。
  • SELECT 列表中不能包含任何对 BLOB、ARRAY、CLOB 或者 NCLOB 类型值的引用。
  • 子查询不能直接用在聚合函数中。
  • BETWEEN 操作符不能同子查询一起使用,但是 BETWEEN 操作符可以用在子查询中。

创建数据表

通常情况下子查询都与 SELECT 语句一起使用,其基本语法如下所示:

  1. SELECT column_name [, column_name ] 
  2. FROM   table1 [, table2 ] 
  3. WHERE  column_name OPERATOR (SELECT column_name [, column_name ] 
  4.                              FROM table1 [, table2 ] 
  5.                              [WHERE]) 

对于子查询的数据演示创建两个表,一个是薪水表,另一个是职位表,并且插入数据。

  1. #创建薪水表SALARY 
  2. CREATE TABLE SALARY ( 
  3. ID VARCHAR ( 10 ), 
  4. NAME VARCHAR ( 10 ), 
  5. AGE VARCHAR ( 10 ), 
  6. ADDRESS VARCHAR ( 10 ), 
  7. SAL INT(10) ); 

给薪水表插入数据,数据内容如下所示:

  1. # 给薪水表插入数据 
  2. INSERT INTO SALARY(ID,NAME,AGE,ADDRESS,SAL) 
  3. VALUES 
  4. ('C001','Rmesh',35,'Ahmedabad',2000), 
  5. ('C002','Khilan',25,'Delhi',1500), 
  6. ('C003','Kaushik',23,'Kota',2000), 
  7. ('C004','Chaitali',25,'Mumbai',6500), 
  8. ('C005','Hardik',27,'Bhopal',8500), 
  9. ('C006','Komal',22,'MP',4500), 
  10. ('C007','Tom',26,'MP',5500), 
  11. ('C008','Muffy',24,'Indore',10000); 

查询所有的薪水数据如下所示:

  1. SELECT * FROM  SALARY; 

同理创建一个职位表。

  1. #创建职位表JOB 
  2. CREATE TABLE JOB ( 
  3. JID VARCHAR ( 10 ), 
  4. JB VARCHAR ( 10 )); 

给职位表插入数据,数据内容如下所示:

  1. # 给职位表插入数据 
  2. INSERT INTO JOB(JID,JB) 
  3. VALUES 
  4. ('C001','Teacher'), 
  5. ('C002','Docter'), 
  6. ('C003','Teacher'), 
  7. ('C004','Worker'), 
  8. ('C005','Nurse'), 
  9. ('C006','Teacher'), 
  10. ('C007','Docter'), 
  11. ('C008','Teacher'); 

查询所有的职位数据如下所示:

  1. SELECT * FROM  JOB; 

子查询过滤

子查询最常见的使用是在WHERE子句的IN操作符中,以及用来填充计算列。先看一个简单的例子,要查询所有医生的薪水情况,这里首先在职位表中查询所有医生的JID,查询结果如下:

  1. SELECT JID 
  2. FROM JOB 
  3. WHERE JB='Docter'

然后在薪水表中查询ID为'C002','C007'的薪水情况,查询结果如下:

  1. SELECT SAL 
  2. FROM SALARY 
  3. WHERE ID IN('C002','C007'); 

这里使用子查询更加简便,子查询从内向外依次处理,在下面的SELECT语句中,MySQL实际上执行了两个操作,首先查询返回两个ID号:C002和C007。

然后,这两个值以IN操作符要求的逗号分隔的格式传递给外部查询的WHERE子句,可以看到输出的结果是正确的,并且与前面WHERE子句所返回的值相同。

  1. SELECT SAL 
  2. FROM SALARY 
  3. WHERE ID IN(SELECT JID 
  4.             FROM JOB 
  5.             WHERE JB='Docter'); 

使用子查询查询薪水大于8000的员工的所有信息,首先内部查询薪水大于8000的ID,然后外部使用一个WHERE查询即可得到结果。

  1. SELECT * 
  2. FROM SALARY 
  3. WHERE ID IN (SELECT ID 
  4.              FROM SALARY 
  5.              WHERE SAL > 8000); 

作为计算字段使用子查询

使用子查询的另一方法是创建计算字段,创建计算字段需要使用聚合函数,例如count,sum,avg,max,min等,这里首先计算平均薪水作为一个内查询,然后在外部使用WHERE子句进行查询,得出薪资比平均薪资低的员工的所有信息。

  1. SELECT * 
  2. FROM SALARY 
  3. WHERE SAL < (SELECT AVG(SAL)  
  4.              FROM SALARY); 

除使用WHERE过滤,还可以使用HAVING过滤,HAVING子句对分组统计函数进行过滤,也可以在HAVING子句中使用子查询,要查询薪资最高的人及其薪资情况,首先内部查询最高工资,然后外部以人名分组后使用HAVING子句过滤,查询结果如下。

  1. SELECT NAME,SAL 
  2. FROM SALARY 
  3. GROUP BY NAME 
  4. HAVING SAL = (SELECT MAX(SAL)  
  5.               FROM SALARY); 

本文转载自微信公众号「大话数据分析」,作者「尚天强」。可以通过以下二维码关注。转载本文请联系大话数据分析公众号。

 

责任编辑:武晓燕 来源: 大话数据分析
相关推荐

2011-08-12 09:29:32

SQL Server子查询

2021-06-29 07:04:39

SQL数据视图

2020-12-24 13:32:31

大数据数据分析SQL

2022-02-06 11:35:53

SQL数据函数

2020-07-26 19:19:46

SQL数据库工具

2015-08-14 10:28:09

大数据

2009-09-15 10:46:04

LINQ to SQL

2017-09-01 09:52:20

PythonPandas数据分析

2017-04-11 09:08:02

数据分析Python

2023-05-04 12:41:30

ChatGPTSQL数据分析

2022-11-14 10:36:55

数据科学数据分析

2015-10-26 10:41:10

数据分析思想指南

2015-08-11 15:52:52

大数据数据分析

2021-06-06 19:03:25

SQL大数据Spark

2023-10-04 00:17:00

SQL数据库

2020-10-27 09:27:46

SQL分析数据

2021-08-09 10:15:34

数据库数据分析师

2021-02-25 11:42:23

大数据数据分析sQL

2021-12-28 11:23:36

SQLServerExcel数据分析

2013-04-09 09:28:20

大数据大数据全球技术峰会
点赞
收藏

51CTO技术栈公众号