从 LeetCode 的题目再看 MySQL Explain

数据库 MySQL
今天阿粉主要是想通过 LeetCode 上面的一个题目来再带大家看看 MySQL 的变量使用以及通过 Explain 的解析看看SQL 的执行过程。

[[376540]]

本文转载自微信公众号「Java极客技术」,作者鸭血粉丝 。转载本文请联系Java极客技术公众号。  

今天阿粉主要是想通过 LeetCode 上面的一个题目来再带大家看看 MySQL 的变量使用以及通过 Explain 的解析看看SQL 的执行过程。虽然平时在工作中对于 MySQL 使用的很多,但是相对于 MySQL 的变量使用相对还是较少的,所以阿粉在刚看到的时候还是有点懵的,不过我相信大家肯定不会像阿粉一样,毕竟能关注我们公众号的读者都是优秀的。

题目

题目描述:编写一个 SQL 查询,查找所有至少连续出现三次的数字。并且给了一个示例,阿粉按照题目给的示例在本地创建了 Logs 表和插入相应的数据,如下:

我们可以看到在给定上面的 Logs 表中, 1 是唯一连续出现至少三次的数字,所以最后输出的结果是 1。

原始题目:LeetCode 180

刚看到题目的时候,阿粉一瞬间还是没反应过来,不知道该如何着手进行,思索了一下考虑是否可以用自连接来实现呢?然后根据题目的意思就写出了如下的 SQL。

  1. SELECT DISTINCT 
  2.  l1.num  
  3. FROM 
  4.  `Logs` l1, 
  5.  `Logs` l2, 
  6.  `Logs` l3  
  7. WHERE 
  8.  l1.num = l2.num  
  9.  AND l2.num = l3.num  
  10.  AND l1.id = l2.id - 1  
  11.  AND l2.id = l3.id - 1 

写完过后阿粉第一次提交,提示下面错误,可以看到是最后没有将返回重命名,调整了一下 SQL,就l1.num 改成l1.num as ConsecutiveNums 再次提交,得到的第二张通过的图。

看开始看到通过,阿粉还在想这道题也没什么啊,还是 so easy 的嘛。但是突然阿粉转念一想,这个题目说的是连续出现,并没有说 ID 是连续的啊,如果 ID 不连续的话,这种就不对了,还有就是如果需要连续 4 次出现的,5 次出现的数字呢?总不能一直自连接下去吧。如果写成这样那整个 SQL 就太不灵活了。

随后阿粉就看了一下官方解答以及相关评论,果不其然虽然官方给出的解答跟阿粉的一致,但是下面的评论却有很多小伙伴都在说这个 ID 不连续的问题。

既然反馈这种做法有问题,那自然就会有好事之者会想到解决办法,果然评论区的一个大佬给出了下面的这种解法

刚看到这个解法的时候,阿粉一下子没有看懂,把这个代码进行了提交,果然也是正常的通过了。而且这种解法不会被出现几次的条件给限制。抱着学习的心态,阿粉准备研究一下这条 SQL 里面的内容。

SQL 拆解

首先这条 SQL 里面有这么几个地方让阿粉迷惑,第一个是@ 符号,然后是:= 然后还有个 case when then 语法,平日里在 CRUD 的时候没遇到过这种写法,不过不知道没关系,Google 一下就好了。网上查了下,@prev 表示的是声明变量,:=操作是 MySQL 的赋值操作,case when then when 后面接的是判断条件,条件成立则会返回then 后面的结果,需要注意的是 case 只会返回第一个符合条件的结果,剩下将会被忽略。

简单的了解了上面几个知识点过后,我们就可以对下面这条 SQL 进行拆解了。

  1. select distinct Num as ConsecutiveNums 
  2. from ( 
  3.   select Num,  
  4.     case  
  5.       when @currnet = Num then @count := @count + 1 
  6.       when (@currnet := Num) is not null then @count := 1 
  7.     end as CNT 
  8.   from Logs, (select @currnet := null,@count := 0) as t 
  9. as temp 
  10. where temp.CNT >= 3 
  1. 最外层的 select distinct Num as ConsecutiveNums from () as temp where temp.CNT >= 3 ; 我们可以看到中间的小括号里面被派生成了一个临时表,表名叫做 temp,并且 temp 表中有两个字段分别是Num,CNT。其实Num 则是表Logs 里面的数字,CNT 则是连续出现的累积次数,最后的where temp.CNT >= 3 则是在根据要求连续出现的次数进行查询。
  2. 派生语句SELECT Num,CASE WHEN @currnet=Num THEN @count:=@count+1 WHEN (@currnet:=Num) IS NOT NULL THEN @count:=1 END AS CNT FROM LOGS,(SELECT @currnet:=NULL,@count:=NULL) AS t 包含两个部分,一个是Select 中的case when then 另一个是from 中的 (select @currnet:= null,@count := null) as t 其中select @currnet:= null,@count := null 也是一个派生表,这里通过声明两个变量@currnet, @count 并赋值为null 。
  3. 中间派生的表 temp 的内容如下,通过生成记录每个数字出现的次数的临时表来查询数据。

下面我们通过explain 命令看下整个 SQL 的执行过程,:

  • 从select_type中我们可以看到总共派生了两个表,跟我们上面分析的一致;
  • ID 为 3 的派生表的内容是select @current := null,@count := 0 定义两个变量并赋值,并且 id 越大越先执行;
  • case 语句中第一个when 中判断当前扫描到的 num 值与定义的变量是否一致,如果一致则 count 加一,不一致则进行下一个when 条件判断,并将count 赋值为 1 返回;
  • 经过全表扫描过后,就得到了上面的中间表 temp 的内容;

不得不说,上面的方案是很完美的,不存在 ID 是否连续的问题,也不会多层自连接,而且也可以根据要求找出连续出现的次数,相对灵活。刚开始看到这个 SQL 的时候,阿粉并不清楚整个执行的过程,然后通过 explain 才渐渐明白整个执行过程, 而且对于在 SQL 中使用变量也有了一定的了解。

 

责任编辑:武晓燕 来源: Java极客技术
相关推荐

2010-10-12 13:55:41

MySQL EXPLA

2017-07-27 20:00:47

MySQLEXPLAIN命令

2014-02-04 07:59:27

2011-08-18 11:31:06

MySQL性能分析explain

2017-04-07 14:30:26

2010-05-21 16:55:47

MySQL EXPLA

2009-12-10 16:12:07

EXPLAIN

2023-09-21 10:55:51

MysqlSQL语句

2022-02-15 07:36:21

SQLEXPLAIN数据库

2011-04-19 12:32:41

2010-05-19 10:37:06

MySQL expla

2020-10-19 19:45:58

MySQL数据库优化

2021-03-01 08:20:06

AndroidFileProvideContentProv

2023-09-05 07:29:01

2019-09-17 15:13:05

MySQLEXPLAIN数据库

2011-08-22 15:05:03

MySQLEXPLAIN

2012-07-12 15:27:46

WebGL

2019-07-16 11:06:09

TCP四次挥手半关闭

2011-08-24 15:11:15

explain中文man

2011-08-23 13:16:41

SQLEXPLAIN
点赞
收藏

51CTO技术栈公众号