MySQL里面的子查询的基本使用

目录
    •  2. mysql 列子查询:
    • 3. mysql 行子查询:
    • 4. mysql 表子查询:
    • 1. any进行子查询
    • 2. 使用in进行子查询
    • 3. 使用some进行子查询
    • 4. 使用all进行子查询
    • 9.exists谓词

    一、子查询定义

       定义:

      子查询允许把一个查询嵌套在另一个查询当中。

      子查询,又叫内部查询,相对于内部查询,包含内部查询的就称为外部查询。

      子查询可以包含普通select可以包括的任何子句,比如:distinct、 group by、order by、limit、join和union等;但是对应的外部查询必须是以下语句之一:select、insert、update、delete、set或 者do。

      子查询的位置:select 中、from 后、where 中.group by 和order by 中无实用意义。

    二、子查询分类

    子查询分为如下几类:
        1. 标量子查询:返回单一值的标量,最简单的形式。
        2. 列子查询:返回的结果集是 n 行一列。
        3. 行子查询:返回的结果集是一行 n 列。
        4. 表子查询:返回的结果集是 n 行 n 列。

      可以使用的操作符:= > < >= <= <> any in some all exists

      一个子查询会返回一个标量(就一个值)、一个行、一个列或一个表,这些子查询称之为标量、行、列和表子查询。

      如果子查询返回一个标量值(就一个值),那么外部查询就可以使用:=、>、<、>=、<=和<>符号进行比较判断;如果子查询返回的不是一个标量值,而外部查询使用了比较符和子查询的结果进行了比较,那么就会抛出异常。

    1. 标量子查询:

    是指子查询返回的是单一值的标量,如一个数字或一个字符串,也是子查询中最简单的返回形式。 可以使用 = > < >= <= <> 这些操作符对子查询的标量结果进行比较,通常子查询的位置在比较式的右侧

    示例:

    select * from article where uid = (select uid from user where status=1 order by uid desc limit 1)
    select * from t1 where column1 = (select max(column2) from t2)
    select * from article as t where 2 = (select count(*) from article where article.uid = t.uid)
    

     2. mysql 列子查询:

        指子查询返回的结果集是 n 行一列,该结果通常来自对表的某个字段查询返回。
        可以使用 = > < >= <= <> 这些操作符对子查询的标量结果进行比较,通常子查询的位置在比较式的右侧
        可以使用 in、any、some 和 all 操作符,不能直接使用 = > < >= <= <> 这些比较标量结果的操作符。
        示例:

     select * from article where uid in(select uid from user where status=1)
    select s1 from table1 where s1 > any (select s2 from table2)
    select s1 from table1 where s1 > all (select s2 from table2)

    not in 是 <> all 的别名,二者相同。

    特殊情况

    • 如果 table2 为空表,则 all 后的结果为 true;
    • 如果子查询返回如 (0,null,1) 这种尽管 s1 比返回结果都大,但有空行的结果,则 all 后的结果为 unknown 。

    注意:对于 table2 空表的情况,下面的语句均返回 null:

    select s1 from table1 where s1 > (select s2 from table2)
    select s1 from table1 where s1 > all (select max(s1) from table2)

    3. mysql 行子查询:

    指子查询返回的结果集是一行 n 列,该子查询的结果通常是对表的某行数据进行查询而返回的结果集。

    例子:

    select * from table1 where (1,2) = (select column1, column2 from table2)
    注:(1,2) 等同于 row(1,2)
    select * from article where (title,content,uid) = (select title,content,uid from blog where bid=2)
    

    4. mysql 表子查询:

    指子查询返回的结果集是 n 行 n 列的一个表数据。

    例子:

    select * from article where (title,content,uid) in (select title,content,uid from blog)

    三、字查询例举

    1. any进行子查询

      any关键词的意思是“对于子查询返回的列中的任何一个数值,如果比较结果为true,就返回true”。

      好比“10 >any(11, 20, 2, 30)”,由于10>2,所以,该该判断会返回true;只要10与集合中的任意一个进行比较,得到true时,就会返回true。 

    select table1.customer_id,city,count(order_id)
    from table1join table2
    on table1.customer_id=table2.customer_id
    where table1.customer_id<>'tx' and table1.customer_id<>'9you'
    group by customer_id
    having count(order_id) >
    any (
    select count(order_id)
    from table2
    where customer_id='tx' or customer_id='9you'
    group by customer_id);
    

      any的意思比较好明白,直译就是任意一个,只要条件满足任意的一个,就返回true。

    2. 使用in进行子查询

      使用in进行子查询,这个我们在日常写sql的时候是经常遇到的。in的意思就是指定的一个值是否在这个集合中,如何在就返回true;否则就返回false了。

      in是“=any”的别名,在使用“=any”的地方,我们都可以使用“in”来进行替换。

      有了in,肯定就有了not in;not in并不是和<>any是同样的意思,not in和<>all是一个意思。

    3. 使用some进行子查询

      some是any的别名,用的比较少。  

    4. 使用all进行子查询

      all必须与比较操作符一起使用。all的意思是“对于子查询返回的列中的所有值,如果比较结果为true,则返回true”。

      好比“10 >all(2, 4, 5, 1)”,由于10大于集合中的所有值,所以这条判断就返回true;而如果为“10 >all(20, 3, 2, 1, 4)”,这样的话,由于10小于20,所以该判断就会返回false。

      <>all的同义词是not in,表示不等于集合中的所有值,这个很容易和<>any搞混,平时多留点心就好了。

    5.标量子查询

      根据子查询返回值的数量,将子查询可以分为标量子查询和多值子查询。在使用比较符进行子查询时,就要求必须是标量子查询;如果是多值子查询时,使用比较符,就会抛出异常。

    6. 多值子查询

      与标量子查询对应的就是多值子查询了,多值子查询会返回一列、一行或者一个表,它们组成一个集合。我们一般使用的any、in、all和some等词,将外部查询与子查询的结果进行判断。如果将any、in、all和some等词与标量子查询,就会得到空的结果。

    7. 独立子查询

      独立子查询是不依赖外部查询而运行的子查询。什么叫依赖外部查询?先看下面两个sql语句。

      sql语句1:获得所有hangzhou顾客的订单号。 

    select order_id
    from table2
    where customer_idin
              (select customer_id
              from table1
              where city='hangzhou');
       sql语句2:获得城市为hangzhou,并且存在订单的用户。
     
    select *
    from table1
    where city='hangzhou' and exists
                    (select *
                    from table2
                    where table1.customer_id=table2.customer_id);
    

             上面的两条sql语句,虽然例子举的有点不是很恰当,但是足以说明这里的问题了。

        对于sql语句1,我们将子查询单独复制出来,也是可以单独执行的,就是子查询与外部查询没有任何关系。

        对于sql语句2,我们将子查询单独复制出来,就无法单独执行了,由于sql语句2的子查询依赖外部查询的某些字段,这就导致子查询就依赖外部查询,就产生了相关性。

      对于子查询,很多时候都会考虑到效率的问题。当我们执行一个select语句时,可以加上explain关键字,用来查看查询类型,查询时使用的索引以及其它等等信息。比如这么用:

    explainselect order_id
      from table2
      where customer_idin
                (select customer_id
                from table1
                where city='hangzhou');
    

       使用独立子查询,如果子查询部分对集合的最大遍历次数为n,外部查询的最大遍历次数为m时,我们可以记为:o(m+n)。而如果使用相关子查询,它的遍历 次数可能会达到o(m+m*n)。可以看到,效率就会成倍的下降;所以,大伙在使用子查询时,一定要考虑到子查询的相关性。

    8.相关子查询

      相关子查询是指引用了外部查询列的子查询,即子查询会对外部查询的每行进行一次计算。但是在mysql的内部,会进行动态优化,会随着情况的不同会 有所不同。使用相关子查询是最容易出现性能的地方。而关于sql语句的优化,这又是一个非常大的话题了,只能通过实际的经验积累,才能更好的去理解如何进 行优化。

    9.exists谓词

      exists是一个非常牛叉的谓词,它允许数据库高效地检查指定查询是否产生某些行。根据子查询是否返回行,该谓词返回true或false。与其 它谓词和逻辑表达式不同的是,无论输入子查询是否返回行,exists都不会返回unknown,对于exists来说,unknown就是false。 还是上面的语句,获得城市为hangzhou,并且存在订单的用户。

    select *
    from table1
    where city='hangzhou' and exists
                    (select *
                    from table2
                    where table1.customer_id=table2.customer_id);
    

      关于in和exists的主要区别在于三值逻辑的判断上。exists总是返回true或false,而对于in,除了true、false值外, 还有可能对null值返回unknown。但是在过滤器中,unknown的处理方式与false相同,因此使用in与使用exists一样,sql优化 器会选择相同的执行计划。

      说到了in和exists几乎是一样的,但是,就不得不说到not in和not exists,对于输入列表中包含null值时,not exists和not in之间的差异就表现的非常大了。输入列表包含null值时,in总是返回true和unknown,因此not in就会得到not true和not unknown,即false和unknown。

    10. 派生表

      上面也说到了,在子查询返回的值中,也可能返回一个表,如果将子查询返回的虚拟表再次作为from子句的输入时,这就子查询的虚拟表就成为了一个派生表。语法结构如下:

    from (subquery expression) as derived_table_alias
    

       由于派生表是完全的虚拟表,并没有也不可能被物理地具体化。

    四、子查询优化

      很多查询中需要使用子查询。使用子查询可以一次性的完成很多逻辑上需要多个步骤才能完成的sql操作,同时也可以避免事务或者表锁死。子查询可以使查询语 句很灵活,但子查询的执行效率不高。

      子查询时,mysql需要为内层查询语句的查询结果建立一个临时表。然后外层查询语句再临时表中查询记录。查询完毕 后,mysql需要撤销这些临时表。因此,子查询的速度会受到一定的影响。如果查询的数据量比较大,这种影响就会随之增大。

      在mysql中可以使用连接查 询来替代子查询。连接查询不需要建立临时表,其速度比子查询要快。

           使用连接(join)来代替子查询

           如:   

    例子1:

    select * from t1
    where t1.a1 notin (select a2 from t2 )
    优化后:
    select * from t1
    left join t2 on t1.a1=t2.a2
    where t2.a2 is null  

    例子2:

    select * from article where (title,content,uid) in (select title,content,uid from blog)
    优化后:
    select * from article
    innerjoin blog
    on (article.title=blog.title and article.content=blog.content and article.uid=blog.uid)
    

       不能优化的子查询:
      1、mysql不支持子查询合并和聚合函数子查询优化,mariadb对聚合函数子查询进行物化优化;
      2、mysql不支持from子句子查询优化,mariadb对from子句子查询进行子查询上拉优化;
      3、mysql和mariadb对子查询展开提供有限的支持,如对主键的操作才能进行上拉子查询优化;
      4、mysql不支持exists子查询优化,mariadb对exists关联子查询进行半连接优化,对exists非关联子查询没有进一步进行优化;
      5、mysql和mariadb不支持not exists子查询优化;
      6、mysql和mariadb对in子查询,对满足半连接语义的查询进行半连接优化,再基于代价评估进行优化,两者对半连接的代价评估选择方式有差异;
      7、mysql不支持not in子查询优化,mariadb对非关联not in子查询使用物化优化,对关联not in子查询不做优化;
      8、mysql和mariadb对>all非关联子查询使用max函数,<all非关联子查询使用min函数,对=all和非关联子查询使用exists优化;
      9、对>some和>any非关联子查询使用min函数,对<some和<any非关联子查询使用max函数,=any 和=some子查询使用半连接进行优化,对>some和>any关联子查询以及<some和<any关联子查询只有exists 优化。

    到此这篇关于mysql里面的子查询的基本使用的文章就介绍到这了,更多相关mysql 子查询内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!

    (0)
    上一篇 2022年3月21日
    下一篇 2022年3月21日

    相关推荐