ADADADADAD

SQL关联查询直接join 和子查询的区别[ mysql数据库 ]

mysql数据库时间：2024-12-25 09:55:50

作者：文/会员上传

如何提高mysql查询效率

简介：

运营组的同事最近提出一个需求，希望可以统计出用系统用户及订单情况，于是乎我们很想当然的写出了一个统计SQL，用户表user和行程表直接join，并且针对行程做了group，但SQL执行速度

以下为本文的正文内容，内容仅供参考！本站为公益性网站，复制本文以及下载DOC文档全部免费。

运营组的同事最近提出一个需求，希望可以统计出用系统用户及订单情况，于是乎我们很想当然的写出了一个统计SQL，用户表user和行程表直接join，并且针对行程做了group，但SQL执行速度出奇的慢。

explain selectusers.`mobile_num`, concat(users.`lastName` ,users.`firstName`) as userName, users.`company`,(case `users`.`idPhotoCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `idPhotoCheckStatus`,(case `users`.`driverLicenseCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `driverLicenseCheckStatus`,(case `users`.`companyCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `companyCheckStatus`,(case `users`.`unionCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `unionCheckStatus`,count(passenger_trip.id) as ptrip_numfrom usersleft join passenger_trip on passenger_trip.userId = users.idand passenger_trip.status != 'cancel'left join driver_trip on driver_trip.`userId`=users.`id` and driver_trip.`status` != 'cancel'where company != '本公司名' and company != '本公司昵称'

当时的第一反应是数据库挂住了，因为用户表的数据量10W左右，行程表的数据也是10W左右，不可能这么慢！通过explain查看分析计划，并且查看过关联字段的索引情况，发现这是一个最常见的关联查询，当然是通过join实现。

转而一想，10W*10W，经过笛卡尔集之后，这不是百亿级的数据筛选吗？！于是换了一种写法进行尝试。

explain selectusers.`mobile_num`, concat(users.`lastName` ,users.`firstName`) as userName, users.`company`,(case `users`.`idPhotoCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `idPhotoCheckStatus`,(case `users`.`driverLicenseCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `driverLicenseCheckStatus`,(case `users`.`companyCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `companyCheckStatus`,(case `users`.`unionCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `unionCheckStatus`,(select count(passenger_trip.id) frompassenger_trip wherepassenger_trip.userId = users.idand passenger_trip.status != 'cancel') as ptrip_num,(select count(driver_trip.id) fromdriver_trip wheredriver_trip.userId = users.idand driver_trip.status != 'cancel') as dtrip_numfrom userswhere company != '本公司名' and company != '公司昵称'

这样的效果居然比直接join快了N倍，执行速度从未知到10秒内返回，查看执行计划：

进一步调整SQL进行尝试：

explain selectusers.`mobile_num`, concat(users.`lastName` ,users.`firstName`) as userName, users.`company`,(case `users`.`idPhotoCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `idPhotoCheckStatus`,(case `users`.`driverLicenseCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `driverLicenseCheckStatus`,(case `users`.`companyCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `companyCheckStatus`,(case `users`.`unionCheckStatus` when '2' then '已认证' when '3' then '已驳回' else '待认证' end) as `unionCheckStatus`, ptrip_num, dtrip_numfrom usersleftjoin(select count(passenger_trip.id)as ptrip_num, passenger_trip.`userId` frompassenger_trip wherepassenger_trip.status != 'cancel' group by passenger_trip.`userId` ) as ptrip on ptrip.userId = users.id left join(select count(driver_trip.id)as dtrip_num, driver_trip.`userId` fromdriver_trip wheredriver_trip.status != 'cancel' group by driver_trip.`userId` ) as dtrip on dtrip.userId = users.idwhere company != '本公司名' and company != '公司昵称'

居然5秒内返回，这才是正常的预期，10W级的数据筛选，应该是几秒内返回的！

出现这种差别的原因，其实很简单，SQL语句执行的时候是有一定顺序的。

from 先选择一个表，构成一个结果集。where 对结果集进行筛选，筛选出需要的信息形成新的结果集。group by 对新的结果集分组。having筛选出想要的分组。select选择列。order by 当所有的条件都弄完了。最后排序。

第一种写法，直接join的结果，就是在100亿条数据中进行筛选；
后面两种则是优先执行子查询，完成10W级别的查询，再进行一次主表10W级的关联查询，所以数量级明显少于第一种写法。

SQL关联查询直接join 和子查询的区别.docx

将本文的Word文档下载到电脑

下载

热门标签: sql子查询leftjoin

精品

申请https需要什么条件

SQL关联查询直接join 和子查询的区别[ mysql数据库 ]

SQL关联查询直接join 和子查询的区别.docx

精品

热门推荐

大家都在看

SQL关联查询 直接join 和子查询的区别[ mysql数据库 ]

SQL关联查询 直接join 和子查询的区别.docx

精品

热门推荐

大家都在看

SQL关联查询直接join 和子查询的区别[ mysql数据库 ]

SQL关联查询直接join 和子查询的区别.docx