ADADADADAD

将MySQL去重操作优化到极致之三弹连发[ mysql数据库 ]

mysql数据库时间：2024-12-24 19:10:49

作者：文/会员上传

如何提高mysql查询效率

简介：

将MySQL去重操作优化到极致之三弹连发（一）：巧用索引与变量

http://blog.csdn.net/wzy0623/article/details/54377986

实验准备:
MySQL 5.6.14

create table t_source
(

以下为本文的正文内容，内容仅供参考！本站为公益性网站，复制本文以及下载DOC文档全部免费。

将MySQL去重操作优化到极致之三弹连发（一）：巧用索引与变量

http://blog.csdn.net/wzy0623/article/details/54377986

实验准备:
MySQL 5.6.14

1.使用表连接查重

由于机器性能的差异,使用表连接方式,我的环境耗时14s
执行计划如下:

可以看到MySQL 给 t1表的item_id自动创建了一个索引.

2.使用MySQL特性

耗时10s左右.
效率尚可,省时省力.

3.使用自定义变量

耗时18s
执行计划如下:

以上都是没有添加任何索引的情况.

添加索引如下:
create index idx_sort on t_source(created_time,item_name,item_id);
analyze table t_source;

创建索引之后,
使用表连接查询方式耗时11s,小幅提升.
使用MySQL特性的方式,耗时11-12s,反而更慢.
使用MySQL自定义变量的方式,耗时还是18s.

很显然,MySQL自定义变量的方式,其实没有利用索引.

最终改进SQL

耗时11s.
该语句具有以下特点。
（1）消除了嵌套子查询，只需要对t_source表进行一次全索引扫描，查询计划已达最优。
（2）无需distinct二次查重。
（3）变量判断与赋值只出现在where子句中。
（4）利用索引消除了filesort。

强制通过索引idx_sort查找数据行 -> 应用where筛选器 -> 处理select列表 -> 应用order by子句。

为了使变量能够按照created_time和item_name的排序顺序进行赋值和比较，必须按照索引顺序查找数据行。这里的force index (idx_sort)提示就起到了这个作用，必须这样写才能使整条查重语句成立。否则，因为先扫描表才处理排序，因此不能保证变量赋值的顺序，也就不能确保查询结果的正确性。order by子句同样不可忽略，否则即使有force index提示，MySQL也会使用全表扫描而不是全索引扫描，从而使结果错误。
索引同时保证了created_time,item_name的顺序，避免了文件排序。force index (idx_sort)提示和order by子句缺一不可，索引idx_sort在这里可谓恰到好处、一举两得。
查询语句开始前，先给变量初始化为数据中不可能出现的值，然后进入where子句从左向右判断。先比较变量和字段的值，再将本行created_time和item_name的值赋给变量，按created_time,item_name的顺序逐行处理。item_name是字符串类型，(@b:=item_name)不是有效的布尔表达式，因此要写成(@b:=item_name) is not null。

“insert into t_target select * from t_source group by created_time,item_name;”的写法，它受“sql_mode='ONLY_FULL_GROUP_BY'”的限制。

运行耗时和原文有出入,可能是因为我的环境是SSD的缘故.
另外,避免回表的开销,可以增加索引的字段

drop index idx_sort on t_source;
create index idx_sort on t_source(created_time,item_name,item_id,modified_time,other);
analyze table t_source;

使用上述索引,终极改进的SQL 耗时可以降到 9.5s

参考:
http://blog.csdn.net/wzy0623/article/details/54378367
http://blog.csdn.net/wzy0623/article/details/54378575

将MySQL去重操作优化到极致之三弹连发.docx

将本文的Word文档下载到电脑

下载

热门标签: mysql之三优化

精品

申请https需要什么条件

将MySQL去重操作优化到极致之三弹连发[ mysql数据库 ]

将MySQL去重操作优化到极致之三弹连发.docx

精品

热门推荐

大家都在看