• ADADADADAD

    mysql查询时offset过大影响性能的原因是什么[ mysql数据库 ]

    mysql数据库 时间:2024-11-28 13:25:06

    作者:文/会员上传

    简介:

    准备测试数据表及数据1.创建表CREATETABLE`member`(`id`int(10)unsignedNOTNULLAUTO_INCREMENT,`name`varchar(10)NOTNULLCOMMENT'姓名',`gender`tinyint(3)unsigne

    以下为本文的正文内容,内容仅供参考!本站为公益性网站,复制本文以及下载DOC文档全部免费。

    准备测试数据表及数据

    1.创建表

    CREATETABLE`member`(`id`int(10)unsignedNOTNULLAUTO_INCREMENT,`name`varchar(10)NOTNULLCOMMENT'姓名',`gender`tinyint(3)unsignedNOTNULLCOMMENT'性别',PRIMARYKEY(`id`),KEY`gender`(`gender`))ENGINE=InnoDBDEFAULTCHARSET=utf8;

    2.插入1000000条记录

    <?php$pdo=newPDO("mysql:host=localhost;dbname=user","root",'');for($i=0;$i<1000000;$i++){$name=substr(md5(time().mt_rand(000,999)),0,10);$gender=mt_rand(1,2);$sqlstr="insertintomember(name,gender)values('".$name."','".$gender."')";$stmt=$pdo->prepare($sqlstr);$stmt->execute();}?>mysql>selectcount(*)frommember;+----------+|count(*)|+----------+|1000000|+----------+1rowinset(0.23sec)

    3.当前数据库版本

    mysql>selectversion();+-----------+|version()|+-----------+|5.6.24|+-----------+1rowinset(0.01sec)

    分析offset过大影响性能的原因

    1.offset较小的情况

    mysql>select*frommemberwheregender=1limit10,1;+----+------------+--------+|id|name|gender|+----+------------+--------+|26|509e279687|1|+----+------------+--------+1rowinset(0.00sec)mysql>select*frommemberwheregender=1limit100,1;+-----+------------+--------+|id|name|gender|+-----+------------+--------+|211|07c4cbca3a|1|+-----+------------+--------+1rowinset(0.00sec)mysql>select*frommemberwheregender=1limit1000,1;+------+------------+--------+|id|name|gender|+------+------------+--------+|1975|e95b8b6ca1|1|+------+------------+--------+1rowinset(0.00sec)

    当offset较小时,查询速度很快,效率较高。

    2.offset较大的情况

    mysql>select*frommemberwheregender=1limit100000,1;+--------+------------+--------+|id|name|gender|+--------+------------+--------+|199798|540db8c5bc|1|+--------+------------+--------+1rowinset(0.12sec)mysql>select*frommemberwheregender=1limit200000,1;+--------+------------+--------+|id|name|gender|+--------+------------+--------+|399649|0b21fec4c6|1|+--------+------------+--------+1rowinset(0.23sec)mysql>select*frommemberwheregender=1limit300000,1;+--------+------------+--------+|id|name|gender|+--------+------------+--------+|599465|f48375bdb8|1|+--------+------------+--------+1rowinset(0.31sec)

    当offset很大时,会出现效率问题,随着offset的增大,执行效率下降。

    分析影响性能原因

    select*frommemberwheregender=1limit300000,1;

    因为数据表是InnoDB,根据InnoDB索引的结构,查询过程为:

      通过二级索引查到主键值(找出所有gender=1的id)。

      再根据查到的主键值通过主键索引找到相应的数据块(根据id找出对应的数据块内容)。

      根据offset的值,查询300001次主键索引的数据,最后将之前的300000条丢弃,取出最后1条。

      不过既然二级索引已经找到主键值,为什么还需要先用主键索引找到数据块,再根据offset的值做偏移处理呢?

      如果在找到主键索引后,先执行offset偏移处理,跳过300000条,再通过第300001条记录的主键索引去读取数据块,这样就能提高效率了。

      如果我们只查询出主键,看看有什么不同

      mysql>selectidfrommemberwheregender=1limit300000,1;+--------+|id|+--------+|599465|+--------+1rowinset(0.09sec)

      很明显,如果只查询主键,执行效率对比查询全部字段,有很大的提升。

      推测

      只查询主键的情况

      因为二级索引已经找到主键值,而查询只需要读取主键,因此mysql会先执行offset偏移操作,再根据后面的主键索引读取数据块。

      需要查询所有字段的情况

      因为二级索引只找到主键值,但其他字段的值需要读取数据块才能获取。因此mysql会先读出数据块内容,再执行offset偏移操作,最后丢弃前面需要跳过的数据,返回后面的数据。

      证实

      InnoDB中有buffer pool,存放最近访问过的数据页,包括数据页和索引页。

      为了测试,先把mysql重启,重启后查看buffer pool的内容。

      mysql>selectindex_name,count(*)frominformation_schema.INNODB_BUFFER_PAGEwhereINDEX_NAMEin('primary','gender')andTABLE_NAMElike'%member%'groupbyindex_name;Emptyset(0.04sec)

      可以看到,重启后,没有访问过任何的数据页。

      查询所有字段,再查看buffer pool的内容

      mysql>select*frommemberwheregender=1limit300000,1;+--------+------------+--------+|id|name|gender|+--------+------------+--------+|599465|f48375bdb8|1|+--------+------------+--------+1rowinset(0.38sec)mysql>selectindex_name,count(*)frominformation_schema.INNODB_BUFFER_PAGEwhereINDEX_NAMEin('primary','gender')andTABLE_NAMElike'%member%'groupbyindex_name;+------------+----------+|index_name|count(*)|+------------+----------+|gender|261||PRIMARY|1385|+------------+----------+2rowsinset(0.06sec)

      可以看出,此时buffer pool中关于member表有1385个数据页,261个索引页。

      重启mysql清空buffer pool,继续测试只查询主键

      mysql>selectidfrommemberwheregender=1limit300000,1;+--------+|id|+--------+|599465|+--------+1rowinset(0.08sec)mysql>selectindex_name,count(*)frominformation_schema.INNODB_BUFFER_PAGEwhereINDEX_NAMEin('primary','gender')andTABLE_NAMElike'%member%'groupbyindex_name;+------------+----------+|index_name|count(*)|+------------+----------+|gender|263||PRIMARY|13|+------------+----------+2rowsinset(0.04sec)

      可以看出,此时buffer pool中关于member表只有13个数据页,263个索引页。因此减少了多次通过主键索引访问数据块的I/O操作,提高执行效率。

      因此可以证实,mysql查询时,offset过大影响性能的原因是多次通过主键索引访问数据块的I/O操作。(注意,只有InnoDB有这个问题,而MYISAM索引结构与InnoDB不同,二级索引都是直接指向数据块的,因此没有此问题 )。

      InnoDB与MyISAM引擎索引结构对比图

      这里写图片描述

      优化方法

      根据上面的分析,我们知道查询所有字段会导致主键索引多次访问数据块造成的I/O操作。

      因此我们先查出偏移后的主键,再根据主键索引查询数据块的所有内容即可优化。

      mysql>selecta.*frommemberasainnerjoin(selectidfrommemberwheregender=1limit300000,1)asbona.id=b.id;+--------+------------+--------+|id|name|gender|+--------+------------+--------+|599465|f48375bdb8|1|+--------+------------+--------+1rowinset(0.08sec)

      附:MYSQL limit,offset 区别

      SELECTkeywordFROMkeyword_rankWHEREadvertiserid='59'orderbykeywordLIMIT2OFFSET1;

      比如这个SQL ,limit后面跟的是2条数据,offset后面是从第1条开始读取

      SELECTkeywordFROMkeyword_rankWHEREadvertiserid='59'ORDERBYkeywordLIMIT2,1;

      而这个SQL,limit后面是从第2条开始读,读取1条信息。

      这两个千万别搞混哦。

    mysql查询时offset过大影响性能的原因是什么.docx

    将本文的Word文档下载到电脑

    推荐度:

    下载
    热门标签: mysqloffset