当前位置: 首页 > MySQL数据库

怎么解决InnoDB Persistent Statistics问题

时间:2026-01-28 14:10:26

背景:
        MySQL的优化器是通过innodb收集到的数据来选择最优的执行计划,但因为这些数据会随着某些操作而重新计算,造成执行计划会多次变化,出现不精确和不稳定的问题。

这些导致重新计算的操作有: 
    1.重启
    2.访问表
    3.表中数据改变(1/16 以上的DML)
    4.show table status 及 show index for table
    5.analyze  table
    6.and so on
       为了解决这个问题,在mysql 5.6 时,加入了持续优化统计,不再自动重新统计,持续统计数据是作为系统表存储在innodb_table_stats和innodb_index_stats中的,在上次的分享中也有提到过。

如何进行持续优化统计:
mysql>show  variables like '%innodb_stats%';
+--------------------------------------+-------------+
| Variable_name                        | Value       |
+--------------------------------------+-------------+
| innodb_stats_auto_recalc             | ON          |
| innodb_stats_method                  | nulls_equal |
| innodb_stats_on_metadata             | OFF         |
| innodb_stats_persistent              | ON          |
| innodb_stats_persistent_sample_pages | 20          |
| innodb_stats_sample_pages            | 8           |
| innodb_stats_transient_sample_pages  | 8           |
+--------------------------------------+-------------+

1、对于所有innodb表,可以设置全局参数
全局参数:
    innodb_stats_persistent            是否开启统计
    innodb_stats_auto_recalc        自动重新统计
    innodb_stats_persistent_sample_pages   随机取样页数
    innodb_stats_on_metadata    该参数主要为元数据索引统计分析,如查询information_schema中的某些表,还有show table  status  也会造成innodb 随机提取数据,很容易导致查询性能大幅抖动,在5.6之后的版本该参数已经很鸡肋了,不开启完全不影响数据统计的准确性。   
2、单表
    (1)  stats_persistent  对于innodb表是否保证持续统计
          ALTER  TABLE  table_name  stats_persistent=1
          默认是由innodb_stats_persistent选项决定的
    (2) stats_auto_recalc   对于innodb表是否自动计算持续统计
          默认是由innodb_stats_auto_recalc 选项决定的,为1 时,

         当有10%的数据发生改变时,就重新计算,按照我的测试大概超过10%
    (3) stats_sample_pages  指定随机索引页的数量
   example:

             CREATE TABLE `t1` (
            `id` int  NOT NULL AUTO_INCREMENT,
            `data` varchar(255) DEFAULT NULL,
            `date` datetime DEFAULT NULL,
            PRIMARY KEY (`id`),
            KEY `idx_date` (`date`)
            ) ENGINE=InnoDB  CHARSET=utf8 STATS_PERSISTENT=1 STATS_AUTO_RECALC=1 STATS_SAMPLE_PAGES=25       
  

Innodb 统计示例:

 mysql>select * from t2 ;
+----+------+------+------+------+
| a  | b    | c    | d    | e    |
+----+------+------+------+------+
|  1 |    1 |    1 |    1 |    1 |
|  2 |    1 |    1 |    2 |    2 |
|  3 |    1 |    1 |    3 |    3 |
|  4 |    1 |    1 |    4 |    4 |
|  5 |    1 |    1 |    5 |    5 |
|  6 |    1 |    1 |    6 |    6 |
|  7 |    1 |    1 |    7 |    7 |
|  8 |    1 |    1 |    8 |    8 |
|  9 |    1 |    1 |    9 |    9 |
| 10 |    1 |    1 |   10 |   10 |
+----+------+------+------+------+
10 rows in set (0.01 sec)

mysql>select * from mysql.innodb_table_stats \G
*************************** 1. row ***************************
          database_name: test
             table_name: t2
            last_update: 2016-02-24 18:58:22
                 n_rows: 8
   clustered_index_size: 1
sum_of_other_index_sizes: 2
1 row in set (0.00 sec)


使用analyze table立即更新统计数据


mysql>analyze  table t2 ;
+---------+---------+----------+----------+
| Table   | Op      | Msg_type | Msg_text |
+---------+---------+----------+----------+
| test.t2 | analyze | status   | OK       |
+---------+---------+----------+----------+
1 row in set (0.01 sec)

mysql>select * from mysql.innodb_table_stats \G
*************************** 1. row ***************************
          database_name: test
             table_name: t2
            last_update: 2016-02-24 19:00:23
                 n_rows: 10
   clustered_index_size: 1
sum_of_other_index_sizes: 2
1 row in set (0.01 sec)
   可以看到统计已经改变

取样页数量的影响
        基于索引的相对选择度,mysql 查询优化器通过键的分布(即cardinality)统计来选择索引的执行计划,而使用analyze table 会导致innodb 从表上的每个索引取随机页来估计索引的选择度。

       为了控制统计的准确性和稳定性,可以改变以下参数   
    innodb_stats_persistent_sample_pages 默认值是20
    统计并不精确,优化器选择的是理想的计划,如explain,
    精确的统计是通过比较索引的实际基数与索引统计表中的估计值,如 select distinct在索引列

当然,如果开启了自动更新,在几秒钟,行变更达到10%的阀值也会更新的
   innodb_stats_persistent_sample_pages 增加该值,虽然会使统计更加准确,但同时可能需要更多的磁盘读,会造成打开表或执行show table  status ,而且对于analyze table来说,也很慢,因为它的复杂性计算与该参数相关,innodb_stats_sample_pages * 索引列* 分区数量 ;但也不能过小,比如1或2,会导致统计不准确。


上一篇:怎么解决mysql的报错[ERROR] Native table 'performance_schema'问题
下一篇:Oracle和MySQL中有意向锁吗
innodb
  • 英特尔与 Vertiv 合作开发液冷 AI 处理器
  • 英特尔第五代 Xeon CPU 来了:详细信息和行业反应
  • 由于云计算放缓引发扩张担忧,甲骨文股价暴跌
  • Web开发状况报告详细介绍可组合架构的优点
  • 如何使用 PowerShell 的 Get-Date Cmdlet 创建时间戳
  • 美光在数据中心需求增长后给出了强有力的预测
  • 2027服务器市场价值将接近1960亿美元
  • 生成式人工智能的下一步是什么?
  • 分享在外部存储上安装Ubuntu的5种方法技巧
  • 全球数据中心发展的关键考虑因素
  • 英特尔与 Vertiv 合作开发液冷 AI 处理器

    英特尔第五代 Xeon CPU 来了:详细信息和行业反应

    由于云计算放缓引发扩张担忧,甲骨文股价暴跌

    Web开发状况报告详细介绍可组合架构的优点

    如何使用 PowerShell 的 Get-Date Cmdlet 创建时间戳

    美光在数据中心需求增长后给出了强有力的预测

    2027服务器市场价值将接近1960亿美元

    生成式人工智能的下一步是什么?

    分享在外部存储上安装Ubuntu的5种方法技巧

    全球数据中心发展的关键考虑因素