加入收藏 | 设为首页 | 会员中心 | 我要投稿 站长网 (https://www.zhandada.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

MySQL统计信息的示例分析

发布时间:2022-02-12 14:10:20 所属栏目:MySql教程 来源:互联网
导读:这篇文章主要为大家展示了MySQL统计信息的示例分析,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下MySQL统计信息的示例分析这篇文章吧。 MySQL统计信息的存储分为两种,非持久化和持久化统计信息。 一、非持久化
      这篇文章主要为大家展示了“MySQL统计信息的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“MySQL统计信息的示例分析”这篇文章吧。
 
      MySQL统计信息的存储分为两种,非持久化和持久化统计信息。
 
一、非持久化统计信息
       非持久化统计信息存储在内存里,如果数据库重启,统计信息将丢失。有两种方式可以设置为非持久化统计信息:
 
1 全局变量,
 
INNODB_STATS_PERSISTENT=OFF
 
2 CREATE/ALTER表的参数,
 
STATS_PERSISTENT=0
 
非持久化统计信息在以下情况会被自动更新:
 
1 执行ANALYZE TABLE
 
2 innodb_stats_on_metadata=ON情况下,执SHOW TABLE STATUS, SHOW INDEX, 查询 INFORMATION_SCHEMA下的TABLES, STATISTICS
 
3 启用--auto-rehash功能情况下,使用mysql client登录
 
4 表第一次被打开
 
5 距上一次更新统计信息,表1/16的数据被修改
 
非持久化统计信息的缺点显而易见,数据库重启后如果大量表开始更新统计信息,会对实例造成很大影响,所以目前都会使用持久化统计信息。
 
二、持久化统计信息
5.6.6开始,MySQL默认使用了持久化统计信息,即INNODB_STATS_PERSISTENT=ON,持久化统计信息保存在表mysql.innodb_table_stats和mysql.innodb_index_stats。
 
持久化统计信息在以下情况会被自动更新:
 
1 INNODB_STATS_AUTO_RECALC=ON
 
情况下,表中10%的数据被修改
 
2 增加新的索引
innodb_table_stats是表的统计信息,innodb_index_stats是索引的统计信息,各字段含义如下:
 
innodb_table_stats
 
database_name
 
数据库名
 
table_name
 
表名
 
last_update
 
统计信息最后一次更新时间
 
n_rows
 
表的行数
 
clustered_index_size
 
聚集索引的页的数量
 
sum_of_other_index_sizes
 
其他索引的页的数量
 
innodb_index_stats
 
database_name
 
数据库名
 
table_name
 
表名
 
index_name
 
索引名
 
last_update
 
统计信息最后一次更新时间
 
stat_name
 
统计信息名
 
stat_value
 
统计信息的值
 
sample_size
 
采样大小
 
stat_description
 
类型说明
 
为更好的理解innodb_index_stats,建一张测试表做说明:
 
CREATE TABLE t1 (
 a INT, b INT, c INT, d INT, e INT, f INT,
 PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
) ENGINE=INNODB;
写入数据如下:
 
查看t1表的统计信息,需主要关注stat_name和stat_value字段
  
tat_name=size时:stat_value表示索引的页的数量
 
stat_name=n_leaf_pages时:stat_value表示叶子节点的数量
 
stat_name=n_diff_pfxNN时:stat_value表示索引字段上唯一值的数量,此处做一下具体说明:
 
1、n_diff_pfx01表示索引第一列distinct之后的数量,如PRIMARY的a列,只有一个值1,所以index_name='PRIMARY' and stat_name='n_diff_pfx01'时,stat_value=1。
 
2、n_diff_pfx02表示索引前两列distinct之后的数量,如i2uniq的e,f列,有4个值,所以index_name='i2uniq' and stat_name='n_diff_pfx02'时,stat_value=4。
 
3、对于非唯一索引,会在原有列之后加上主键索引,如index_name='i1' and stat_name='n_diff_pfx03',在原索引列c,d后加了主键列a,(c,d,a)的distinct结果为2。
 
了解了stat_name和stat_value的具体含义,就可以协助我们排查SQL执行时为什么没有使用合适的索引,例如某个索引n_diff_pfxNN的stat_value远小于实际值,查询优化器认为该索引选择度较差,就有可能导致使用错误的索引。
 
三、统计信息不准确的处理
我们查看执行计划,发现未使用正确的索引,如果是innodb_index_stats中统计信息差别较大引起,可通过以下方式处理:
 
1、手动更新统计信息,注意执行过程中会加读锁:
 
ANALYZETABLE TABLE_NAME;
 
2、如果更新后统计信息仍不准确,可考虑增加表采样的数据页,两种方式可以修改:
 
a) 全局变量INNODB_STATS_PERSISTENT_SAMPLE_PAGES,默认为20;
 
b) 单个表可以指定该表的采样:
 
ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;
 
经测试,此处STATS_SAMPLE_PAGES的最大值是65535,超出会报错。
 
目前MySQL并没有提供直方图的功能,某些情况下(如数据分布不均)仅仅更新统计信息不一定能得到准确的执行计划,只能通过index hint的方式指定索引。新版本8.0会增加直方图功能,让我们期待MySQL越来越强大的功能吧!
 
以上是“MySQL统计信息的示例分析”这篇文章的所有内容,感谢各位的阅读!

(编辑:站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读