MySQL-索引(下)

发布于:2025-08-30 ⋅ 阅读:(20) ⋅ 点赞:(0)

目录

前言

理解page结构

B+ 树

其他数据结构为何不行

BvsB+

聚簇索引 VS 非聚簇索引

索引操作

 查看索引

创建索引

主键索引

唯一索引

普通索引

全文索引

删除索引


前言

接上文为什么page要有序返回数据?目的是配合页目录提高查找效率。

理解page结构

一、单 Page 情况
 

- Page 结构:MySQL 里的 Page 大小默认 16KB,通过  page_prev  和  page_next  指针构成双向链表,Page 内数据按主键等键值有序存储,像示例中数据记录按一定顺序排列且相互关联。


- 有序存储的作用:插入数据时排序是为优化查询效率。Page 内数据用链表结构存储,增删快但查询修改慢,有序存储能让查询时从头至尾有效查找,无无效查找,还可能提前结束查找过程。
- 引入页目录:为提升单 Page 内数据查找效率,引入页目录。比如要找  id=4  的记录,原本需线性遍历 4 次,有页目录后,可通过目录快速定位起始位置,减少查找次数,这是“空间换时间”的策略,类似书籍通过目录快速找章节。
 
二、多 Page 情况
 
- 多 Page 产生:由于单个 Page 大小固定为 16KB,数据量增大时,会开辟多个新 Page 存储数据,新 Page 间通过指针组织成双向链表。不过新插入数据不一定在新 Page 最上方,图中是理想结构演示。


- 多 Page 遍历问题:多 Page 时,若仅靠 Page 间指针遍历,需大量 I/O 操作加载下一个 Page 到内存再线性检测,效率低。
- 解决多 Page 遍历问题:给 Page 也带上目录,用目录页指向某一页,目录项存放所指向页中最小数据的键值与指针,目录页管理级别是页,页内目录管理级别是行。存在目录页管理页目录,目录页中存指向普通页的地址,普通页存用户数据,目录页存普通页地址。这样查找数据时,可通过目录页比较键值,找到应访问的 Page,再通过指针找下一个 Page,最终形成类似 B+ 树的结构(主键索引),大大减少查找时的 I/O 次数,提升效率,比如找  id=7  的记录,所需加载的 Page 数减少,I/O 次数也减少。


 
三、总结
 
- Page 分目录页和数据页,目录页放下级 Page 的最小值。
- 查找时自顶向下,只需加载部分目录页到内存,就能完成查找,大幅减少 I/O 次数,提升查询效率,最终构建出主键索引(类似 B+ 树结构)。

B+ 树

结合 MySQL 索引场景,B+ 树核心特点可简化为 4 点:
 

1. 分层索引:非叶子节点像“目录页”,只存键值和指针,引导查找方向;叶子节点才是“数据页”,存实际数据。
2. 叶子节点有序连:所有数据存在叶子节点,且叶子节点用双向链表串联,方便范围查询和顺序遍历。
3. 少 I/O 高效读:节点大小适配磁盘块(如 MySQL 16KB Page),一次 I/O 能读更多索引信息,减少磁盘访问次数。
4. 查询稳:无论查哪个数据,都要从根节点走到叶子节点,路径长度固定,查询效率稳定。

这棵树一定是一棵矮胖型的树,他途经的路上的节点会不断的减少,因此每一个节点它都有目录项可以大大提高搜索效率,同时找到目标数据只需要更少的page,io的次数呢也更少了io层面提高了效率,从而整体提高搜索效率。

另外即使是应用层层,没有主动的设置主键,数据库也会以B+树的形式对数据进行存储,因为他会默认设置主见,只不过它的存储顺序是按照这个默认主键的存储顺序来进行创建b加树的,而不是通过我们手动输入的数据来进行,因此结果显示出我们的数据依然是乱序的是情有可原的。

索引就是B+树结构。

其他数据结构为何不行

链表?线性遍历

二叉搜索树?退化问题,可能退化成为线性结构

AVL &&红黑树?虽然是平衡或者近似平衡,但是毕竟是二叉结构,相比较多阶B+,意味着树整体过高,大家都是自顶向下找,层高越低,意味着系统与硬盘更少的IO Page交互。虽然你很秀,但是有更秀的。

Hash?官方的索引实现方式中, MySQL 是支持HASH的,不过 InnoDB 和 MyISAM 并不支持.Hash跟进其算法特征,决定了虽然有时候也很快(O(1)),不过,在面对范围查找就明显不行,另外还有其他差别。

BvsB+

这两棵树,对我们最有意义的区别是:
B树节点,既有数据,又有Page指针,而B+,只有叶子节点有数据,其他目录页,只有键值和Page指针。
B+叶子节点,全部相连,而B没有。
为何选择B+
节点不存储data,这样一个节点就可以存储更多的key。可以使得树更矮,所以IO操作次数更少。
叶子节点相连,更便于进行范围。

聚簇索引 VS 非聚簇索引


MyISAM 存储引擎-主键索引
MyISAM 引擎同样使用B+树作为索引结果,叶节点的data域存放的是数据记录的地址--非
聚簇索引。下图为 MyISAM 表的主索引,
Col1 为主键。

InnoDB 这种用户数据与索引数据在一起索引方案,叫做聚簇索引,当然, MySQL 除了默认会建立主键索引外,我们用户也有可能建立按照其他列信息建立的索引,一般这种索引可以
叫做辅助(普通)索引

对于 MyISAM ,建立辅助(普通)索引和主键索引没有差别,无非就是主键不能重复,而非主键可重复。

InnoDB 的非主键索引中叶子节点并没有数据,而只有对应记录的key值。
所以通过辅助(普通)索引,找到目标记录,需要两遍索引:首先检索辅助索引获得主键,然后用主键到主索引中检索获得记录。这种过程,就叫做回表查询
为何 InnoDB 针对这种辅助(普通)索引的场景,不给叶子节点也附上数据呢?原因就是太浪费空间了。

索引操作

 查看索引

第一种方法: show keys from 表名

mysql> show keys from goods\G
*********** 1. row ***********
Table: goods <= 表名
Non_unique: 0 <= 0表示唯一索引
Key_name: PRIMARY <= 主键索引
Seq_in_index: 1
Column_name: goods_id <= 索引在哪列
Collation: A
Cardinality: 0
Sub_part: NULL
Packed: NULL
Null:
Index_type: BTREE <= 以二叉树形式的索引
Comment:
1 row in set (0.00 sec)

第二种方法: show index from 表名;
第三种方法(信息比较简略): desc 表名;

创建索引

主键索引

第一种方式

-- 在创建表的时候,直接在字段名后指定 primary key

create table user1(id int primary key, name varchar(30));

第二种方式:

-- 在创建表的最后,指定某列或某几列为主键索引

create table user2(id int, name varchar(30), primary key(id));

第三种方式:

create table user3(id int, name varchar(30));

-- 创建表以后再添加主键

alter table user3 add primary key(id);

主键索引的特点:

一个表中,最多有一个主键索引,当然可以使符合主键

主键索引的效率高(主键不可重复)

创建主键索引的列,它的值不能为null,且不能重复

主键索引的列基本上是int

唯一索引

第一种方式

-- 在表定义时,在某列后直接指定unique唯一属性。

create table user4(id int primary key, name varchar(30) unique);

第二种方式

-- 创建表时,在表的后面指定某列或某几列为unique

create table user5(id int primary key, name varchar(30), unique(name));

第三种方式

create table user6(id int primary key, name varchar(30));

alter table user6 add unique(name);

唯一索引的特点:

一个表中,可以有多个唯一索引

查询效率高

如果在某一列建立唯一索引,必须保证这列不能有重复数据

如果一个唯一索引上指定not null,等价于主键索引

普通索引

第一种方式

create table user8(

id int primary key,

name varchar(20),

email varchar(30),

index(name) --在表的定义最后,指定某列为索引

);

第二种方式

create table user9(id int primary key, name varchar(20), email varchar(30));

alter table user9 add index(name); --创建完表以后指定某列为普通索引

第三种方式

create table user10(id int primary key, name varchar(20), email varchar(30));

-- 创建一个索引名为 idx_name 的索引

create index idx_name on user10(name);

普通索引的特点:

一个表中可以有多个普通索引,普通索引在实际开发中用的比较多

如果某列需要创建索引,但是该列有重复的值,那么我们就应该使用普通索引

全文索引

创建

CREATE TABLE articles (
id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
body TEXT,
FULLTEXT (title,body)
)engine=MyISAM;

插入数据

INSERT INTO articles (title,body) VALUES
('MySQL Tutorial','DBMS stands for DataBase ...'),
('How To Use MySQL Well','After you went through a ...'),
('Optimizing MySQL','In this tutorial we will show ...'),
('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),
('MySQL vs. YourSQL','In the following database comparison ...'),
('MySQL Security','When configured properly, MySQL ...');

查看是否使用索引

如果使用如下查询方式,虽然查询出数据,但是没有使用到全文索引

mysql> select * from articles where body like '%database%';
+----+-------------------+------------------------------------------+
| id | title | body |
+----+-------------------+------------------------------------------+
| 1 | MySQL Tutorial | DBMS stands for DataBase ... |
| 5 | MySQL vs. YourSQL | In the following database comparison ... |
+----+-------------------+------------------------------------------+

可以用explain工具看一下,是否使用到索引(观察key如果=NULL,说明没有使用全文索引。

mysql> explain select * from articles where body like '%database%'\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: articles
type: ALL
possible_keys: NULL
key: NULL <== key为null表示没有用到索引
key_len: NULL
ref: NULL
rows: 6
Extra: Using where
1 row in set (0.00 sec)

正确使用全文索引

mysql> SELECT * FROM articles
-> WHERE MATCH (title,body) AGAINST ('database');
+----+-------------------+------------------------------------------+
| id | title | body |
+----+-------------------+------------------------------------------+
| 5 | MySQL vs. YourSQL | In the following database comparison ... |
| 1 | MySQL Tutorial | DBMS stands for DataBase ... |
+----+-------------------+------------------------------------------+
通过explain来分析这个sql语句

用explain工具看一下,是否使用到索引,key=索引名称(title)

mysql> explain SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('database')\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: articles
type: fulltext
possible_keys: title
key: title <= key用到了title
key_len: 0
ref:
rows: 1
Extra: Using where

删除索引

第一种方法-删除主键索引: alter table 表名 drop primary key;
 

第二种方法-其他索引的删除: alter table 表名 drop index 索引名; 索引名就是show keys from

表名中的

Key_name 字段

mysql> alter table user10 drop index idx_name;

第三种方法方法: drop index 索引名 on 表名

mysql> drop index name on user8;

索引创建原则

比较频繁作为查询条件的字段应该创建索引

唯一性太差的字段不适合单独创建索引,即使频繁作为查询条件

更新非常频繁的字段不适合作创建索引


网站公告

今日签到

点亮在社区的每一天
去签到