MYSQL索引优化
- 格式:doc
- 大小:68.50 KB
- 文档页数:18
MySQL索引优化,explain详细讲解前⾔:这篇⽂章主要讲 explain 如何使⽤,还有 explain 各种参数概念,之后会讲优化⼀、Explain ⽤法模拟Mysql优化器是如何执⾏SQL查询语句的,从⽽知道Mysql是如何处理你的SQL语句的。
分析你的查询语句或是表结构的性能瓶颈。
语法:Explain + SQL 语句;如:Explain select * from user; 会⽣成如下 SQL 分析结果,下⾯详细对每个字段进⾏详解⼆、id是⼀组数字,代表多个表之间的查询顺序,或者包含⼦句查询语句中的顺序,id 总共分为三种情况,依次详解id 相同,执⾏顺序由上⾄下id 不同,如果是⼦查询,id 号会递增,id 值越⼤优先级越⾼,越先被执⾏id 相同和不同的情况同时存在三、select_typeselect_type 包含以下⼏种值simpleprimarysubqueryderivedunionunion resultsimple简单的 select 查询,查询中不包含⼦查询或者 union 查询primary如果 SQL 语句中包含任何⼦查询,那么⼦查询的最外层会被标记为 primarysubquery在 select 或者 where ⾥包含了⼦查询,那么⼦查询就会被标记为 subQquery,同三.⼆同时出现derived在 from 中包含的⼦查询,会被标记为衍⽣查询,会把查询结果放到⼀个临时表中union / union result如果有两个 select 查询语句,他们之间⽤ union 连起来查询,那么第⼆个 select 会被标记为 union,union 的结果被标记为 union result。
它的 id 是为 null 的四、table表⽰这⼀⾏的数据是哪张表的数据五、typetype 是代表 MySQL 使⽤了哪种索引类型,不同的索引类型的查询效率也是不⼀样的,type ⼤致有以下种类systemconsteq_refrefrangeindexallsystem表中只有⼀⾏记录,system 是 const 的特例,⼏乎不会出现这种情况,可以忽略不计const将主键索引或者唯⼀索引放到 where 条件中查询,MySQL 可以将查询条件转变成⼀个常量,只匹配⼀⾏数据,索引⼀次就找到数据了eq_ref在多表查询中,如 T1 和 T2,T1 中的⼀⾏记录,在 T2 中也只能找到唯⼀的⼀⾏,说⽩了就是 T1 和 T2 关联查询的条件都是主键索引或者唯⼀索引,这样才能保证 T1 每⼀⾏记录只对应 T2 的⼀⾏记录举个不太恰当的例⼦,EXPLAIN SELECT * from t1 , t2 where t1.id = t2.idref不是主键索引,也不是唯⼀索引,就是普通的索引,可能会返回多个符合条件的⾏。
使用MySQL进行全文索引和搜索优化引言:在当今大数据时代,信息的快速检索和搜索成为一项非常重要的任务。
而全文索引是提高搜索效率的关键技术之一。
MySQL作为一种常用的关系型数据库,也提供了全文索引功能,可以帮助我们实现高效的全文搜索。
本文将介绍如何使用MySQL进行全文索引和搜索优化,以提升系统的性能和用户体验。
一、全文索引的基本概念和原理全文索引是一种将文本数据以特定的数据结构进行组织和管理,以支持关键字搜索的技术。
它可以快速地定位并返回包含搜索关键字的文档或记录。
全文索引常用于大型网站、论坛、博客等需要进行复杂搜索的应用场景。
全文索引的原理主要包括三个步骤:分词、建立倒排索引和搜索匹配。
1. 分词:将文本数据分割成一个个的词语,一般以空格、标点符号或其他分隔符号为界限。
分词可以使用自然语言处理工具,也可以使用MySQL内置的分词器。
2. 建立倒排索引:将分词之后的单词与其所在的文档或记录进行关联,形成倒排索引表。
倒排索引表记录了每个单词出现在哪个文档中,以及在该文档中的位置信息。
3. 搜索匹配:当进行全文搜索时,输入的关键字会与倒排索引进行匹配,找出与关键字相关的文档或记录。
二、MySQL全文索引的使用方法MySQL提供了全文索引的功能,并通过特定的语法和API使其易于使用。
下面以一个示例数据库为例,介绍MySQL全文索引的使用方法。
假设我们有一个名为"articles"的表,包含了文章的标题和内容字段。
首先,我们需要为"articles"表添加一个全文索引:```ALTER TABLE articles ADD FULLTEXT(title, content);```上述命令将在"title"和"content"字段上创建一个全文索引。
注意,只有使用MyISAM或InnoDB存储引擎的表才支持全文索引。
接下来,我们可以使用全文索引进行搜索。
MySQL的处理大数据量的优化技巧MySQL是一款广泛应用于大数据处理的关系型数据库管理系统。
随着互联网的发展,数据量的快速增长成为了各行各业面临的挑战之一。
为了保证系统的高性能和稳定性,优化MySQL的处理大数据量的技巧显得尤为重要。
本文将从索引优化、查询优化和硬件优化三个方面为读者介绍MySQL的处理大数据量的优化技巧。
一、索引优化索引是提高查询效率的重要手段,合理使用索引可以大幅度减少系统的响应时间。
下面将从选择合适的索引列、优化复合索引、使用覆盖索引和避免过多索引四个方面为读者详细介绍。
首先,选择合适的索引列非常重要。
一般来说,对于经常进行条件查询的列,如手机号、用户名等,应当优先考虑加索引以提高查询效率。
但是需要注意的是,不是所有的列都适合建立索引,过多的索引可能会导致额外的存储开销和维护成本。
其次,优化复合索引也是提高查询效率的一种方法。
在MySQL中,复合索引是指由多个列组成的索引。
当需要同时按多个列进行检索时,复合索引可以减少磁盘I/O操作,提高查询速度。
因此,根据实际需求选择合适的列组合建立复合索引是非常重要的。
第三,使用覆盖索引可以减少回表操作,进一步提高查询效率。
所谓覆盖索引,是指查询语句只需要通过索引就可以获取到所需的数据,而不需要再访问数据表。
使用覆盖索引可以减少磁盘I/O操作,提高查询速度。
最后,需要注意避免过多索引。
虽然索引可以提高查询效率,但是过多的索引可能会导致额外的存储开销和维护成本。
因此,在建立索引时需要根据实际需求进行选择,避免过多索引对系统性能造成负面影响。
二、查询优化在处理大数据量时,查询优化是非常重要的。
下面将从合理使用查询语句、使用连接和子查询、避免全表扫描和及时清理无用数据四个方面为读者介绍。
首先,合理使用查询语句可以提高查询效率。
常见的查询语句有SELECT、INSERT、UPDATE和DELETE。
在使用这些语句时,可以通过使用合适的条件语句和索引来提高查询效率。
MySQL中的表分区和索引选择优化建议在大数据时代的背景下,数据库的性能和优化变得越发重要。
MySQL作为最流行的开源数据库管理系统之一,在数据分析与存储方面扮演着重要的角色。
在MySQL中,表分区和索引选择是优化数据库性能的两个关键因素。
本文将探讨MySQL中的表分区和索引选择,并给出优化建议。
一、表分区的概述表分区是将一张表划分为多个较小的独立部分,每个部分可以存储在不同的物理位置上。
表分区的主要目的是提高查询和维护的性能。
通过将数据分布在多个分区上,可以减少查询的数据量,并且可以针对每个分区进行独立的维护操作。
在选择表分区的策略时,应该考虑数据的特点和查询模式。
以下是一些建议:1. 按范围分区:根据数据的范围进行分区,在每个分区上存储数据的范围是连续的。
这种分区策略适用于按照时间或者连续的数值范围进行查询的场景。
2. 按列表分区:按照某个字段的固定值进行分区,在每个分区上存储的数据具有相同的特征。
这种分区策略适用于按照某个字段值进行查询的场景。
3. 按哈希分区:根据某个字段的哈希值进行分区。
这种分区策略适用于需要将数据均匀分布在不同分区上的场景。
二、索引选择的优化索引是提高数据库查询效率的关键。
选择合适的索引可以大大加快查询的速度,并减少数据库的资源消耗。
以下是一些建议:1. 唯一索引:在表中选择合适的字段创建唯一索引。
唯一索引可以确保数据的唯一性,并且加快查询速度。
通常,在主键或者唯一标识的字段上创建唯一索引是一个明智的选择。
2. 组合索引:对于频繁同时查询多个字段的操作,可以考虑创建组合索引。
组合索引可以减少磁盘I/O次数和内存消耗。
3. 索引覆盖:尽量减少全表扫描,保证使用索引能够满足查询的需求。
使用索引覆盖可以减少数据库的资源消耗。
4. 索引统计信息:及时更新索引的统计信息。
MySQL提供了ANALYZE TABLE或者OPTIMIZE TABLE命令来更新索引的统计信息,确保数据库的查询优化器能够选择合适的索引进行查询。
mysql性能优化-慢查询分析、优化索引和配置目录一、优化概述二、查询与索引优化分析1性能瓶颈定位Show命令慢查询日志explain分析查询profiling分析查询2索引及查询优化三、配置优化1) max_connections2) back_log3) interactive_timeout4) key_buffer_size5) query_cache_size6) record_buffer_size7) read_rnd_buffer_size8) sort_buffer_size9) join_buffer_size10) table_cache11) max_heap_table_size12) tmp_table_size13) thread_cache_size14) thread_concurrency15) wait_timeout一、优化概述MySQL数据库是常见的两个瓶颈是CPU和I/O的瓶颈,CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候。
磁盘I/O瓶颈发生在装入数据远大于内存容量的时候,如果应用分布在网络上,那么查询量相当大的时候那么平瓶颈就会出现在网络上,我们可以用mpstat, iostat, sar和vmstat来查看系统的性能状态。
除了服务器硬件的性能瓶颈,对于MySQL系统本身,我们可以使用工具来优化数据库的性能,通常有三种:使用索引,使用EXPLAIN分析查询以及调整MySQL的内部配置。
二、查询与索引优化分析在优化MySQL时,通常需要对数据库进行分析,常见的分析手段有慢查询日志,EXPLAIN 分析查询,profiling分析以及show命令查询系统状态及系统变量,通过定位分析性能的瓶颈,才能更好的优化数据库系统的性能。
1 性能瓶颈定位Show命令我们可以通过show命令查看MySQL状态及变量,找到系统的瓶颈:Mysql> show status ——显示状态信息(扩展show status like ‘XXX’)Mysql> show variables ——显示系统变量(扩展show variables like ‘XXX’)Mysql> show innodb status ——显示InnoDB存储引擎的状态Mysql> show processlist ——查看当前SQL执行,包括执行状态、是否锁表等Shell> mysqladmin variables -u username -p password——显示系统变量Shell> mysqladmin extended-status -u username -p password——显示状态信息查看状态变量及帮助:Shell> mysqld –verbose –help [|more #逐行显示]比较全的Show命令的使用可参考: http://blog.php //18/慢查询日志慢查询日志开启:在配置文件f或my.ini中在[mysql d]一行下面加入两个配置参数log-slow-queries=/data/mysqldata/slow-query.loglong_query_time=2注:log-slow-queries参数为慢查询日志存放的位置,一般这个目录要有mysql的运行帐号的可写权限,一般都将这个目录设置为mysql的数据存放目录;long_query_time=2中的2表示查询超过两秒才记录;在f或者my.ini中添加log-queries-not-using-indexes参数,表示记录下没有使用索引的查询。
MySQL全文索引的使用方法与性能优化引言:全文索引是一个重要的数据库功能,它可以大幅度提高数据库检索的效率。
在这篇文章中,我们将探讨MySQL全文索引的使用方法和性能优化,以帮助读者更好地理解和应用该功能。
一、全文索引简介全文索引是一种用于快速搜索文本数据的技术。
与普通的索引相比,全文索引不仅能够匹配关键词,而且能够根据关键词的相关性进行排序。
MySQL的全文索引功能可以轻松地实现快速和准确的文本检索,是一种非常有用的工具。
二、MySQL全文索引的创建和使用方法1. 创建全文索引要在MySQL中创建全文索引,需要在表的某个字段上使用FULLTEXT索引类型。
例如,我们有一个包含文章标题和内容的表article,我们可以使用以下命令在该表的content字段上创建全文索引:```ALTER TABLE article ADD FULLTEXT(content);```2. 使用全文索引进行检索一旦创建了全文索引,我们就可以使用MATCH AGAINST语句来进行文本检索。
MATCH AGAINST可以用于单个关键词的匹配,也可以用于多个关键词的组合匹配。
下面是几个示例:- 匹配单个关键词:```SELECT * FROM article WHERE MATCH(content) AGAINST('MySQL');```- 组合匹配多个关键词:```SELECT * FROM article WHERE MATCH(content) AGAINST('MySQL performance optimization');```- 指定关键词的权重进行匹配:```SELECT * FROM article WHERE MATCH(content) AGAINST('MySQL' WITH QUERY EXPANSION);```3. 全文索引的限制全文索引对于长文本的检索效果更好,对于短文本的效果可能有限。
宋红康mysql高级篇笔记MySQL 是一款广泛应用于互联网领域的关系型数据库管理系统。
它的高级功能和优势使得它成为互联网开发者的首选。
本文将分享一些关于 MySQL 高级篇的笔记,涵盖了一些互联网技术介绍、互联网商业和技术应用方面的内容。
一、索引优化索引是提高数据库查询效率的重要手段之一。
在 MySQL 中,使用合适的索引可以显著提升查询性能。
首先,我们需要了解不同类型的索引,如主键索引、唯一索引和普通索引等。
其次,根据具体应用场景,我们可以使用覆盖索引、前缀索引、联合索引等技术进行索引优化。
此外,我们还要注意索引的维护和管理,及时进行索引的重建和优化。
二、查询优化在互联网应用中,查询是最常见的数据库操作之一。
如何编写高效的查询语句,能够快速地获取所需的数据,是每个开发者都应该关注的问题。
本节将介绍一些查询优化的技巧,例如避免使用通配符查询、合理使用 LIMIT 关键字、使用 EXPLAIN 分析查询执行计划等。
三、事务管理事务是保证数据库操作一致性和完整性的重要手段。
MySQL 支持事务的 ACID 特性,可以确保多个操作的原子性、一致性、隔离性和持久性。
本节将详细介绍如何使用事务管理,包括事务的开启、提交和回滚,以及事务并发控制的方法。
四、高级数据操作除了基本的增删改查操作,MySQL 还提供了一些高级数据操作功能,方便开发者完成复杂的数据处理任务。
本节将介绍如何使用子查询、联合查询、分组查询和多表操作等技术,实现更灵活和高效的数据操作。
五、存储引擎选择MySQL 支持多种存储引擎,如 InnoDB、MyISAM、Memory 等。
不同的存储引擎具有不同的特点和适用场景。
本节将比较各种存储引擎的优缺点,并给出存储引擎选择的建议。
六、高可用性和容灾备份在互联网应用中,数据库的高可用性和容灾备份是非常重要的。
本节将介绍如何使用主从复制、读写分离、故障转移和数据备份等技术,提高数据库的稳定性和可用性。
MySQL中的查询计划和索引选择的原理及优化方法概述MySQL是一种广泛使用的关系型数据库管理系统,对于开发人员来说,了解查询计划和索引选择的原理以及优化方法是非常重要的。
本文将详细介绍MySQL中的查询计划和索引选择的原理,并提供一些优化方法来提高查询性能。
一、查询计划的概念和原理查询计划是指MySQL在执行查询语句时所采取的操作顺序和操作方法,通过优化查询计划可以提高查询性能。
MySQL在执行查询语句之前,会根据查询条件、表结构和索引等信息生成多个可能的查询计划,然后选择最优的查询计划进行执行。
1.1 执行查询计划的流程MySQL执行查询计划的流程可以分为以下几个步骤:1)解析查询语句:MySQL首先会对查询语句进行语法解析,判断查询语句是否合法,并根据查询条件确定需要查询的数据表和字段。
2)生成候选查询计划:根据查询语句中的表名和字段名,MySQL会生成多个候选查询计划,每个查询计划对应一个可能的操作顺序和操作方法。
3)计算查询计划的代价:MySQL会对每个候选查询计划进行代价估算,代价包括CPU消耗、磁盘IO消耗等。
4)选择最优查询计划:MySQL会选择代价最小的候选查询计划作为最优查询计划,并将该查询计划保存在查询缓存中。
5)执行最优查询计划:MySQL根据最优查询计划,依次执行查询计划中的操作步骤,获取查询结果。
1.2 查询计划的优化方法为了提高查询性能,我们可以采取以下几种方法来优化查询计划:1)合理使用索引:索引是提高查询性能的重要手段,通过在查询字段上创建合适的索引,可以加快查询速度。
但是,过多的索引会增加数据插入和更新的开销,因此需要根据实际情况合理使用索引。
2)使用覆盖索引:当查询语句的字段都可以从索引中获取到结果时,可以使用覆盖索引来避免回表操作,从而提高查询性能。
3)避免全表扫描:全表扫描是指对整张表的数据进行逐条扫描,如果表数据量较大,会导致查询性能下降。
为了避免全表扫描,可以通过合理使用索引或者添加筛选条件来减少扫描的数据量。
mysql优化的几种方法
1. 合理设计数据库结构:合理划分表和建立索引,将重要的字段和常用的查询条件作为索引,减少数据库查询的时间消耗。
2. 减少数据表的联接:尽量避免多表联接操作,可以通过使用冗余字段或者嵌套查询的方式来减少联接操作。
3. 使用合适的数据类型:选择合适的数据类型可以减少数据库存储空间,提高查询和更新的性能。
例如,使用整型代替字符串类型存储数字数据。
4. 避免全表扫描:尽量使用索引来查询数据,避免全表扫描的性能瓶颈。
如果有大量的数据需要查询,可以考虑分批次查询或者使用分页查询的方式。
5. 批量插入和更新:使用批量插入和更新的方式可以减少数据库的IO操作,提高数据写入的效率。
可以使用INSERT
INTO ... VALUES (...),或者使用LOAD DATA INFILE进行批量导入数据。
6. 优化查询语句:使用EXPLAIN语句分析查询语句的执行计划,找到慢查询的原因,然后通过修改查询语句或者调整索引来优化查询性能。
7. 使用缓存技术:可以使用缓存系统(如Redis、Memcached)来缓存查询结果,减少数据库的访问次数,提高系统的响应速度。
8. 避免使用SELECT *:尽量避免使用SELECT *查询所有字段,只选择需要的字段,避免传输和处理不必要的数据。
9. 分库分表:当数据量过大时,可以使用分库分表的方式来拆分数据,减少单个数据库的负载,提高数据库的扩展能力和性能。
10. 定期优化和维护:定期进行数据库优化和维护,包括备份
数据、清理无用数据、重新组织表等,保持数据库的健康状态,提高系统的稳定性和性能。
mysql 字段加索引的方法摘要:1.MySQL字段加索引的必要性2.添加索引的方法3.索引的类型及其适用场景4.优化索引以提高查询效率5.总结正文:在MySQL数据库中,字段加索引是一种常用的优化查询性能的方法。
索引可以帮助数据库更快地查找和匹配数据,从而提高查询效率。
下面将详细介绍如何在MySQL中为字段添加索引,以及索引的类型和优化方法。
一、MySQL字段加索引的必要性在没有索引的情况下,数据库需要遍历所有表记录来完成查询任务。
而当我们为字段添加索引后,数据库可以在查询时直接定位到特定记录,大大减少了查询时间。
特别是在涉及到大量数据的查询时,索引的作用尤为明显。
二、添加索引的方法1.创建表时添加索引在创建表时,可以使用`INDEX`或`KEY`关键字为字段添加索引。
例如:```sqlCREATE TABLE `employee` (`id` INT(11) NOT NULL AUTO_INCREMENT,`name` VARCHAR(50) NOT NULL,`age` INT(11) NOT NULL,PRIMARY KEY (`id`),INDEX `idx_name` (`name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8;```在这个例子中,我们为`name`字段添加了名为`idx_name`的索引。
2.单独创建索引如果表已经创建,可以单独为某个字段创建索引。
例如:```sqlALTER TABLE `employee` ADD INDEX `idx_name` (`name`);```三、索引的类型及其适用场景1.单列索引:适用于查询只涉及单一字段的情况,如根据姓名查询员工信息。
2.组合索引:适用于查询涉及多个字段的情况,如根据姓名和年龄查询员工信息。
3.全文索引:适用于文本搜索场景,如根据关键字搜索文章内容。
4.空间索引:适用于空间数据查询,如根据经纬度查询地理位置。
写在前面:索引对查询的速度有着至关重要的影响,理解索引也是进行数据库性能调优的起点。
考虑如下情况,假设数据库中一个表有10^6条记录,DBMS的页面大小为4K,并存储100条记录。
如果没有索引,查询将对整个表进行扫描,最坏的情况下,如果所有数据页都不在内存,需要读取10^4 个页面,如果这10^4个页面在磁盘上随机分布,需要进行10^4次I/O,假设磁盘每次I/O时间为10ms(忽略数据传输时间),则总共需要100s(但实际上要好很多很多)。
如果对之建立B-Tree索引,则只需要进行log100(10^6)=3次页面读取,最坏情况下耗时30ms。
这就是索引带来的效果,很多时候,当你的应用程序进行SQL查询速度很慢时,应该想想是否可以建索引。
进入正题:第二章、索引与优化1、选择索引的数据类型MySQL支持很多数据类型,选择合适的数据类型存储数据对性能有很大的影响。
通常来说,可以遵循以下一些指导原则:(1)越小的数据类型通常更好:越小的数据类型通常在磁盘、内存和CPU缓存中都需要更少的空间,处理起来更快。
(2)简单的数据类型更好:整型数据比起字符,处理开销更小,因为字符串的比较更复杂。
在MySQL中,应该用内置的日期和时间数据类型,而不是用字符串来存储时间;以及用整型数据类型存储IP地址。
(3)尽量避免NULL:应该指定列为NOT NULL,除非你想存储NULL。
在MySQL中,含有空值的列很难进行查询优化,因为它们使得索引、索引的统计信息以及比较运算更加复杂。
你应该用0、一个特殊的值或者一个空串代替空值。
1.1、选择标识符选择合适的标识符是非常重要的。
选择时不仅应该考虑存储类型,而且应该考虑MySQL是怎样进行运算和比较的。
一旦选定数据类型,应该保证所有相关的表都使用相同的数据类型。
(1) 整型:通常是作为标识符的最好选择,因为可以更快的处理,而且可以设置为AUTO_INCREMENT。
(2) 字符串:尽量避免使用字符串作为标识符,它们消耗更好的空间,处理起来也较慢。
而且,通常来说,字符串都是随机的,所以它们在索引中的位置也是随机的,这会导致页面分裂、随机访问磁盘,聚簇索引分裂(对于使用聚簇索引的存储引擎)。
2、索引入门对于任何DBMS,索引都是进行优化的最主要的因素。
对于少量的数据,没有合适的索引影响不是很大,但是,当随着数据量的增加,性能会急剧下降。
如果对多列进行索引(组合索引),列的顺序非常重要,MySQL仅能对索引最左边的前缀进行有效的查找。
例如:假设存在组合索引it1c1c2(c1,c2),查询语句select * from t1 where c1=1 and c2=2能够使用该索引。
查询语句select * from t1 where c1=1也能够使用该索引。
但是,查询语句select * from t1 where c2=2不能够使用该索引,因为没有组合索引的引导列,即,要想使用c2列进行查找,必需出现c1等于某值。
2.1、索引的类型索引是在存储引擎中实现的,而不是在服务器层中实现的。
所以,每种存储引擎的索引都不一定完全相同,并不是所有的存储引擎都支持所有的索引类型。
假设有如下一个表:CREATE TABLE People (last_name varchar(50) not null,first_name varchar(50) not null,dob date not null,gender enum('m', 'f') not null,key(last_name, first_name, dob));其索引包含表中每一行的last_name、first_name和dob列。
其结构大致如下:索引存储的值按索引列中的顺序排列。
可以利用B-Tree索引进行全关键字、关键字范围和关键字前缀查询,当然,如果想使用索引,你必须保证按索引的最左边前缀(leftmost prefix of the index)来进行查询。
(1)匹配全值(Match the full value):对索引中的所有列都指定具体的值。
例如,上图中索引可以帮助你查找出生于1960-01-01的Cuba Allen。
(2)匹配最左前缀(Match a leftmost prefix):你可以利用索引查找last name为Allen的人,仅仅使用索引中的第1列。
(3)匹配列前缀(Match a column prefix):例如,你可以利用索引查找last name以J开始的人,这仅仅使用索引中的第1列。
(4)匹配值的范围查询(Match a range of values):可以利用索引查找last name在Allen和Barrymore之间的人,仅仅使用索引中第1列。
(5)匹配部分精确而其它部分进行范围匹配(Match one part exactly and match a range on another part):可以利用索引查找last name为Allen,而first name以字母K开始的人。
(6)仅对索引进行查询(Index-only queries):如果查询的列都位于索引中,则不需要读取元组的值。
由于B-树中的节点都是顺序存储的,所以可以利用索引进行查找(找某些值),也可以对查询结果进行ORDER BY。
当然,使用B-tree索引有以下一些限制:(1) 查询必须从索引的最左边的列开始。
关于这点已经提了很多遍了。
例如你不能利用索引查找在某一天出生的人。
(2) 不能跳过某一索引列。
例如,你不能利用索引查找last name为Smith且出生于某一天的人。
(3) 存储引擎不能使用索引中范围条件右边的列。
例如,如果你的查询语句为WHERE last_name="Smith" AND first_name LIKE 'J%' AND dob='1976-12-23',则该查询只会使用索引中的前两列,因为LIKE是范围查询。
MySQL 中,只有Memory存储引擎显示支持hash索引,是Memory表的默认索引类型,尽管Memory表也可以使用B-Tree索引。
Memory存储引擎支持非唯一hash索引,这在数据库领域是罕见的,如果多个值有相同的hash code,索引把它们的行指针用链表保存到同一个hash表项中。
假设创建如下一个表:CREATE TABLE testhash (fname V ARCHAR(50) NOT NULL,lname V ARCHAR(50) NOT NULL,KEY USING HASH(fname)) ENGINE=MEMORY;包含的数据如下:假设索引使用hash函数f( ),如下:f('Arjen') = 2323f('Baron') = 7437f('Peter') = 8784f('V adim') = 2458此时,索引的结构大概如下:Slots是有序的,但是记录不是有序的。
当你执行mysql> SELECT lname FROM testhash WHERE fname='Peter';MySQL会计算’Peter’的hash值,然后通过它来查询索引的行指针。
因为f('Peter') = 8784,MySQL会在索引中查找8784,得到指向记录3的指针。
因为索引自己仅仅存储很短的值,所以,索引非常紧凑。
Hash值不取决于列的数据类型,一个TINYINT 列的索引与一个长字符串列的索引一样大。
Hash索引有以下一些限制:(1)由于索引仅包含hash code和记录指针,所以,MySQL不能通过使用索引避免读取记录。
但是访问内存中的记录是非常迅速的,不会对性造成太大的影响。
(2)不能使用hash索引排序。
(3)Hash索引不支持键的部分匹配,因为是通过整个索引值来计算hash值的。
(4)Hash索引只支持等值比较,例如使用=,IN( )和<=>。
对于WHERE price>100并不能加速查询。
2.1.3、空间(R-Tree)索引MyISAM支持空间索引,主要用于地理空间数据类型,例如GEOMETRY。
2.1.4、全文(Full-text)索引全文索引是MyISAM的一个特殊索引类型,主要用于全文检索。
3、高性能的索引策略3.1、聚簇索引(Clustered Indexes)聚簇索引保证关键字的值相近的元组存储的物理位置也相同(所以字符串类型不宜建立聚簇索引,特别是随机字符串,会使得系统进行大量的移动操作),且一个表只能有一个聚簇索引。
因为由存储引擎实现索引,所以,并不是所有的引擎都支持聚簇索引。
目前,只有solidDB和InnoDB支持。
聚簇索引的结构大致如下:注:叶子页面包含完整的元组,而内节点页面仅包含索引的列(索引的列为整型)。
一些DBMS允许用户指定聚簇索引,但是MySQL的存储引擎到目前为止都不支持。
InnoDB对主键建立聚簇索引。
如果你不指定主键,InnoDB会用一个具有唯一且非空值的索引来代替。
如果不存在这样的索引,InnoDB会定义一个隐藏的主键,然后对其建立聚簇索引。
一般来说,DBMS都会以聚簇索引的形式来存储实际的数据,它是其它二级索引的基础。
3.1.1、InnoDB和MyISAM的数据布局的比较为了更加理解聚簇索引和非聚簇索引,或者primary索引和second索引(MyISAM不支持聚簇索引),来比较一下InnoDB和MyISAM的数据布局,对于如下表:CREATE TABLE layout_test (col1 int NOT NULL,col2 int NOT NULL,PRIMARY KEY(col1),KEY(col2));假设主键的值位于1---10,000之间,且按随机顺序插入,然后用OPTIMIZE TABLE进行优化。
col2随机赋予1---100之间的值,所以会存在许多重复的值。
(1) MyISAM的数据布局其布局十分简单,MyISAM按照插入的顺序在磁盘上存储数据,如下:注:左边为行号(row number),从0开始。
因为元组的大小固定,所以MyISAM可以很容易的从表的开始位置找到某一字节的位置。
据些建立的primary key的索引结构大致如下:注:MyISAM不支持聚簇索引,索引中每一个叶子节点仅仅包含行号(row number),且叶子节点按照col1的顺序存储。
来看看col2的索引结构:实际上,在MyISAM中,primary key和其它索引没有什么区别。