正文

jacy书籍推荐,jacs出版社

kodinid V管理员 /2024-04-01 /27 阅读

0401

大家好，今天小编关注到一个比较有意思的话题，就是关于jacy书籍推荐的问题，于是小编就整理了1个相关介绍jacy书籍推荐的解答，让我们一起看看吧。

数据库中的索引，原理是什么？为什么查询使用索引就会快？

数据库中的索引，原理是什么？为什么查询使用索引就会快？

索引简单来说就是一本字典的目录，数据量小的时候，字典比较薄，全部一扫而过，瞬间就能查询到你指定的数据，但是随着数据量的增加，字典越来越厚，全部扫，费时费力（消耗大量的系统内存，磁盘瞬间IO也会越来越吃紧，占用大量系统***，进程得不到释放），这时候如果给字典新增加个对应章节（表）目录，我们直接通过目录就能快速检索到有用数据，不会漫无边际的全部扫，再去过滤。当然由于你新建了目录（索引），肯定会占用一定的字典空间，当然针对你的查询来说，通过空间换时间，这个还是很值得的。针对插入，由于你需要往指定目录（有索引的表）插入数据，字典（数据库系统）需要重新更新制定目录并且维护目录信息，因此插入这个过程会慢，如何解决这一问题呢，我们可以删除指定目录（索引或者分区），数据全部处理好以后重新创建目录。

以查字典为例，来说明这个问题。

jacy书籍推荐,jacs出版社

（图片来源网络，侵删）

先想象一下有一本字典，里面的字是随意排列的，我们要查一个字，就只能一页一页翻过去查找，这样下来查一个字就会花很多时间，如果运气不好，我们要找的字在最后一页，就得翻几千页了。用数据库的术语叫遍历（full scan）。

为了缩短查询时间，我们把字典里的字按照拼音字母的顺序排列好。这样查字的时候，查看一下中间那一页，就可以知道我们要查的字是在前面还是在后面。比如在前面，我们就查看1/4处的那一页，如此反复直到我们找到要查的字为止。那么这么做我们得查多少次呢？一本六万多页的字典最多查16次就能找到您想要的那一页了。这种方法要比遍历的方法快得多。用数据库的术语叫B-TREE(二叉树)。

如果我们不知道发音想按部首查字典又该怎么办呢？字典里按照部首的顺序做了个表，查这个表就可以快速查到解释那个字的页码了。这个表用数据库的术语就叫索引。

jacy书籍推荐,jacs出版社

（图片来源网络，侵删）

数据库里的数据经常会有千万条以上，双十一某宝的数据，一分钟的交易数据大概就能突破千万。这么大量的数据一条一条遍历恐怕是不现实的，在这样的数据库里，建立完善的索引是必须的。有了索引以亿为单位的数据，也只要做几十次检索就足够了。

值得注意的是，索引是以字段为基础建立的，在检索的时候，如果对被索引的字段进行运算，就很可能打乱事前排好的顺序，导致不得不遍历数据，使索引失去效果。

插入的时候对索引字段计算哈希值，把哈希值和行号对应关系放进一张哈希表。

jacy书籍推荐,jacs出版社

（图片来源网络，侵删）

查询的时候对索引字段计算哈希值，从哈希表中查到行号，就能找到这一行了。

用redis的key hash list能模拟一个简单的带索引的关系型数据库。

索引是存储引擎用于快速查找记录的数据结构，MySQL 数据库内部索引是由不同的引擎实现的，主要说一下最常用的InnoDB引擎中的索引，InnoDB引擎中的索引是使用B+ 树的结构来存储的，B+ 树结构如下图：

先来说一下B+ 树的特点：

叶子节点（最下面一层）存储关键字（索引字段的值）信息及对应的全部数据记录。

非叶子节点只存储关键字的信息及子节点的指针。

每个叶子节点相当于MySQL中的一个数据页，同层级的叶子节点以双向链表的形式连接。

每个节点中存储了多条记录，记录之间用单链表的形式连接组成了一条有序的链表。

在 B+ 树中检索数据时：每次检索都从根节点开始，一直搜索到叶子节点。

InnoDB 的数据是按数据页为单位来读写的。也就是说，当需要读取一条记录的时候，并不是将这个记录本身从磁盘读取出来，而是以页为单位，将整个也加载到内存中，一个页中可能有很多记录，然后在内存中对页通过二分法进行检索。在InnoDB 中，每个页的大小默认是16kb。

数据库索引可以理解成图书馆的书架，书架按书目分类，或者理解成一本书的目录。想想如果没有这些目录，要找一本书中内容，就要从头把书翻一遍，或者把图书馆的书都找一遍，这样会有多慢？

数据库建立索引也是这个原理，数据有了分类目录了，查询数据的时候，先查找目录就会快了很多。

不过对现在的海量数据来讲，有了索引还是杯水车薪，查询依然很慢，而且建立索引要占用额外的存储空间，对数据库来讲存贮空间是非常值钱的，商业数据库存贮空间收费昂贵。

真正的海量数据存贮，查询效率都是用计算机硬件堆起来的，就是用钱堆起来的，不要想在软件上做点优化就会有多少本质的提高。

具体硬件优化有很多手段，前端查询，数据库缓存，分布式应用等等，要想掌握好数据库的优化，去看看实际的商业应用案例最好，书本上的那些东西，没多大意义。

到此，以上就是小编对于jacy书籍推荐的问题就介绍到这了，希望介绍关于jacy书籍推荐的1点解答对大家有用。

[免责声明]本文来源于网络，不代表本站立场，如转载内容涉及版权等问题，请联系邮箱:83115484@qq.com，我们会予以删除相关文章，保证您的权利。转载请注明出处：http://www.everydaystoryteller.com/post/18497.html

相关阅读

目录[+]