索引分类知识点
上一个知识点   下一个知识点


本节概述 本节知识点 本节总结

三、索引技术的简单分类

索引为检索服务,也决定了检索技术,读者可以将此分类与前一章检索算法的简单分类进行比照。

(1) 线性索引
    线性索引(linear index)的索引文件被组织成一组简单的关键码(key)/指针(pointer)对的序列。线性索引文件按照关键码的顺序进行排序;文件中的指针则指向存储在磁盘上的文件记录起始位置或者主索引中主码的起始位置。基于线性索引的常用检索技术是二分检索。

(2) 静态索引
    静态索引是指索引结构在文件创建、初始装入记录时生成,一旦生成就固定下来,在系统运行(例如插入和删除记录)过程中索引结构并不改变,只有当文件再组织时才允许改变索引结构。常见的静态索引技术有多分树,ISAM(索引顺序存取方法)等。

(3) 倒排索引
    倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverted file)。

(4) 动态索引
    动态索引结构是指文件创建、初始装入记录时所生成的索引结构,在系统运行过程中插入或删除记录时,索引结构本身也可能发生改变,改变索引结构的目的是为保持较好的性能,例如较高的检索效率。B树和B+树都是经典的动态索引。