ElasticSearch查询第二篇：文档更新

发布时间：2017年06月29日作者：IT网络文摘

《ElasticSearch查询》目录导航：

ElasticSearch是性能优化的分布式全文搜索引擎，存储数据的载体是文档（Document），它的优势在于搜索速度快和支持聚合操作，在更新文档时，基本上能够达到实时搜索。ElasticSearch引擎总是按照文档标识来更新数据，并发控制是通过顺序的版本ID（version）实现的，控制写-写、写-读冲突，实现数据弱一致性。

在ElasticSearch引擎中，索引定义了文档的逻辑存储，索引是由段（Segment）组成的，段不是实时更新的，这意味着，在建立索引时，一个段写入磁盘后，就不再被更新。被删除文档的信息存储在一个单独的文件中，在搜索数据时，ElasticSearch首先从段中查询，再从查询结果中过滤被删除的文档，这意味着，段中存储”未被删除文档“的密度降低。多个段可以通过段合并（Segment Merge）操作把“已删除”的文档将从段中物理删除，将未删除的文档合并成一个新段，新段中没有”已删除文档“，因此，段合并操作能够提高索引的查找速度，但段合并是IO密集型的，需要消耗大量的IO操作。

一旦数据存储在倒排索引中，就不能被修改，因此，更新文档是一项复杂的任务。在内部，ElasticSearch引擎必须首先获取文档(从_source属性中获得数据)，删除旧的文档，更新_source属性，然后重新索引该文档，使之可被搜索到，就是说，文档更新的流程，实际上是先标记文档被删除，后插入新的文档，最后将新文档编入索引。

数据的更新，主要是通过_update端点，编写内嵌脚本（inline script）来实现。默认的脚本语言是Groovy，Groovy是内置的脚本语言，不需要安装，默认是禁用的，在未启用动态脚本的结点上执行脚本更新，ElasticSearch引擎将会抛出异常消息：

scripts of type [inline], operation [update] and lang [groovy] are disabled

分类导航

ElasticSearch查询第二篇：文档更新

网友评论

更多精彩分享

分类导航

ElasticSearch查询 第二篇：文档更新

网友评论

更多精彩分享

ElasticSearch查询第二篇：文档更新