为什么是奇怪的格式？ - ElasticSearch权威指南 - PHPERZ中文资讯站

教程

关于入门为了搜索，你懂的安装Elasticsearch 与Elasticsearch交互面向文档开始第一步检索文档分析教程小结分布式的特性下一步集群内部工作方式空集群集群健康添加索引增加故障转移横向扩展继续扩展应对故障数据吞吐什么是文档？索引一个文档检索文档检查文档是否存在更新整个文档创建一个新文档删除文档处理冲突文档局部更新检索多个文档更省时的批量操作结语分布式文档存储路由文档到分片主分片和复制分片如何交互新建、索引和删除文档检索文档局部更新文档多文档模式为什么是奇怪的格式？搜索——基本的工具空搜索多索引和多类别分页简易搜索映射和分析映射及分析确切值(Exact values) vs. 全文文本(Full text) 倒排索引分析和分析器映射复合核心字段类型结构化查询请求体查询结构化查询 Query DSL 查询与过滤最重要的查询过滤语句查询与过滤条件的合并验证查询结语排序相关性排序多值字段字符串排序相关性简介数据字段分布式搜索的执行方式查询阶段取回阶段搜索选项扫描和滚屏索引管理创建索引索引设置配置分析器自定义分析器类型和映射根对象元数据：_source 字段元数据：_all 字段文档 ID 动态映射自定义动态索引默认映射重新索引数据索引别名和零停机时间入门使文本可以被搜索动态索引近实时搜索持久化变更合并段结构化搜索查找准确值组合过滤查询多个准确值包含，而不是相等范围处理 Null 值关于缓存过滤顺序地理坐标点地理坐标点通过地理坐标点过滤地理坐标盒模型过滤器地理距离过滤器缓存地理位置过滤器减少内存占用按距离排序 Geohashes Geohashes Geohashes 映射 geohash单元过滤器地理位置聚合地理位置聚合按距离聚合 geohash单元聚合器范围（边界）聚合器地理形状地理形状映射地理形状索引地理形状查询地理形状在查询中使用已索引的形状地理形状的过滤与缓存嵌套嵌套-对象嵌套-映射嵌套-查询嵌套排序嵌套-集合

发布于 2016-02-29 14:26:07 | 418 次阅读 | 评论: 0 | 来源: 网络整理

为什么是奇怪的格式？

当我们在《批量》一章中学习了批量请求后，你可能会问：“为什么bulk API需要带换行符的奇怪格式，而不是像mget API一样使用JSON数组？”

为了回答这个问题，我们需要简单的介绍一下背景：

批量中每个引用的文档属于不同的主分片，每个分片可能被分布于集群中的某个节点上。这意味着批量中的每个操作(action)需要被转发到对应的分片和节点上。

如果每个单独的请求被包装到JSON数组中，那意味着我们需要：

解析JSON为数组（包括文档数据，可能非常大）
检查每个请求决定应该到哪个分片上
为每个分片创建一个请求的数组
序列化这些数组为内部传输格式
发送请求到每个分片

这可行，但需要大量的RAM来承载本质上相同的数据，还要创建更多的数据结构使得JVM花更多的时间执行垃圾回收。

取而代之的，Elasticsearch则是从网络缓冲区中一行一行的直接读取数据。它使用换行符识别和解析action/metadata行，以决定哪些分片来处理这个请求。

这些行请求直接转发到对应的分片上。这些没有冗余复制，没有多余的数据结构。整个请求过程使用最小的内存在进行。

最新网友评论 共有(0)条评论发布评论返回顶部

后端技术

前端技术

数据库

热门框架

常用IDE

其他

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved 冀ICP备14009818号版权声明广告服务