背景 之前写过一篇《java使用transportClient连接elasticsearch并做接口实现增删改查ES6.4.3版本》的文章,在项目中可以作为基本的使用。但是没有权限验证及分词的处理。在资料查找中,发现TransportClien客...
ELK
elasticsearch笔记整理(十六)-深入搜索-控制相关度、处理人类语言、聚合、地理位置、数据建模、管理监控和部署、内存设置-选摘自《elasticsearch权威指南》
1.控制相关度 处理结构化数据(比如:时间、数字、字符串、枚举)的数据库, 只需检查文档(或关系数据库里的行)是否与查询匹配。 布尔的是/非匹配是全文搜索的基础,但不止如此,我们还要知道每个文档与查询...
elasticsearch笔记整理(十五)-深入搜索-近似匹配、相关度、性能优化、部分匹配、自动补全-选摘自《elasticsearch权威指南》
使用 TF/IDF 的标准全文检索将文档或者文档中的字段作一大袋的词语处理。 match 查询可以告知我们这大袋子中是否包含查询的词条,但却无法告知词语之间的关系。 思考下面这几个句子的不同: ● Sue ate the al...
elasticsearch笔记整理(十四)-深入搜索-多字段搜索(单字符串、多字符串、最佳字段、multi_match查询、多数字段、自定义_all、提升权重和以字段为中心)-选摘自《elasticsearch权威指南》
查询很少字段是简单一句话的 match 匹配查询。通常我们需要用相同或不同的字符串查询一个或多个字段,也就是说,需要对多个查询语句以及它们相关度评分进行合理的合并。(以elasticsearch中文版2.0为基础,可能有...
elasticsearch笔记整理(十三)-深入搜索-全文搜索(基于词项与基于全文查询、匹配查询、多次查询、组合查询、控制分析(分词器))-选摘自《elasticsearch权威指南》
我们已经介绍了搜索结构化数据的简单应用示例,现在来探寻 全文搜索(full-text search) :怎样在全文字段中搜索到最相关的文档。(文档是基于elasticsearch2.0编写的,部分语法可能已失效,请查看最新的英文文档...
elasticsearch笔记整理(十一)-基础入门-分片内部原理(倒排索引、实时搜索、持久化变更和段合并)-选摘自《elasticsearch权威指南》
elasticsearch中究竟什么是一个分片,它是如何工作的? ● 为什么搜索是近实时的? ● 为什么文档的 CRUD (创建-读取-更新-删除) 操作是 实时 的? ● Elasticsearch 是怎样保证更新被持久化在断电时也不丢失数据? ● ...
elasticsearch笔记整理(十二)-深入搜索-结构化搜索(精确查找、组合过滤器、范围和日期查询、null值、缺失和exist查询、关于缓存)-选摘自《elasticsearch权威指南》
结构化搜索(Structured search)是指有关探询那些具有内在结构数据的过程。比如日期、时间和数字都是结构化的:它们有精确的格式,我们可以对这些格式进行逻辑操作。比较常见的操作包括比较数字或时间的范围,或...
elasticsearch笔记整理(十)-基础入门-索引管理(创建删除索引、索引配置、自定义分析器、元数据和动态映射和字段属性)-选摘自《elasticsearch权威指南》
1.创建一个索引 索引采用的是默认的配置,新的字段通过动态映射的方式被添加到类型映射。现在我们需要对这个建立索引的过程做更多的控制:我们想要确保这个索引有数量适中的主分片,并且在我们索引任何数据 之前...
elasticsearch笔记整理(九)-基础入门-执行分布式检索(字符串排序与多字段、子字段)-选摘自《elasticsearch权威指南》
一个 CRUD 操作只对单个文档进行处理,文档的唯一性由 _index, _type, 和 routing values (通常默认是该文档的 _id )的组合来确定。 这表示我们确切的知道集群中哪个分片含有此文档。 搜索需要一种更加复杂...
elasticsearch笔记整理(八)-基础入门-排序与相关性(字符串排序与多字段、子字段)-选摘自《elasticsearch权威指南》
默认情况下,ES搜索返回的结果是按照相关性进行排序的——最相关的文档排在最前。 为了按照相关性来排序,需要将相关性表示为一个数值。在 Elasticsearch 中, 相关性得分 由一个浮点数进行表示,并在搜索结果中...
elasticsearch笔记整理(七)-基础入门-请求体查询(查询表达式、查询与过滤、组合查询与验证、执行过程)-选摘自《elasticsearch权威指南》
简易查询 —query-string search— 对于用命令行进行即席查询(ad-hoc)是非常有用的。 然而,为了充分利用查询的强大功能,你应该使用请求体 search API, 之所以称之为请求体查询(Full-Body Search),因为大部分...
elasticsearch笔记整理(六)-基础入门-分布式文档存储(映射、分析、倒排)-选摘自《elasticsearch权威指南》
1.映射和分析 基于对字段类型的猜测, Elasticsearch 动态为我们产生了一个映射。date 字段和 string 字段 索引方式不同,因此搜索结果也不一样。这完全不令人吃惊。你可能会认为 核心数据类型 strings、numbers...
elasticsearch笔记整理(五)-基础入门-搜索,最基本的工具-选摘自《elasticsearch权威指南》
Elasticsearch 作为一个简单的 NoSQL 风格的分布式文档存储系统。我们可以将一个 JSON 文档扔到 Elasticsearch 里,然后根据 ID 检索。但 Elasticsearch 真正强大之处在于可以从无规律的数据中找出有意义的信息——...
elasticsearch笔记整理(四)-基础入门-分布式文档存储-选摘自《elasticsearch权威指南》
1.路由一个文档到分片中 当索引一个文档的时候,文档会被存储到一个主分片中。 Elasticsearch 如何知道一个文档应该存放到哪个分片中呢?当我们创建文档时,它如何决定这个文档应当被存储在分片 1 还是分片 2 中...
elasticsearch笔记整理(三)-基础入门-数据输入和输出-选摘自《elasticsearch权威指南》
无论我们写什么样的程序,目的都是一样的:以某种方式组织数据服务我们的目的。 但是数据不仅仅由随机位和字节组成。我们建立数据元素之间的关系以便于表示实体,或者现实世界中存在的 事物 。 如果我们知道一个...