[5]elasticsearch源码深远剖析——cat API是怎么加载的

本篇为elasticsearch源码分析连串小说的第五篇,如若在命令行格局下启动ElasticSearch会首先接触到cat
API相关的情节。假使选用JSON格式的数额显示,在终极命令下会显得易读性就差,这就须求紧密对齐的文书,分行分表格的显得数据,也就是ElasticSearch中的cat
API接口。

cat API的分类

cat API是esAPI中比较简单的一种,es中的API按照大类分为下边二种:

  • 文档API(Document APIs): 提供对文档的增删改查操作
  • 搜索API(Search APIs): 提供对文档进行某个字段的询问
  • 索引API(Indices APIs): 提供对索引进行操作
  • 翻看API(cat APIs): 按照更直观的花样重回数据,更适用于控制台请求彰显
  • 集群API(Cluster APIs): 对集群开展查看和操作的API

上面大家以简单的cat APIs为切入点,对API源码举行剖析。

cat API的用法

信任用过elasticsearch的同窗都掌握,elasticsearch提供了restful的查看API,来对运行中的elasticsearch举行查看。

切切实实的API命令如下:

参考官方文档:
https://www.elastic.co/guide/en/elasticsearch/reference/current/cat.html\#intro

命令 举例 解释
aliases /_cat/XXX/aliases?v
/_cat/aliases/alias1,aliase2
查询当前配置索引,过滤器,路由的别名,指定一至多个别名,则以逗号隔开
allocation /_cat/allocation?v 查询每个节点上分配的分片(shard)的数量和每个分片(shard)所使用的硬盘容量
count /_cat/count?v 快速查询当前整个集群或者指定索引的document的数量(不包括删除的但是还没有清理掉的document)
fielddata /_cat/fielddata?v
/_cat/fielddata?v&fields=XXX
/_cat/fielddata/field1,field2,field3?v
查询集群中节点的filedata所使用的堆内存,指定fields,或多个fields
health /_cat/health?v
/_cat/health?v&ts=false
查询当前集群的健康信息(同/_cluster/health)
ts用于控制是否显示时间戳(timestamp)
1、常见的用途是用于监测节点之间的健康值
2、通过循环使用该命令,用于追踪大集群恢复的时间
/_cat/health; sleep 120;
done green:每个索引的primary shard和replica shard都是active状态的。
yellow:每个索引的primary shard都是active状态的,但是部分replica shard不是active状态,处于不可用的状态
red:不是所有索引的primary shard都是active状态的,部分索引有数据丢失了
indices /_cat/indices/index1?v 查询指定索引index1的相关信息(组成一个索引(index)的shard数量,document的数量,删除的doc数量,主存大小和所有索引的总存储大小(包括replicas)
    其中document的数量和删除document的数量是lucense层级的,包括所有隐藏的document数量<br />
    要获取Elasticsearch层级的精确的document数量可以使用 cat count或者Count API<br />
master /_cat/master?v 仅用于显示master的节点ID,绑定IP地址,节点名称
nodeattrs /_cat/nodeattrs?v 输出显示自定义节点属性
nodes /_cat/nodes?v
/_cat/nodes?v&full_id=false
输出当前集群的拓扑结构(包括当前节点所在的地方和整个集群的相关信息等)
full_id(true/false)用于是否格式化ID字段以显示ID的全长或者简写
pending_tasks /_cat/pending_tasks?v 输出集群中正在执行的任务(集群层级的变化,比如:创建索引,更新mapping,分配或者fail shard)同 /_cluster/pending_tasks
plugins /_cat/plugins?v 输出每个节点正在运行的插件信息
recovery /_cat/recovery?v 提供一个视图关于索引分片 正在恢复或者已经完成恢复的相关信息,恢复事件操作可以发生在集群中一个索引分片从一个节点移动到另外一个节点上。可以发生在快照恢复期间,一个replication层级的变化,节点失败,或者节点启动的时候。节点启动的恢复操作也叫本地存储恢复(当一个节点启动的时候分片从硬盘上被加载到)
repositories /_cat/repositories?v 输出集群中注册快照存储库
thread pool /_cat/thread_pool 输出每个节点集群范围的线程池统计信息,默认情况下返回正在活动,队列和被拒绝的统计信息
shards /_cat/shards
/_cat/shards/twitt*
输出节点包含分片的详细信息(当前分片是primary shard还是 replica shard,doc的数量,硬盘上占用的字节已经该节点被分配在哪里等) 指定索引(模糊匹配)
这个命令可以用于查看分片的迁移情况和分片的状态
segments /_cat/segments?v
/_cat/segments/index1,index1
输出索引分片中关于segment的低层级的信息(包括索引名称,分片数量,doc数量等),提供的信息类似于_segments端点查询指定索引(index1,index2)的segments信息
snapshots /_cat/snapshots/repo1?v 输出属于指定仓库的快照信息(snapshots)每个快照信息包括了它被启动和被停止的信息。
templates /_cat/templates?v
/_cat/templates/templateName1
/_cat/templates/template*
输出当前正在存在的模板信息
输出指定模板的信息

Cat的通用参数如下:

命令 举例 解释
Verbose /_cat/XXX/?v 开启详细输出
Help /_cat/XXX/?help 输出可用的列
Headers /_cat/XXX/?h=column1,column2 指定输出的列
Sort /_cat/XXX/?v&s=column1,column2:desc,column3 指定输出的列进行排序,默认按照升序排序
Format /_cat/XXX?format=json 指定响应返回的数据格式:text(默认),json,yaml,smile,cbor(通过设置 Accept的HTTP头部的多媒体格式的优先级更高)

cat API源码详情

针对http://127.0.0.1:9200/\_cat/以此最不难易行的cat
API请求,大家很简单就能在org.elasticsearch.rest包中找到关于cat
API的代码,而且elasticsearch的代码也很清楚,如下图:

cat API相关代码

上图中的种种Action类,就对应了前方列出的cat API中的各样实例。

我们在”启航进程(Bootstrap)“一篇的末梢提到了Node的实例化,而加载RestAction就是在Node的实例化中,在获取http.enabled的设定参数值为true后,会开头初叶化http处理程序,如下图:

加载http处理器

调用了ActionModule类的initRestHandlers方法,知道这么些Action类会全体加载到registerHandler中。initRestHandlers方法须要的参数setting和restController,在ActionModule的实例化过程中曾经被注入了。

加载Action类

为了使得浏览器在调用http://127.0.0.1:9200/\_cat/的时候输出正确内容,controller先注册了
“_cat” 这几个途径,注册的代码如下:

controller.registerHandler(GET, "/_cat", this);

然后将List<AbstractCatAction> catActions
中保存的享有action根据事先在documentation中设定好的文本取出来,送入Response中。那样就能在呼吁http://127.0.0.1:9200/\_cat/的时候输出正确的文书。那就是最简便的cat
API的逻辑。

相关文章