查看 etcd 数据库状态

本节介绍如何查看 etcd 数据库状态。

说明
查看 etcd 监控信息需要提前启用 etcd 监控。有关更多信息，请参阅扩展中心 WhizardTelemetry 监控扩展组件的详情页说明。

说明

查看 etcd 监控信息需要提前启用 etcd 监控。有关更多信息，请参阅扩展中心 WhizardTelemetry 监控扩展组件的详情页说明。

Prerequisites

You should join a cluster and have the 监控查看 permission within the cluster. For more information, refer to "Cluster Members" and "Cluster Roles".
KubeSphere 平台需要安装并启用 WhizardTelemetry 监控扩展组件。

Steps

Log in to the KubeSphere web console with a user who has the 监控查看 permission, and access your cluster.
Click 监控告警 > 集群状态 in the left navigation pane.

在集群状态页面，点击 etcd 监控页签查看 etcd 数据库的运行状态。

etcd 监控页签提供以下信息：

参数	描述
服务状态	显示 etcd 集群的 Leader 节点、每个节点的 IP 地址和 1 小时内 Leader 变更次数。
数据库大小	指定时间范围内 etcd 数据库的大小。
客户端流量	显示发送给 gRPC 客户端和从 gRPC 客户端接收的数据流量。
gRPC 流式消息	显示服务端的 gRPC 流式消息每秒接收次数和发送次数。
WAL 日志同步时间	显示 WAL 调用 fsync 的延迟。在应用日志条目之前，etcd 会在持久化日志条目到磁盘时调用 wal_fsync。
数据库同步时间	显示后端调用提交延迟的分布。当 etcd 将其最新的增量快照提交到磁盘时，会调用 backend_commit。磁盘操作延迟较大（WAL 日志同步时间或库同步时间较长）通常表示磁盘存在问题，这可能会导致请求延迟过高或集群不稳定。
Raft 提议	显示当前 etcd 每秒的 Raft 提议次数。将鼠标悬停在折线图上即可查看具体某个时间点的提议数据。提议提交速率：协商一致提议的提交速率。如果集群运行状况良好，则该指标应随着时间的推移而增加。etcd 集群的几个健康成员可以同时具有不同的一般提议。单个成员与其 Leader 之间的持续较大滞后表示该成员缓慢或不健康。提议应用速率：协商一致提议的总应用率。etcd 服务器异步地应用每个提交的提议。提议提交速率和提议应用速率的差异应该很小（即使在高负载下也只有几千）。如果它们之间的差异持续增大，则表明 etcd 服务器过载。当使用大范围查询或大量 txn 操作等大规模查询时，可能会出现这种情况。提议失败速率：提议失败的总速率。该值受两个因素影响：与 Leader 选举相关的临时失败；集群成员数目达不到规定数目而导致长时间停机。排队提议数：当前待处理提议的数量。待处理提议的增加表明客户端负载较高或成员无法提交提议。

参数

描述

服务状态

显示 etcd 集群的 Leader 节点、每个节点的 IP 地址和 1 小时内 Leader 变更次数。

数据库大小

指定时间范围内 etcd 数据库的大小。

客户端流量

显示发送给 gRPC 客户端和从 gRPC 客户端接收的数据流量。

gRPC 流式消息

显示服务端的 gRPC 流式消息每秒接收次数和发送次数。

WAL 日志同步时间

显示 WAL 调用 fsync 的延迟。在应用日志条目之前，etcd 会在持久化日志条目到磁盘时调用 wal_fsync。

数据库同步时间

显示后端调用提交延迟的分布。当 etcd 将其最新的增量快照提交到磁盘时，会调用 backend_commit。磁盘操作延迟较大（WAL 日志同步时间或库同步时间较长）通常表示磁盘存在问题，这可能会导致请求延迟过高或集群不稳定。

Raft 提议

显示当前 etcd 每秒的 Raft 提议次数。将鼠标悬停在折线图上即可查看具体某个时间点的提议数据。

提议提交速率：协商一致提议的提交速率。如果集群运行状况良好，则该指标应随着时间的推移而增加。etcd 集群的几个健康成员可以同时具有不同的一般提议。单个成员与其 Leader 之间的持续较大滞后表示该成员缓慢或不健康。
提议应用速率：协商一致提议的总应用率。etcd 服务器异步地应用每个提交的提议。提议提交速率和提议应用速率的差异应该很小（即使在高负载下也只有几千）。如果它们之间的差异持续增大，则表明 etcd 服务器过载。当使用大范围查询或大量 txn 操作等大规模查询时，可能会出现这种情况。
提议失败速率：提议失败的总速率。该值受两个因素影响：与 Leader 选举相关的临时失败；集群成员数目达不到规定数目而导致长时间停机。
排队提议数：当前待处理提议的数量。待处理提议的增加表明客户端负载较高或成员无法提交提议。

有关 etcd 数据库参数的更多信息，请参阅 etcd 官方文档。

Click in the upper right corner to set the time range.

Click / in the upper right corner to enable/disable real-time data refresh.

Click in the upper right corner to refresh data manually.

Feedback

Was this page Helpful?

Receive the latest news, articles and updates from KubeSphere

Thanks for the feedback. If you have a specific question about how to use KubeSphere, ask it on Slack. Open an issue in the GitHub repo if you want to report a problem or suggest an improvement.

Previous : 查看物理资源状态 Next : 查看 Kubernetes API 服务器状态

What’s on this Page