< img height="1" width="1" style="display:none;" alt="" src="https://px.ads.linkedin.com/collect/?pid=3131724&fmt=gif" />

WhizardTelemetry 可观测平台

WhizardTelemetry 可观测平台是一款企业级多集群监控告警产品,专注于提供一体化的云原生可观测性服务。该平台提供了从基础设施到应用的多层级、多维度、多租户的指标监控和告警功能。同时,通过可插拔的 Whizard 可观测中心实现了监控告警的多集群统一纳管能力,以及成员集群和边缘集群的轻量化支持。

WhizardTelemetry 可观测平台由以下扩展组件构成:

  • WhizardTelemetry 平台服务:是 WhizardTelemetry 可观测平台各扩展组件的公共服务。它是各个可观测性扩展组件通用的 APIServer,为所有可观测性扩展组件提供公共的后端平台服务。

  • WhizardTelemetry 日志:提供多租户视角的云原生应用实时及历史日志收集、查询、导出、存储等功能,可对接如 ElasticSearch、OpenSearch、Kafka 等日志接收器。

  • WhizardTelemetry 事件:可长期保存 Kubernetes 相关对象产生的事件,并提供多租户视角的事件检索和查看功能。

  • WhizardTelemetry 审计:实时记录在 KubeSphere 平台上的用户相关操作行为,并提供多租户视角的审计历史的检索及查看功能,可快速回溯相关用户的操作行为。

  • WhizardTelemetry 监控:提供多租户视角的云原生资源监控能力,包括针对集群,节点,工作负载、GPU、K8s 控制面等对象的核心监控指标进行实时和历史数据展示等功能。

  • WhizardTelemetry 告警:基于 KubeSphere 采集的监控数据,可针对不同资源类型和监控指标,提供平台及租户视角的告警及告警规则管理功能。

  • WhizardTelemetry 事件告警:为 Kubernetes 原生事件和 Kubernetes/KubeSphere 审计事件定义告警规则,对传入的事件数据进行评估,并将告警发送到指定的接收器如 HTTP 端点等。

  • WhizardTelemetry 通知:管理多租户 Kubernetes 环境中的通知。它能够接收来自不同发送者的告警、云事件以及其他类型的事件(例如审计和 Kubernetes 事件),并根据租户标签(如命名空间或用户)将通知发送给相应的租户接收器。支持邮件、飞书、钉钉、企业微信、Slack、Webhook 等多种通知渠道。

  • WhizardTelemetry 数据流水线:提供可观测性数据的收集、转换和路由能力。

  • OpenSearch 分布式检索与分析引擎:支持使用外置或内置的 OpenSearch 集群来存储、检索与分析日志、审计、事件、通知历史等可观测数据。

  • Grafana for WhizardTelemetry:一个开放且可组合的数据可视化和监控分析平台,内置众多仪表盘(Dashboard)来增强 WhizardTelemetry 可观测平台的可视化能力。

  • Grafana Loki for WhizardTelemetry:支持在 Grafana 控制台查看存储到 Loki 的 KubeSphere 日志、审计、事件及通知历史数据。

WhizardTelemetry 平台服务

介绍 WhizardTelemetry 平台服务。

配置 WhizardTelemetry 平台服务

介绍如何配置 WhizardTelemetry 平台服务。

WhizardTelemetry 数据流水线

介绍如何使用 WhizardTelemetry 数据流水线。

Vector 日志 ETL 方案 - 从 Kafka 到 OpenSearch

介绍 Vector 日志 ETL 方案。

步骤 1:使用 Vector 将数据写入 Kafka

步骤 2:使用 Vector 从 Kafka 读取数据

步骤 3:配置 WhizardTelemetry 平台服务

WhizardTelemetry 日志

介绍如何使用“WhizardTelemetry 日志”扩展组件。

使用容器日志查询工具

介绍如何使用容器日志查询工具。

配置日志管理

介绍如何配置“WhizardTelemetry 日志”扩展组件。

日志收集

介绍如何启用和禁用日志收集功能。

启用日志收集

介绍如何修改扩展组件的配置,以启用日志收集功能。

在项目中启用日志收集

介绍如何启用日志收集。

启用收集卷上日志

介绍如何启用收集卷上日志。

日志接收器

介绍如何配置或添加日志接收器。

配置 OpenSearch 日志接收器

介绍如何配置 OpenSearch 日志接收器。

管理日志接收器

介绍如何添加和管理日志接收器。

添加日志接收器

介绍如何添加日志接收器。

查看日志接收器列表

介绍如何查看日志接收器列表。

查看日志接收器详情

介绍如何查看日志接收器详情。

编辑日志接收器设置

介绍如何编辑日志接收器设置。

启用和禁用日志接收器

介绍如何启用和禁用日志接收器。

删除日志接收器

介绍如何删除日志接收器。

WhizardTelemetry 事件

介绍如何使用“WhizardTelemetry 事件”扩展组件。

使用资源事件查询工具

介绍如何使用资源事件查询工具。

WhizardTelemetry 监控

介绍如何使用“WhizardTelemetry 监控”扩展组件。

概览

介绍如何查看集群、企业空间、项目概览页面的监控信息。

查看集群监控概览

介绍如何查看集群概览页面的监控信息。

查看企业空间监控概览

介绍如何查看企业空间概览页面的监控信息。

查看项目监控概览

介绍如何查看项目概览页面的监控信息。

集群状态

介绍如何查看集群状态。

查看集群状态概览

介绍如何查看集群状态概览。

查看物理资源状态

介绍如何查看物理资源状态。

查看 etcd 数据库状态

介绍如何查看 etcd 数据库状态。

查看 Kubernetes API 服务器状态

介绍如何查看 Kubernetes API 服务器监控数据。

查看调度器状态

介绍如何查看调度器状态。

查看节点资源用量排行

介绍如何按照特定资源的用量对节点进行排序。

应用资源

介绍如何查看应用资源数据。

查看应用资源用量

介绍如何查看应用资源用量的监控数据。

查看项目资源用量排行

介绍如何查看项目资源用量排行。

自定义监控

介绍如何使用自定义监控面板。

创建自定义监控面板

介绍如何创建自定义监控面板。

查看自定义监控面板

介绍如何查看自定义监控面板。

编辑自定义监控面板信息

介绍如何编辑自定义监控面板的信息。

编辑自定义监控面板

介绍如何编辑自定义监控面板。

删除自定义监控面板

介绍如何删除自定义监控面板。

编辑监控导出器

介绍如何编辑监控导出器。

WhizardTelemetry 告警

介绍如何使用“WhizardTelemetry 告警”扩展组件。

规则组

介绍如何创建、编辑和查看告警规则组。

创建规则组

介绍如何创建告警规则组。

查看规则组列表

介绍如何查看告警规则组列表。

查看规则组详情

介绍如何查看规则组详情。

编辑规则组信息

介绍如何编辑规则组信息。

编辑告警规则

介绍如何编辑规则组中的告警规则。

禁用和启用规则组

介绍如何禁用和启用告警规则组。

删除规则组

介绍如何删除规则组。

重置内置规则组

介绍如何重置内置规则组。

告警

介绍如何使用告警功能。

查看告警列表

介绍如何查看告警列表。

Whizard 可观测中心

介绍如何使用 Whizard 可观测中心功能。

启用 Whizard 可观测中心

介绍如何启用 Whizard 可观测中心。

资源监控

介绍如何查看多集群的资源监控数据。

查看多集群监控数据

介绍如何查看多集群监控数据。

查看资源用量排行

介绍如何查看资源用量排行。

全局告警

介绍如何在 Whizard 可观测中心管理全局告警和全局规则组。

规则组

介绍如何在 Whizard 可观测中心使用告警规则组功能。

创建规则组

介绍如何创建告警规则组。

查看规则组列表

介绍如何查看告警规则组列表。

查看规则组详情

介绍如何查看规则组详情。

编辑规则组信息

介绍如何编辑告警规则组的信息。

编辑告警规则

介绍如何编辑告警规则组中的告警规则。

禁用和启用规则组

介绍如何禁用和启用告警规则组。

删除自定义规则组

介绍如何删除告警规则组。

重置内置规则组

介绍如何重置内置规则组。

告警

介绍如何在 Whizard 可观测中心使用告警功能。

查看告警列表

介绍如何在 Whizard 可观测中心查看全局告警列表。

资源查询

介绍如何跨集群查询资源信息。

容器组

介绍如何跨集群查询容器组。

跨集群查询容器组

介绍如何在 Whizard 可观测中心跨集群查询 pod。

设置组件

介绍如何设置 Whizard 组件。

WhizardTelemetry 通知

介绍如何使用“WhizardTelemetry 通知”扩展组件。

通知渠道

介绍如何设置通知渠道。

设置邮件通知

介绍如何设置邮件通知。

设置飞书通知

介绍如何设置飞书通知。

设置钉钉通知

介绍如何设置钉钉通知。

设置企业微信通知

介绍如何设置企业微信通知。

设置 Slack 通知

介绍如何设置 Slack 通知。

设置 Webhook 通知

介绍如何设置 Webhook 通知。

通知订阅

介绍如何管理通知订阅。

创建通知订阅

介绍如何创建通知订阅。

查看通知订阅

介绍如何查看通知订阅。

编辑通知订阅

介绍如何编辑通知订阅。

删除通知订阅

介绍如何删除通知订阅。

通知设置

本节介绍如何管理静默策略和通知语言。

创建静默策略

本节介绍如何创建静默策略。

编辑静默策略信息

本节介绍如何编辑静默策略信息。

编辑静默条件

本节介绍如何编辑通知静默条件。

编辑静默时间

本节介绍如何编辑通知静默时间。

删除静默策略

本节介绍如何删除静默策略。

修改通知语言

本节介绍如何修改通知语言。

通知历史

介绍如何查看通知历史记录。

查看通知历史

介绍如何查看通知历史记录。

用户通知设置

介绍如何设置用户的通知渠道。

设置邮件通知

介绍如何设置邮件通知。

设置飞书通知

介绍如何设置飞书通知。

设置钉钉通知

介绍如何设置钉钉通知。

设置企业微信通知

介绍如何设置企业微信通知。

设置 Slack 通知

介绍如何设置 Slack 通知。

设置 Webhook 通知

介绍如何设置 Webhook 通知。

通知消息配置

介绍如何配置通知消息。

配置企业微信的通知消息模板

介绍如何配置企业微信的通知消息。

OpenSearch 分布式检索与分析引擎

介绍“OpenSearch 分布式检索与分析引擎”扩展组件。

概述

介绍 “OpenSearch 分布式检索与分析引擎”扩展组件。

Grafana for WhizardTelemetry

介绍如何使用 Grafana for WhizardTelemetry 扩展组件。

查看内置 Dashboard

介绍如何查看扩展组件提供的内置 Dashboard。

添加数据源

介绍如何添加 grafana 数据源。

创建 Dashboard

介绍如何创建 Dashboard。

Grafana Loki for WhizardTelemetry

介绍如何使用 Grafana Loki for WhizardTelemetry 扩展组件。

可视化 Loki 中的数据

介绍如何在 Grafana 可视化 loki 中的日志、审计、事件及通知历史数据。