Overview
System Administrator권한을 가진 사용자는 Monitoring에서 모든 권한을 가지고 있습니다.
Monitoring에 접속하는 방법
- 콘솔에서 Monitoring Menu 선택 
- Grafana URL에 직접 접근 
웹페이지의 주소창에 Grafana Domain URL를 입력한 후 Cloud Z CP의 계정으로 login
URL 예시 : https://{Realm name}-monitoring.{Realm name}.cloudzcp.net/
Org 변경하는 방법
Grafana 좌측 하단의 아이콘을 클릭하면 접속한 계정에 대한 정보 및 관련 메뉴들이 표시됩니다.
이 중 “Current Org” 메뉴를 선택하면 Org를 변경할 수 있습니다.
Switch Organization 팝업창에서 현재의 Org는 “Current” 버튼으로 표시됩니다.
변경하고자 하는 Org의 “Switch to” 버튼을 클릭하면 해당 Org가 현재의 Org로 변경 됩니다.
Dashboard 로 이동
1. 상단의 Home 메뉴를 선택하세요.
2. 최근에 선택했던 Dashboard(Recent)와 기본제공 Folder(4개) 가 보입니다.
3. 기본제공 Folder 중에 하나를 선택하면 Folder 에 속해 있는 Dashboard 들이 펼쳐집니다.
4. Dashboard 선택하면 각종 Panel 로 구성되어 있는 화면을 만날 수 있습니다.
5. 우측 상단에서 검색 기간과 재검색 주기를 설정할 수 있습니다.
시계 아이콘과 함께 있는 시간 부분(default : Last 1 hour)에 마우스를 가져가시면 현재의 검색 기간이 표시됩니다.
시간 부분에 마우스를 클릭하면 아래와 같은 검색기간을 설정할 수 있는 팝업창이 표시됩니다.
절대적인 범위(Absolute time range)로 설정하실 수도 있고, 상대적인 범위(Relative time ranges)로 설정하실 수도 있습니다.
시간 부분 우측에는 재검색 주기를 선택할 수 있는 부분이 있습니다.
무한루프 도는 듯한 아이콘과 함께 있는 시간 부분(default : 10s)에 마우스를 클릭하시면 검색기간의 Metric 정보를 자동으로 재검색하는 주기를 지정할 수 있습니다.
제일 상단에는 재검색을 중지할 수 있는 Off이고, 5초부터 하루까지 선택할 수 있습니다.
원하는 주기를 선택하면 재검색 주기가 지정됩니다.
Grafana 기본 제공 Dashboard
Cloud Z CP 에서 기본으로 제공하는 Dashboard 에 대하여 설명합니다.
참고 Document : https://grafana.com/docs/grafana/v7.5/dashboards/
Cluster Dashboards
- Kubernetes : API Server 
API Server에 대한 정보들(RPC Rate, CPU / Memory / Work Queue 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| Up | up인 API Server 개수 | 
| RPC Rate | API Server들의 RPC Rate | 
| Request duration 99th quantile | API Server의 request 기간 동안의 99번째 분위수(quantile) | 
| CPU usage | API Server의 CPU 사용량 | 
| Memory | API Server의 Memory 사용량 | 
| Goroutines | API Server의 Goroutine 사용량 | 
| Work Queue Add Rate | Work Queue에 추가되는 Rate | 
| Work Queue Depth | Work Queue의 Depth | 
| Work Queue Latency | Work Queue의 지연률 | 
- Kubernetes : Component Overview 
Kubernetes Component에 대한 요약 정보들(API Server, Pod, Container 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| API Server Requests (Req/Sec) | API Server의 request 총합 | 
| API Server Latency | API Server들의 지연률 총합 | 
| Kublet Pod Start Latency | Kublet Pod들이 시작될 때의 지연률 | 
| Running Pods Trands | running 상태의 pod들의 개수 (min, max, avg, current 따로 표시) | 
| Creating Rate of Pods | 2분 사이에 생성된 running 상태의 Pod들의 개수 | 
| Running Containers Trands | running 상태의 Container들의 개수 (min, max, avg, current 따로 표시) | 
| Creating Rate of Containers | 2분 사이에 생성된 running 상태의 Container들의 개수 | 
- Kubernetes : Kubelet 
Kubelet에 대한 정보들(Pod, Node, Storage, Cgroup, PLEG, RPC 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| Up | up인 instance 개수 | 
| Running Pods | Node들에 있는 running 상태의 Pod들의 개수 | 
| Running Container | Node들에 있는 running 상태의 Container들의 개수 | 
| Actual Volume Count | actual_state_of_world 상태인 volume들의 개수 | 
| Desired Volume Count | desired_state_of_world 상태인 volume들의 개수 | 
| Config Error Count | 5분 사이에 config error가 난 Node들의 개수 | 
| CPU usage | Node들의 CPU 사용량 | 
| Memory | Node들의 Memory 사용량 | 
| Goroutines | Node들의 Goroutines 사용량 | 
| Operation Rate | Operation들의 runtime Rate | 
| Operation Error Rate | Operation들의 Error Rate | 
| Operation duration 99th quantile | Operation들의 runtime 기간 동안의 99번째 분위수(quantile) | 
- Kubernetes : Namespace 
Namespace에 대한 정보들(Status, Age, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| STATUS | Namespace의 상태 | 
| AGE | 현재로부터 가장 오래 전에 생성된 Namespace의 지금까지의 기간 | 
| Total CPU | Namespace에 있는 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | Namespace에 있는 Container들의 CPU 사용량 | 
| Total Memory | Namespace에 있는 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | Namespace에 있는 Container들의 Memory 사용량 | 
| Total Network | Namespace에 있는 Container들에서 사용된 Network의 합계(MBps) | 
| Total Filesystem Read/Write | Namespace에 있는 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | Namespace에 있는 Container들의 Filesystem Read/Write 사용량 | 
| Total Network TX/RX | Namespace에 있는 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | Namespace에 있는 Container들의 Network TX/RX 사용량 | 
| Pod Info | Namespace에 있는 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| Resource Quotas | Namespace의 Resource Quotas | 
| Resource Limits | Namespace의 Resource Limits | 
| Events | Namespace의 event 정보 | 
| Pod Events | Namespace에 있는 pod들의 event 정보 | 
- Kubernetes : Namespace Overview 
Namespace들에 대한 요약 정보들(Namespace 개수, 각 Namespace들의 CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| Number of Namespaces | Namespace 개수 | 
| CPU | Namespace에 있는 Container들의 CPU 사용량 총합 | 
| Memory | Namespace에 있는 Container들의 Memory 사용량 총합 | 
| Volume | Namespace에 있는 Volume의 용량 / 사용량 총합 | 
| Filesystem Reads/Writes | Namespace에 있는 Filesystem의 Reads / Writes 총합 | 
| Network RX/TX | Namespace에 있는 Filesystem의 Receive / Transmit 총합 | 
| AGE | 현재로부터 가장 오래 전에 생성된 Namespace의 지금까지의 기간 | 
| CPU Usage | Namespace에 있는 Container들의 CPU 사용량 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Namespace”로 이동 | 
| Memory Usage | Namespace에 있는 Container들의 Memory 사용량 | 
| All CPU Usage | Namespace에 있는 모든 Container들의 CPU 사용량을 Line 형태로 표시 | 
| All Memory WorkingSet | Namespace에 있는 모든 Container들의 Memory 사용량을 Line 형태로 표시 | 
| Volume Usage | Namespace에 있는 Volume의 Limit / 사용량 | 
| Filesystem Read/Write | Namespace에 있는 Container들의 Filesystem Read/Write 사용량 | 
| Volume Usage | Namespace에 있는 Volume의 사용량을 Line 형태로 표시 | 
| Network TX/RX | Namespace에 있는 Container들의 Network TX/RX 사용량 | 
| Pod Count | Namespace에 있는 pod들의 개수 | 
| Container Count | Namespace에 있는 Container들의 개수 | 
- Kubernetes : Node 
Node에 대한 정보들(Status, Age, Version, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| STATUS | Node의 상태 | 
| ROLES | Node의 Role | 
| AGE | Node가 생성된 후 지금까지의 기간 | 
| VERSION | Node의 Kubernetes version | 
| KERNEL-VERSION | Node의 Kernel version | 
| CONTAINER-RUNTIME-VERSION | Node의 Container runtime version | 
| Total CPU | Node에 있는 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | Node에 있는 Container들의 CPU 사용량 | 
| Total Memory | Node에 있는 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | Node에 있는 Container들의 Memory 사용량 | 
| Total Network | Node에 있는 Container들에서 사용된 Network의 합계(MBps) | 
| Total Filesystem Read/Write | Node에 있는 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | Node에 있는 Container들의 Filesystem Read/Write 사용량 | 
| Total Network | Node에 있는 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | Node에 있는 Container들의 Network TX/RX 사용량 | 
| Pod Info | Node에 있는 pod들의 정보 | 
| Capacity | Node의 사용할 수 있는 resource | 
| Allocatable | Node의 할당할 수 있는 resource | 
| Events | Node의 event 정보 | 
| Pod Events | Node에 있는 pod들의 event 정보 | 
- Kubernetes : Node Overview 
Node에 대한 요약 정보들(각 Node들의 CPU/Memory/Network/Filesystem/Pod 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| CPU | Node들에 할당된 CPU의 상태에 따른 양 (Allocatable / Capacity / Usage) | 
| CPU Usage | Node들에 할당된 CPU 사용량(%) | 
| Memory | Node들에 할당된 Memory의 상태에 따른 양 (Allocatable / Capacity / WorkingSet) | 
| Memory Usage | Node들에 할당된 Memory 사용량(%) | 
| Filesystem | Node들에 할당된 Filesystem의 상태에 따른 양 (Limit / Usage) | 
| Filesystem Usage | Node들에 할당된 Filesystem의 사용량(%) | 
| CPU Requests and Limits | Node들에 할당된 CPU의 정보 (Allocatable / Request / Limit) | 
| Memory Requests and Limits | Node들에 할당된 Memory의 정보 (Allocatable / Request / Limit) | 
| CPU Usage | Node들에 할당된 CPU의 정보 (Allocatable / Usage) | 
| Memory Usage | Node들에 할당된 Memory의 정보 (Allocatable / Usage) | 
| CPU Usage | Node들에 할당된 CPU의 사용량 (max, current) | 
| Memory Usage | Node들에 할당된 Memory의 사용량 (max, current) | 
Container Dashboards
- Kubernetes : CronJob 
CronJob에 대한 정보들(Schedule, active, age 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| SCHEDULE | 스케줄 요구된 CronJob의 개수 | 
| SUSPEND | 일시 중지된 CronJob의 개수 | 
| ACTIVE | 활성화되어 있는 CronJob의 개수 | 
| LAST SCHEDULE | 마지막으로 CronJob 스케쥴이 실행 된 시간 | 
| NEXT SCHEDULE | 다음 실행예정인 CronJob 스케쥴 시간 | 
| AGE | 현재로부터 가장 오래 전에 생성된 CronJob의 지금까지의 기간 | 
| Jobs | cronjob들의 정보 | 
- Kubernetes : DaemonSet 
DaemonSet에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| DESIRED | 스케줄이 요구된 DaemonSet의 개수 | 
| CURRENT | 현재 스케줄 된 DaemonSet의 개수 | 
| READY | 현재 동작하고 준비된 DaemonSet의 개수 | 
| UPDATED | 업데이트 된 DaemonSet의 개수 | 
| AVAILABLE | 현재 동작하고 사용중인 DaemonSet의 개수 | 
| AGE | 현재로부터 가장 오래 전에 생성된 DaemonSet의 지금까지의 기간 | 
| Total CPU | Daemonset으로 생성된 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | Daemonset으로 생성된 Container들의 CPU 사용량 | 
| Total Memory | Daemonset으로 생성된 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | Daemonset으로 생성된 Container들의 Memory 사용량 | 
| Replicas Status | Daemonset의 Replica들의 상태 (Ready / Available / Unavailable / Misscheduled / Scheduled) | 
| Total Network | Daemonset으로 생성된 Container들에서 사용된 Network의 합계(MBps) | 
| Total Filesystem Read/Write | Daemonset으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | Daemonset으로 생성된 Container들의 Filesystem Read/Write 사용량 | 
| Total Network TX/RX | Daemonset으로 생성된 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | Daemonset으로 생성된 Container들의 Network TX/RX 사용량 | 
| Pod Info | Daemonset pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
- Kubernetes : Deployment 
Deployment에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| DESIRED | 스케줄 요구된 Deployment Replica의 개수 | 
| UPDATED | 업데이트 된 Deployment Replica의 개수 | 
| AVAILABLE | 현재 동작하고 사용중인 Deployment Replica의 개수 | 
| AGE | 현재로부터 가장 오래 전에 생성된 Deployment의 지금까지의 기간 | 
| Metadata Generation | Metadata로 생성된 Deployment의 개수 | 
| Observed Generation | Observed로 생성된 Deployment의 개수 | 
| Total CPU | Deployment로 생성된 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | Deployment으로 생성된 Container들의 CPU 사용량 | 
| Total Memory | Deployment으로 생성된 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | Deployment으로 생성된 Container들의 Memory 사용량 | 
| Spec | Deployment의 Replica 개수와 Paused된 개수 | 
| Replicas Status | Deployment의 Replica들의 상태 (Ready / Available / Unavailable / Misscheduled / Scheduled) | 
| Total Network | Deployment으로 생성된 Container들에서 사용된 Network의 합계(MBps) | 
| Total Filesystem Read/Write | Deployment으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | Deployment으로 생성된 Container들의 Filesystem Read/Write 사용량 | 
| Total Network TX/RX | Deployment으로 생성된 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | Deployment으로 생성된 Container들의 Network TX/RX 사용량 | 
| Pod Info | Deployment으로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| Status Condition | Deployment으로 생성된 pod들의 상태 | 
| Events | Deployment들의 event 정보 | 
| Pod Events | Deployment pod들의 event 정보 | 
- Kubernetes : Job 
Job에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| PARALLELISM | “Parallelism” 상태인 Job의 개수 | 
| COMPLETIONS | “Completion” 상태인 Job의 개수 | 
| FAILED | Failed된 Job의 개수 | 
| COMPLETE | Complete된 Job의 개수 | 
| DURATION | Job이 시작되고 나서 completion 상태가 될 때까지의 기간 | 
| AGE | 현재로부터 가장 오래 전에 생성된 Job의 지금까지의 기간 | 
| Total CPU | Job으로 생성된 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | Job으로 생성된 Container들의 CPU 사용량 | 
| Total Memory | Job으로 생성된 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | Job으로 생성된 Container들의 Memory 사용량 | 
| Status | Job의 상태 (Active / Failed / Succeeded) | 
| Total Network | Job으로 생성된 Container들에서 사용된 Network 합계(MBps) | 
| Total Filesystem Read/Write | Job으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | Job으로 생성된 Container들의 Filesystem Read/Write 사용량 | 
| Total Network TX/RX | Job으로 생성된 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | Job으로 생성된 Container들의 Network TX/RX 사용량 | 
| Pod Info | Job으로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
- Kubernetes : Pod 
Pod에 대한 요약 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| READY | Pod의 Container상태가 Ready/정상인 개수 | 
| STATUS | Pod의 상태 | 
| RESTARTS | 재시작된 Pod의 총합 | 
| AGE | 현재로부터 가장 오래 전에 생성된 Pod의 지금까지의 기간 | 
| Start time | 현재로부터 가장 오래 전에 생성된 Pod의 생성 일자 및 시간 | 
| Kind | Pod의 종류 | 
| Total CPU | Pod으로 생성된 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | Pod으로 생성된 Container들의 CPU 사용량 | 
| Total Memory | Pod으로 생성된 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | Pod으로 생성된 Container들의 Memory 사용량 | 
| Status | Pod의 상태 (Failed / Pending / Running / Succeeded) | 
| Ready | Ready상태인 Pod의 Container | 
| Restarts | Restarts상태인 Pod의 Container | 
| Last Terminated Reason | Pod이 마지막으로 종료된 이유 | 
| Waiting Reason | Pod이 Waiting상태인 이유 | 
| Terminated Reason | Pod이 종료된 이유 | 
| Total Volume | Pod과 연결된 PVC(Persistent Volume Claim) 용량의 합계 | 
| Volume | Pod과 연결된 PVC(Persistent Volume Claim) 용량 | 
| Total Network TX/RX | Pod으로 생성된 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | Pod으로 생성된 Container들의 Network TX/RX 사용량 | 
| Total Filesystem Read/Write | Pod으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | Pod으로 생성된 Container들의 Filesystem Read/Write 사용량 | 
| Pod Info | Pod들의 정보 | 
| Container Info | Container들의 정보 | 
- Kubernetes : Pod Overview 
Pod에 대한 요약 정보들(Pod의 status, restart count, pod에서 사용된 CPU/Memory/Network/Volume/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| Not running pod | 동작하지 않는 pod의 개수 총합 | 
| Abnormally waiting container during last selected range | 비정상적으로 “waiting” 상태였던 Container의 정보 및 waiting 횟수와 이유 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| Abnormally terminated container during last selected range | 비정상적으로 “terminated” 상태였던 Container의 정보 및 waiting 횟수와 이유 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| Last abnormally terminated container | 마지막이 “terminated” 상태였던 Container의 정보 및 이유 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| CPU Usage | Pod으로 생성된 Container에서 사용된 CPU 사용량 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| Memory Usage | Pod으로 생성된 Container에서 사용된 Memory 사용량 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| Volume Usage | Pod으로 생성된 Container에서 사용된 PVC(Persistent Volume Claim) 사용량 | 
- Kubernetes : ReplicaSet 
ReplicaSet에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| DESIRED | 스케줄 요구된 ReplicaSet의 개수 | 
| UPDATED | 업데이트 된 ReplicaSet의 개수 | 
| AVAILABLE | 현재 동작하고 사용중인 ReplicaSet의 개수 | 
| AGE | 현재로부터 가장 오래 전에 생성된 ReplicaSet의 지금까지의 기간 | 
| Metadata Generation | Metadata로 생성된 ReplicaSet의 개수 | 
| Observed Generation | Observed로 생성된 ReplicaSet의 개수 | 
| Total CPU | ReplicaSet으로 생성된 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | ReplicaSet으로 생성된 Container들의 CPU 사용량 | 
| Total Memory | ReplicaSet으로 생성된 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | ReplicaSet으로 생성된 Container들의 Memory 사용량 | 
| Replicas Status | ReplicaSet의 Replica들의 상태 (Ready / Fully_labedled / Unavailable ) | 
| Total Network | ReplicaSet으로 생성된 Container들에서 사용된 Network 합계(MBps) | 
| Total Filesystem Read/Write | ReplicaSet으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | ReplicaSet으로 생성된 Container들의 Filesystem Read/Write 사용량 | 
| Total Network TX/RX | ReplicaSet으로 생성된 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | ReplicaSet으로 생성된 Container들의 Network TX/RX 사용량 | 
| Pod Info | ReplicaSet으로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
| Events | ReplicaSet들의 event 정보 | 
| Pod Events | ReplicaSet으로 생성된 pod들의 event 정보 | 
- Kubernetes : StatefulSet 
StatefulSets에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| DESIRED | 스케줄 요구된 Statefulset Replica의 개수 | 
| REPLICAS | Statefulset Replica의 개수 | 
| CURRENT | 현재 Statefulset Replica의 개수 | 
| READY | 준비된 Statefulset Replica의 개수 | 
| UPDATED | 업데이트 된 Statefulset Replica의 개수 | 
| AGE | 현재로부터 가장 오래 전에 생성된 statefulset Replica의 지금까지의 기간 | 
| Total CPU | Statefulset Replica로 생성된 Container들에서 사용된 CPU 합계(Core) | 
| CPU Usage | Statefulset Replica로 생성된 Container들의 CPU 사용량 | 
| Total Memory | Statefulset Replica로 생성된 Container들에서 사용된 Memory 합계(MiB) | 
| Memory Usage | Statefulset Replica로 생성된 Container들의 Memory 사용량 | 
| Replicas Status | Statefulset Replica의 Replica들의 상태 (Total / Current / Ready / Updated ) | 
| Total Network | Statefulset Replica로 생성된 Container들에서 사용된 Network의 합계(MBps) | 
| Total Filesystem Read/Write | Statefulset Replica로 생성된 Container들의 Filesystem Read/Write 사용량 총합 | 
| Filesystem Read/Write | Statefulset Replica로 생성된 Container들의 Filesystem Read/Write 사용량 | 
| Total Network TX/RX | Statefulset Replica로 생성된 Container들의 Network TX/RX 사용량 총합 | 
| Network TX/RX | Statefulset Replica로 생성된 Container들의 Network TX/RX 사용량 | 
| Pod Info | Statefulset Replica로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 | 
- Kubernetes : Workloads 
Workloads에 대한 정보들(Deployments, ReplicaSets, StatefulSets, DaemonSets, Jobs, CronJobs)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| Deployment | Available / Unavailabe 상태의 Deployment들의 개수 | 
| ReplicaSets | Ready / NotReady 상태의 ReplicaSet들의 개수 | 
| StatefulSets | Ready / NotReady 상태의 Statefulset들의 개수 | 
| DaemonSets | Available / Unavailabe 상태의 DaemonSet들의 개수 | 
| Jobs | Succeded / Active / Failed 상태의 Job들의 개수 | 
| CronJobs | Suspend가 True / False 상태인 CronJob들의 개수 | 
| Deployments | Deployment들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Deployment”으로 이동 | 
| ReplicaSets | ReplicaSet들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: ReplicaSet”으로 이동 | 
| StatefulSets | Statefulset들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: StatefulSet”으로 이동 | 
| DaemonSets | DaemonSet들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: DaemonSet”으로 이동 | 
| CronJobs | CronJob들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: CronJob”으로 이동 | 
| Jobs | Job들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Job”으로 이동 | 
System Dashboards
- System : Node 
Node에 대한 정보들(System Uptime, Disk I/O, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| System Uptime | 선택한 Node의 선택한 Interval 시간 동안 system에서 uptime된 시간 | 
| Virtual CPU | 선택한 Node의 현재 Virtual CPU 할당량 | 
| RAM | 선택한 Node의 현재 Memory 할당량 | 
| Memory Available | 선택한 Node의 현재 Memory 사용비율(%) | 
| Load Average | 선택한 Node의 선택한 Interval 시간의 평균 Load (min, max, avg 따로 표시) | 
| Memory | 선택한 Node의 선택한 Interval 시간의 종류별(Total / Used / Available) Memory 사용량(GiB) (min, max, avg 따로 표시) | 
| CPU Usage | 선택한 Node의 선택한 Interval 시간의 idle / user / system / steal / iowait / softirq / nice CPU 사용비율(%) (min, max, avg 따로 표시) | 
| Memory Distribution | 선택한 Node의 선택한 Interval 시간의 종류별(Cached / Used / Free / Buffers) Memory Distribution 사용량(GiB) (min, max, avg 따로 표시) | 
| Network Traffic(KBps) | 선택한 Node의 선택한 Interval 시간의 종류별(각 항목별 Inbound / Outbound) Network Traffic 사용량(kBps) (min, max, avg 따로 표시) | 
| Network Utilization Hourly | 선택한 Node의 선택한 Interval 시간의 종류별(Sent / Received) Network Utilization 사용량(MiB) (min, max, avg 따로 표시) | 
| Filesystem Usage | 선택한 Node의 Filesystem 사용량(GiB) (min, max, avg 따로 표시) | 
| Disk I/O | 선택한 Node의 read / io time(ms) (min, max, avg 따로 표시) | 
| Mountpoint | 선택한 Node의 다양한 mount point에서 사용 가능한 Filesystem의 disk 사용량(GiB) (min, max, avg 따로 표시) | 
- System : Overview 
각각의 Node에 대한 요약 정보들(Load Average, Swap, CPU/Memory/Network Usage 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| All CPU | 선택한 Node들의 CPU 총합 / 사용량 | 
| All CPU Usage | 선택한 Node들의 CPU 총 사용량 (%) | 
| All Memory | 선택한 Node들의 Memory 총합 / 사용량 / 사용되지 않은 양 | 
| All Memory Usage | 선택한 Node들의 Memory 총 사용량 (%) | 
| All Filesystem | 선택한 Node들의 Filesystem 총합 / 사용량 / 사용되지 않은 양 | 
| All Filesystem Usage | 선택한 Node들의 Filesystem 총 사용량 (%) | 
| All CPU Usage | 선택한 Node 각각의 CPU 사용량 (Bar gauge 형태) | 
| All CPU Usage | 선택한 Node 각각의 CPU 사용량 (Line 형태) | 
| All Memory Used | 선택한 Node 각각의 Memory 사용량 (Bar gauge 형태) | 
| All Memory Used | 선택한 Node 각각의 Memory 사용량 (Line 형태) | 
| All Filesystem Usage | 선택한 Node 각각의 Filesystem 사용량 (Bar gauge 형태) | 
| All Filesystem Usage | 선택한 Node 각각의 Filesystem 사용량 (Line 형태) | 
| Disk Usage(Local) | 선택한 Node 각각의 Local Disk 사용량 | 
| Network Usage(TX/RX) | 선택한 Node 각각의 Network TX/RX 사용량 | 
General
- Kubernetes : Overview 
Control/Data Plane Cluster들의 전체 Kubernetes에 대한 요약 정보들(Provider, Node, Namespace들의 개수, Alert, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
| Panel | Description | 
|---|---|
| Provider | Node 정보에서 가져 온 provide 개수 (AWS, Azure, IBM) | 
| Number of | Node와 Namespace 개수 | 
| Running | “Running” 상태인 pod / container 개수 | 
| Alerts Firing(P1) | Priority가 P1인 Alert의 개수 | 
| Alerts Firing(P2~P5) | Priority가 P2 / P3 / P4 / P5인 Alert의 개수 (Pie 형태) | 
| Warning Events | Event type이 “Warning”인 Event의 개수 | 
| Node Ready | Node의 상태가 “Ready”인 Node의 개수 (Polygon 형태) 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동 | 
| Node MemoryPressure | Node의 상태가 “MemoryPressure”인 Node의 개수 (Polygon 형태) 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동 | 
| Running pod count per node | Node의 “Running” 상태인 pod의 개수 총합의 상위 5개 | 
| Alerts Firing | Alert 개수 (Bar 형태) | 
| Warning Events | “Warning” 상태의 Event 정보 | 
| Node DiskPressure | Node의 상태가 “DiskPressure”인 Node의 개수 (Polygon 형태) 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동 | 
| Node PIDPressure | Node의 상태가 “PIDPressure”인 Node의 개수 (Polygon 형태) 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동 | 
| Node Unschedulable | “Unschedulable”인 Node의 개수 (Polygon 형태) 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동 | 
| pod status phase | Node 안에 있는 Pod의 상태가 “Running / Succeeded“인 개수 총합의 상위 5개 | 
| Alerts Firing | Alert 개수 (Table 형태) | 
| Node CPU usage | Node의 CPU 사용량 (Polygon 형태) 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동 | 
| Node CPU usage | Node의 CPU 사용량 (Line 형태) | 
| Node memory usage | Node의 Memory 사용량 (Polygon 형태) 정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동 | 
| Node Memory usage | Node의 Memory 사용량 (Line 형태) | 
| Most CPU usage namespace | CPU를 많이 사용하는 Namespace 상위 10개 | 
| Most CPU-intensive pods | CPU를 많이 사용하는 Pod 상위 10개 | 
| Most Memory usage namespace | Memory를 많이 사용하는 Namespace 상위 10개 | 
| Most Memory-intensive pods | Memory를 많이 사용하는 Pod 상위 10개 | 
| Container CPU usage (Top 10) | CPU를 많이 사용하는 Container 상위 10개 | 
| Container memory usage (Top 10) | Memory를 많이 사용하는 Container 상위 10개 | 
| Node local disk usage | Node의 Local Disk를 많이 사용하는 Node 상위 10개 | 
| Top filesystem reads | Filesystem read가 가장 많은 Node 상위 10개 | 
| Top network receive | Network receive가 가장 많은 Node 상위 10개 | 
| Top network transmit | Network transmit가 가장 많은 Node 상위 10개 | 
| Persistent volume usage | Persistent volume 사용량이 가장 많은 Node 상위 10개 | 
| Top filesystem writes | Filesystem write가 가장 많은 Node 상위 10개 | 
| network receive errors | 각 Node의 Network receive error 총합 | 
| network transmit errors | 각 Node의 Network transmit error 총합 |