Přeskočit obsah

Metriky výkonu systému

cpu

Metriky pro sledování CPU systému. Viz dokumentace InfluxDB Telegraf pluginu pro více informací.

Tagy: ActivityState, cpu, node_id

  • time_active: Celkový čas, kdy byl CPU aktivní, vykonával úlohy kromě nečinnosti.
  • time_guest: Čas strávený během virtuálního CPU pro hostované operační systémy.
  • time_guest_nice: Čas, který CPU strávil běžícím niced guestem (guest s pozitivní hodnotou nices).
  • time_idle: Celkový čas, kdy CPU nebyl používán (nečinný).
  • time_iowait: Čas, kdy byl CPU nečinný a čekal na dokončení I/O operací.
  • time_irq: Čas strávený řešením hardwarových přerušení.
  • time_nice: Čas, který CPU strávil zpracováním uživatelských procesů s pozitivní hodnotou nices.
  • time_softirq: Čas strávený řešením softwarových přerušení.
  • time_steal: Čas, který virtuální CPU čekal na skutečný CPU, zatímco hypervisor servisoval jiný virtuální procesor.
  • time_system: Čas, který CPU strávil běžícím systémovými (jádrovými) procesy.
  • time_user: Čas strávený vykonáváním uživatelských procesů.
  • usage_active: Procento času, kdy byl CPU aktivní, vykonával úlohy.
  • usage_guest: Procento času CPU stráveného během virtuálních CPU pro hostované operační systémy.
  • usage_guest_nice: Procento času CPU stráveného během niced guestů.
  • usage_idle: Procento času, kdy byl CPU nečinný.
  • usage_iowait: Procento času, kdy byl CPU nečinný z důvodu čekání na I/O operace.
  • usage_irq: Procento času stráveného řešením hardwarových přerušení.
  • usage_nice: Procento času CPU stráveného procesy s pozitivní hodnotou nices.
  • usage_softirq: Procento času stráveného řešením softwarových přerušení.
  • usage_steal: Procento času, kdy virtuální CPU čekal na skutečný CPU, zatímco hypervisor servisoval jiný procesor.
  • usage_system: Procento času CPU stráveného na systémových (jádrových) procesech.
  • usage_user: Procento času CPU stráveného vykonáváním uživatelských procesů.

mdstat

Statistiky o Linux MD RAID polích nakonfigurovaných na hostiteli. RAID (redundant array of inexpensive or independent disks) kombinuje více fyzických disků do jedné jednotky za účelem datové redundance (a tím bezpečnosti nebo ochrany před ztrátou v případě selhání disku) a výkonu systému (rychlejší přístup k datům). Navštivte dokumentaci InfluxDB Telegraf pluginu pro více informací.

Tagy: ActivityState (aktivní nebo neaktivní), Devices, Name, _field, node_id

  • BlocksSynced: Počet bloků, které byly prohledány, pokud se pole obnovuje/kontroluje.
  • BlocksSyncedFinishTime: Minuty zbývající do očekávaného dokončení obnovy skenování.
  • BlocksSyncedPct: Procento zbývající obnovy skenování.
  • BlocksSyncedSpeed: Aktuální rychlost, jakou probíhá obnovování, uvedená v K/sec.
  • BlocksTotal: Celkový počet bloků v poli.
  • DisksActive: Počet disků v poli, které jsou považovány za zdravé.
  • DisksDown: Počet disků v poli, které jsou aktuálně nefunkční, nebo neoperativní.
  • DisksFailed: Počet aktuálně selhaných disků v poli.
  • DisksSpare: Počet náhradních disků v poli.
  • DisksTotal: Celkový počet disků v poli.

processes

Všechny procesy, seskupené podle stavu. Najděte dokumentaci InfluxDB Telegraf pluginu zde.

Tagy: node_id

  • blocked: Počet procesů ve zablokovaném stavu, čekající na zdroj nebo událost, která by se stala dostupnou.
  • dead: Počet procesů, které dokončily exekuci, ale stále mají záznam v tabulce procesů.
  • idle: Počet procesů ve stavu nečinnosti, obvykle znamenající, že aktivně nepracují.
  • paging: Počet procesů, které čekají na stránkování, buď na swapování dovnitř nebo ven z disku.
  • running: Počet procesů, které aktuálně pracují nebo jsou připraveny k vykonávání.
  • sleeping: Počet procesů, které jsou ve spánkovém stavu, nečinné do chvíle, dokud nejsou splněny určité podmínky nebo nenastanou události.
  • stopped: Počet procesů, které jsou zastaveny, obvykle kvůli přijmu signálu nebo debugování.
  • total: Celkový počet procesů aktuálně existujících v systému.
  • total_threads: Celkový počet vláken napříč všemi procesy, protože procesy mohou mít více vláken.
  • unknown: Počet procesů v neznámém stavu, kde jejich stav nelze určit.
  • zombies: Počet zombie procesů, které dokončily vykonání, ale stále mají záznam v tabulce procesů, protože nadřazený proces nečetl jejich exit status.

system

Tyto metriky poskytují obecné informace o systémovém zatížení, době provozu a počtu přihlášených uživatelů. Navštivte InfluxDB Telegraf plugin pro detaily.

Tagy: node_id

  • load1: Průměrné systémové zatížení za poslední jednu minutu, indikující počet procesů v čekacím řetězci systému.
  • load15: Průměrné systémové zatížení za posledních 15 minut, čímž poskytuje dlouhodobější pohled na nedávné systémové zatížení.
  • load5: Průměrné systémové zatížení za posledních 5 minut, což nabízí krátkodobější perspektivu nedávného systémového zatížení.
  • n_cpus: Počet dostupných jader CPU v systému.
  • uptime: Celkový čas v sekundách, po který systém běžel od posledního spuštění nebo restartu.

temp

Odečty teplot zaznamenané senzory systému. Navštivte dokumentaci InfluxDB Telegraf pluginu pro detaily.

Tagy: node_id, sensor

  • temp: Teplota