Přeskočit obsah

Metriky

TeskaLabs LogMan.io nabízí paletu metrik ze všech svých mikroslužeb včetně LogMan.io Parser, LogMan.io Dispatcher, LogMan.io Correlator atd.

Metriky jsou uloženy v InfluxDB a aktualizovány každou spuštěnou mikroslužbou přibližně jednou za minutu. Metriky jsou vizualizovány v aplikaci Grafana pomocí poskytnutých/vypůjčených nebo vlastních ovládacích panelů.

V následujících částech jsou uvedeny dostupné metriky (nebo měření z pohledu InfluxDB) spolu s jejich hodnotami a značkami:

Metriky paměti

Každá mikroslužba obsahuje měřidlo s názvem os.stat, které shromažďuje informace o využití paměti. Vypočítávají se následující hodnoty:

  • VmPeak: Maximální velikost virtuální paměti
  • VmLck: Velikost zamčené paměti
  • VmPin: Pinned memory size
  • VmHWM: Maximální velikost rezidentní sady ("high water mark")
  • VmRSS: Velikost rezidentní sady
  • VmData, VmStk, VmExe: Velikost datových, zásobníkových a textových segmentů
  • VmLib: Velikost kódu sdílené knihovny
  • VmPTE: Velikost záznamů v tabulce stránek
  • VmPMD: Velikost tabulek stránek druhé úrovně
  • VmSwap: Velikost vyměněné virtuální paměti anonymními privátními stránkami; využití swapu shmem není zahrnuto

Obecné metriky pipeline

Následující metriky jsou vytvářeny každou pipeline, takže jsou specifické pro každou mikroslužbu, která čte, transformuje a výstupuje data jako LogMan.io Ingestor, LogMan.io Parser, LogMan.io Dispatcher, LogMan.io Correlator atd.

Tagy jsou pipeline (ID pipeline) a host (název hostitele mikroslužby).

bspump.pipeline

Metrika čítače s následujícími hodnotami:

  • event.in: počet událostí vstupujících do pipeline v zadaném časovém intervalu (jednou za minutu).
  • event.drop: počet událostí, které byly během zpracování v potrubí vyřazeny, v zadaném časovém intervalu (jednou za minutu).
  • event.out: počet událostí, které úspěšně opustily potrubí v zadaném časovém intervalu (jednou za minutu).
  • warning: počet varování vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)
  • warning: počet chyb vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)

bspump.pipeline.eps

Metrika čítače s následujícími hodnotami:

  • eps.in: události za sekundu vstupující do pipeline
  • eps.drop: události za sekundu, které v potrubí odpadly
  • eps.out: události za sekundu úspěšně opouštějící potrubí
  • warning: počet varování vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)
  • warning: počet chyb vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)

bspump.pipeline.gauge

Metrika měřidla (hodnota se vypočítá jednou) s následujícími hodnotami:

  • warning.ratio: poměr varování na úspěšně provedené události.
  • error.ratio: poměr chyb na úspěšné události

bspump.pipeline.dutycycle

Metrika dutycycle, která počítá procento zpožděného zpracování (způsobeného obvykle následující službou, jako je ElasticSearch) na nezpožděné zpracování.

  • ready: hodnota true/false, která udává, zda nebyla pipeline zpožděna.

timedrift

Volitelná metrika pipeline, která je povolena v každé mikroslužbě LogMan.io.

Vypočítává rozdíl mezi aktuálním časem a časem vzniku dané události, který je obvykle označen atributem @timestamp. Následující hodnoty se počítají pro zadaný časový interval (jednou za minutu):

  • avg
  • median
  • stddev
  • min
  • max

Metriky nájemce

Tenant metriky jsou specifické pro mikroslužby LogMan.io Parser, LogMan.io Dispatcher, LogMan.io Correlator a LogMan.io Watcher.

Tagy jsou pipeline (ID pipeline), host (název hostitele mikroslužby) a tenant (název tenanta psaný malými písmeny).

bspump.pipeline.tenant.eps

Metrika čítače s následujícími hodnotami:

  • eps.in: události nájemce za sekundu, které vstupují do potrubí.
  • eps.aggr: agregované události nájemce (počet je vynásoben atributem cnt v událostech) za sekundu vstupující do potrubí
  • eps.drop: události nájemce za sekundu, které byly vypuštěny v potrubí
  • eps.out: události nájemce za sekundu, které úspěšně opustily potrubí
  • warning: počet varování nájemce vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)
  • warning: počet chyb nájemce vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu).

V LogMan.io Parseru pocházejí nejdůležitější metriky z ParsersPipeline (když data poprvé vstoupí do Parseru a jsou analyzována prostřednictvím preprocesorů a parserů) a EnrichersPipeline, zatímco v LogMan.io Dispatcheru z EventsPipeline a OthersPipeline.

bspump.pipeline.tenant.load

Metrika čítače s následujícími hodnotami:

  • load.in: velikost bajtů nájemce všech událostí vstupujících do pipeline v zadaném časovém intervalu (jednou za miutu).
  • load.out: velikost bajtů všech událostí nájemce opouštějících potrubí v zadaném časovém intervalu (jednou za minutu).

Metriky korelátoru

Následující metriky jsou specifické pro korelátor LogMan.io.

Jejich značky jsou correlator (název korelátoru) a host (název hostitele mikroslužby).

correlator.predicate

Metrika čítače, která počítá, kolik událostí prošlo predikátem.

  • in: počet událostí vstupujících do predikátu v časovém intervalu (jednou za minutu).
  • hit: počet událostí úspěšně vyhovujících predikátu v časovém intervalu (jednou za minutu).
  • miss: počet událostí, které v časovém intervalu neprošly predikátem (jednou za minutu) a opustily tak korelátor.
  • error: počet chyb v predikátu v časovém intervalu (jednou za minutu)

correlator.trigger

Metrika čítače, která počítá, kolik událostí prošlo spouštěcí sekcí korelátoru.

  • in: počet událostí vstupujících do spouštěče v časovém intervalu (jednou za minutu).
  • out: počet událostí opouštějících spouštěč v časovém intervalu (jednou za minutu).
  • error: počet chyb ve spouštěči v časovém intervalu (jednou za minutu), měl by se rovnat in - out.