Metriky

TeskaLabs LogMan.io nabízí paletu metrik ze všech svých mikroslužeb včetně LogMan.io Parser, LogMan.io Dispatcher, LogMan.io Correlator atd.

Metriky jsou uloženy v InfluxDB a aktualizovány každou spuštěnou mikroslužbou přibližně jednou za minutu. Metriky jsou vizualizovány v aplikaci Grafana pomocí poskytnutých/vypůjčených nebo vlastních ovládacích panelů.

V následujících částech jsou uvedeny dostupné metriky (nebo měření z pohledu InfluxDB) spolu s jejich hodnotami a značkami:

Metriky paměti

Každá mikroslužba obsahuje měřidlo s názvem os.stat, které shromažďuje informace o využití paměti. Vypočítávají se následující hodnoty:

VmPeak: Maximální velikost virtuální paměti
VmLck: Velikost zamčené paměti
VmPin: Pinned memory size
VmHWM: Maximální velikost rezidentní sady ("high water mark")
VmRSS: Velikost rezidentní sady
VmData, VmStk, VmExe: Velikost datových, zásobníkových a textových segmentů
VmLib: Velikost kódu sdílené knihovny
VmPTE: Velikost záznamů v tabulce stránek
VmPMD: Velikost tabulek stránek druhé úrovně
VmSwap: Velikost vyměněné virtuální paměti anonymními privátními stránkami; využití swapu shmem není zahrnuto

Obecné metriky pipeline

Následující metriky jsou vytvářeny každou pipeline, takže jsou specifické pro každou mikroslužbu, která čte, transformuje a výstupuje data jako LogMan.io Ingestor, LogMan.io Parser, LogMan.io Dispatcher, LogMan.io Correlator atd.

Tagy jsou pipeline (ID pipeline) a host (název hostitele mikroslužby).

`bspump.pipeline`

Metrika čítače s následujícími hodnotami:

event.in: počet událostí vstupujících do pipeline v zadaném časovém intervalu (jednou za minutu).
event.drop: počet událostí, které byly během zpracování v potrubí vyřazeny, v zadaném časovém intervalu (jednou za minutu).
event.out: počet událostí, které úspěšně opustily potrubí v zadaném časovém intervalu (jednou za minutu).
warning: počet varování vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)
warning: počet chyb vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)

`bspump.pipeline.eps`

Metrika čítače s následujícími hodnotami:

eps.in: události za sekundu vstupující do pipeline
eps.drop: události za sekundu, které v potrubí odpadly
eps.out: události za sekundu úspěšně opouštějící potrubí
warning: počet varování vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)
warning: počet chyb vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)

`bspump.pipeline.gauge`

Metrika měřidla (hodnota se vypočítá jednou) s následujícími hodnotami:

warning.ratio: poměr varování na úspěšně provedené události.
error.ratio: poměr chyb na úspěšné události

`bspump.pipeline.dutycycle`

Metrika dutycycle, která počítá procento zpožděného zpracování (způsobeného obvykle následující službou, jako je ElasticSearch) na nezpožděné zpracování.

ready: hodnota true/false, která udává, zda nebyla pipeline zpožděna.

`timedrift`

Volitelná metrika pipeline, která je povolena v každé mikroslužbě LogMan.io.

Vypočítává rozdíl mezi aktuálním časem a časem vzniku dané události, který je obvykle označen atributem @timestamp. Následující hodnoty se počítají pro zadaný časový interval (jednou za minutu):

avg
median
stddev
min
max

Metriky nájemce

Tenant metriky jsou specifické pro mikroslužby LogMan.io Parser, LogMan.io Dispatcher, LogMan.io Correlator a LogMan.io Watcher.

Tagy jsou pipeline (ID pipeline), host (název hostitele mikroslužby) a tenant (název tenanta psaný malými písmeny).

`bspump.pipeline.tenant.eps`

Metrika čítače s následujícími hodnotami:

eps.in: události nájemce za sekundu, které vstupují do potrubí.
eps.aggr: agregované události nájemce (počet je vynásoben atributem cnt v událostech) za sekundu vstupující do potrubí
eps.drop: události nájemce za sekundu, které byly vypuštěny v potrubí
eps.out: události nájemce za sekundu, které úspěšně opustily potrubí
warning: počet varování nájemce vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu)
warning: počet chyb nájemce vytvořených v potrubí v zadaném časovém intervalu (jednou za minutu).

V LogMan.io Parseru pocházejí nejdůležitější metriky z ParsersPipeline (když data poprvé vstoupí do Parseru a jsou analyzována prostřednictvím preprocesorů a parserů) a EnrichersPipeline, zatímco v LogMan.io Dispatcheru z EventsPipeline a OthersPipeline.

`bspump.pipeline.tenant.load`

Metrika čítače s následujícími hodnotami:

load.in: velikost bajtů nájemce všech událostí vstupujících do pipeline v zadaném časovém intervalu (jednou za miutu).
load.out: velikost bajtů všech událostí nájemce opouštějících potrubí v zadaném časovém intervalu (jednou za minutu).

Metriky korelátoru

Následující metriky jsou specifické pro korelátor LogMan.io.

Jejich značky jsou correlator (název korelátoru) a host (název hostitele mikroslužby).

`correlator.predicate`

Metrika čítače, která počítá, kolik událostí prošlo predikátem.

in: počet událostí vstupujících do predikátu v časovém intervalu (jednou za minutu).
hit: počet událostí úspěšně vyhovujících predikátu v časovém intervalu (jednou za minutu).
miss: počet událostí, které v časovém intervalu neprošly predikátem (jednou za minutu) a opustily tak korelátor.
error: počet chyb v predikátu v časovém intervalu (jednou za minutu)

`correlator.trigger`

Metrika čítače, která počítá, kolik událostí prošlo spouštěcí sekcí korelátoru.

in: počet událostí vstupujících do spouštěče v časovém intervalu (jednou za minutu).
out: počet událostí opouštějících spouštěč v časovém intervalu (jednou za minutu).
error: počet chyb ve spouštěči v časovém intervalu (jednou za minutu), měl by se rovnat in - out.