Dynamic Threshold

Dynamic Thresholdとは、VMware社のシステム監視製品であるvRealize Operations Managerが備える機能である。

システム監視の一つに「性能監視」があるが、これは予め決められた「しきい値」を基準に、OSが使用しているリソースを監視するものである。 例えば、CPUの使用率が80%を5分間超えたらアラートを生成する。ディスク使用率が80%を超えたらアラートを生成する。などがそれにあたる。

vROpsの「Dynamic Threshold」では、この監視のしきい値を機械学習で自動的に調整する。 過去6ヶ月間の性能情報を基に、「毎週金曜日の17:00~18:00にCPUを多く使用する」「月末の夜間にメモリを多く使用する」などを学習する。 OSから収集した性能情報がDynamic Thresholdの範囲から外れると「Anomalies」値が上昇し、管理者はシステムが異常な状態であることを検知できる。

近年、SMP構成のシステムが主流となっているため、従来の固定値を用いた性能監視では「単一プロセスの暴走に伴うCPU過負荷」を検知できない問題※が存在するが、Dynamic Thresholdではこれを検知できる。

※ 「CPU使用率80%以上でアラーム」などのルールでは、デュアルコア環境における単一プロセスの暴走(CPU全体の50%を過剰消費する)、クアッドコア環境における単一プロセス暴走(CPU全体の25%を過剰消費する)などの状態を検知できない。性能監視と併せてプロセス監視を実装する場合もあるが、システムにとって重要ではないプロセスは監視対象外とする場合が多いため、プロセス監視でもシステムの異常を検知できないケースが存在する。

ref