レイテンシ

英語表記で latency

データの転送要求などのリクエストを発してから、リクエストの結果が返ってくるまでに かかる遅延時間のことです。

レイテンシを理解することが、お客様環境で発生しているパフォーマンス問題を 解決する近道となります。

I/Oタイプ レイテンシ補足
L1キャッシュ参照0.5ns
分岐予測失敗 (Branch Mispredict)5ns
L2キャッシュ参照7ns14x L1 cache
相互排他 (Mutex) ロック/アンロック25ns
メインメモリ参照100nsL2キャッシュx 20、L1キャッシュx 200
Zippyを使った1KBの圧縮3,000ns
1Gbsネットワークで1KBを転送10,000ns0.01 ms
SSDから4Kをランダム Read150,000ns0.15 ms
メモリから1MBシーケンシャルRead250,000ns0.25 ms
データセンター内のラウンドトリップ500,000ns0.5 ms
SSDから1MBシーケンシャルRead1,000,000ns1 ms, 4x memory
ディスクシーク(HDD)10,000,000ns10ms、データセンターラウンドトリップx20
ディスクから1MBシーケンシャルRead20,000,000ns20 ms、メモリ x 80、SSD x 20
CAカリフォルニア州からパケット転送 -> オランダ -> カリフォルニア州150,000,000ns150 ms

(典拠: Jeff Dean, https://gist.github.com/jboner/2841832 )