agentic-kvc/v2/exp_a_tier_latency/results/pcie.json

{
  "device": "NVIDIA H20",
  "by_length": {
    "1024": {
      "kv_bytes": 100663296,
      "transfer_s": 0.001876260997960344,
      "bw_GBps": 53.65100916633112
    },
    "2048": {
      "kv_bytes": 201326592,
      "transfer_s": 0.003709116979734972,
      "bw_GBps": 54.27884671741612
    },
    "4096": {
      "kv_bytes": 402653184,
      "transfer_s": 0.007338636991335079,
      "bw_GBps": 54.86757070494469
    },
    "8192": {
      "kv_bytes": 805306368,
      "transfer_s": 0.01476299500791356,
      "bw_GBps": 54.548983290201164
    },
    "16384": {
      "kv_bytes": 1610612736,
      "transfer_s": 0.02972855800180696,
      "bw_GBps": 54.17729093695375
    },
    "32768": {
      "kv_bytes": 3221225472,
      "transfer_s": 0.059267577016726136,
      "bw_GBps": 54.35055107940257
    },
    "65536": {
      "kv_bytes": 6442450944,
      "transfer_s": 0.11847134301206097,
      "bw_GBps": 54.37982536708583
    }
  }
}