Fix rank handling in multi-node PP setup (#129)

qyh111 · web-flow · commit 1eca8fbad467 · 2025-08-30T16:31:41.000+08:00
diff --git a/unifiedcache/integration/vllm/uc_connector.py b/unifiedcache/integration/vllm/uc_connector.py
@@ -35,6 +35,7 @@
     KVConnectorMetadata,
     KVConnectorRole,
 )
+from vllm.distributed.parallel_state import get_world_group
 from vllm.v1.core.kv_cache_utils import hash_request_tokens
 from vllm.v1.core.sched.output import SchedulerOutput
 
@@ -121,7 +122,9 @@ def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
         self.use_layerwise = True
         self.kv_caches: dict[str, torch.Tensor] = {}
         self.total_tp_size = vllm_config.parallel_config.tensor_parallel_size
-        self.rank = vllm_config.parallel_config.rank
+        self.rank = (
+            -1 if role == KVConnectorRole.SCHEDULER else get_world_group().local_rank
+        )
         self.load_paras: dict[str, LoadPara] = {}
         self.save_paras: dict[str, SavePara] = {}
         # dump tasks record request -> block -> list[task]