xorbitsai
diff --git a/‎xinference/api/restful_api.py‎
Lines changed: 19 additions & 3 deletions b/‎xinference/api/restful_api.py‎
Lines changed: 19 additions & 3 deletions
diff --git a/‎xinference/core/supervisor.py‎
Lines changed: 248 additions & 98 deletions b/‎xinference/core/supervisor.py‎
Lines changed: 248 additions & 98 deletions
diff --git a/‎xinference/model/audio/__init__.py‎
Lines changed: 42 additions & 0 deletions b/‎xinference/model/audio/__init__.py‎
Lines changed: 42 additions & 0 deletions
diff --git a/‎xinference/model/audio/builtin.py‎
Lines changed: 110 additions & 0 deletions b/‎xinference/model/audio/builtin.py‎
Lines changed: 110 additions & 0 deletions
diff --git a/‎xinference/model/cache_manager.py‎
Lines changed: 17 additions & 2 deletions b/‎xinference/model/cache_manager.py‎
Lines changed: 17 additions & 2 deletions
diff --git a/‎xinference/model/custom.py‎
Lines changed: 3 additions & 0 deletions b/‎xinference/model/custom.py‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎xinference/model/embedding/__init__.py‎
Lines changed: 25 additions & 0 deletions b/‎xinference/model/embedding/__init__.py‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎xinference/model/embedding/builtin.py‎
Lines changed: 110 additions & 0 deletions b/‎xinference/model/embedding/builtin.py‎
Lines changed: 110 additions & 0 deletions
@@ -3162,9 +3162,25 @@ async def add_model(self, request: Request) -> JSONResponse:
             raw_json = await request.json()
             logger.info(f"[DEBUG] Raw request JSON: {raw_json}")
 
-            body = AddModelRequest.parse_obj(raw_json)
-            model_type = body.model_type
-            model_json = body.model_json
+            if "model_type" in raw_json and "model_json" in raw_json:
+                body = AddModelRequest.parse_obj(raw_json)
+                model_type = body.model_type
+                model_json = body.model_json
+                logger.info(f"[DEBUG] Using wrapped format, model_type: {model_type}")
+            else:
+                model_json = raw_json
+
+                # Priority 1: Check if model_type is explicitly provided in the JSON
+                if "model_type" in model_json:
+                    model_type = model_json["model_type"]
+                    logger.info(f"[DEBUG] Using explicit model_type from JSON: {model_type}")
+                else:
+                    # model_type is required in the JSON when using unwrapped format
+                    logger.error(f"[DEBUG] model_type not provided in JSON, this is required")
+                    raise HTTPException(
+                        status_code=400,
+                        detail="model_type is required in the model JSON. Supported types: LLM, embedding, audio, image, video, rerank"
+                    )
 
             logger.info(f"[DEBUG] Parsed model_type: {model_type}")
             logger.info(
 
@@ -60,6 +60,48 @@ def register_custom_model():
                 warnings.warn(f"{user_defined_audio_dir}/{f} has error, {e}")
 
 
+def register_builtin_model():
+    from ..custom import RegistryManager
+
+    registry = RegistryManager.get_registry("audio")
+    existing_model_names = {spec.model_name for spec in registry.get_custom_models()}
+
+    builtin_audio_dir = os.path.join(XINFERENCE_MODEL_DIR, "v2", "builtin", "audio")
+    if os.path.isdir(builtin_audio_dir):
+        for f in os.listdir(builtin_audio_dir):
+            if f.endswith(".json"):
+                try:
+                    with codecs.open(
+                        os.path.join(builtin_audio_dir, f), encoding="utf-8"
+                    ) as fd:
+                        model_data = json.load(fd)
+
+                        # Apply conversion logic to handle null model_id and other issues
+                        if model_data.get("model_id") is None and "model_src" in model_data:
+                            model_src = model_data["model_src"]
+                            # Extract model_id from available sources
+                            if "huggingface" in model_src and "model_id" in model_src["huggingface"]:
+                                model_data["model_id"] = model_src["huggingface"]["model_id"]
+                            elif "modelscope" in model_src and "model_id" in model_src["modelscope"]:
+                                model_data["model_id"] = model_src["modelscope"]["model_id"]
+
+                            # Extract model_revision if available
+                            if model_data.get("model_revision") is None:
+                                if "huggingface" in model_src and "model_revision" in model_src["huggingface"]:
+                                    model_data["model_revision"] = model_src["huggingface"]["model_revision"]
+                                elif "modelscope" in model_src and "model_revision" in model_src["modelscope"]:
+                                    model_data["model_revision"] = model_src["modelscope"]["model_revision"]
+
+                        builtin_audio_family = AudioModelFamilyV2.parse_obj(model_data)
+
+                        # Only register if model doesn't already exist
+                        if builtin_audio_family.model_name not in existing_model_names:
+                            register_audio(builtin_audio_family, persist=False)
+                            existing_model_names.add(builtin_audio_family.model_name)
+                except Exception as e:
+                    warnings.warn(f"{builtin_audio_dir}/{f} has error, {e}")
+
+
 def _need_filter(spec: dict):
     if (sys.platform != "darwin" or platform.processor() != "arm") and spec.get(
         "engine", ""
 
@@ -0,0 +1,110 @@
+# Copyright 2022-2025 XProbe Inc.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import json
+import logging
+import os
+from typing import List
+
+logger = logging.getLogger(__name__)
+
+
+class BuiltinAudioModelRegistry:
+    """
+    Registry for built-in audio models downloaded from official model hub.
+
+    These models are treated as built-in models and don't require model_family validation.
+    They are stored in ~/.xinference/model/v2/builtin/audio/ directory.
+    """
+
+    def __init__(self):
+        from ...constants import XINFERENCE_MODEL_DIR
+
+        self.builtin_dir = os.path.join(XINFERENCE_MODEL_DIR, "v2", "builtin", "audio")
+        os.makedirs(self.builtin_dir, exist_ok=True)
+
+    def get_builtin_models(self) -> List:
+        """Load all built-in audio models from the builtin directory."""
+        from .custom import AudioModelFamilyV2
+
+        models = []
+
+        if not os.path.exists(self.builtin_dir):
+            return models
+
+        for filename in os.listdir(self.builtin_dir):
+            if filename.endswith(".json"):
+                file_path = os.path.join(self.builtin_dir, filename)
+                try:
+                    with open(file_path, "r", encoding="utf-8") as f:
+                        model_data = json.load(f)
+
+                    # Parse using AudioModelFamilyV2 (no model_family validation required)
+                    model = AudioModelFamilyV2.parse_obj(model_data)
+                    models.append(model)
+                    logger.info(f"Loaded built-in audio model: {model.model_name}")
+
+                except Exception as e:
+                    logger.warning(f"Failed to load built-in model from {filename}: {e}")
+
+        return models
+
+    def register_builtin_model(self, model) -> None:
+        """Register a built-in audio model by saving it to the builtin directory."""
+        persist_path = os.path.join(self.builtin_dir, f"{model.model_name}.json")
+
+        try:
+            with open(persist_path, "w", encoding="utf-8") as f:
+                f.write(model.json(exclude_none=True))
+            logger.info(f"Registered built-in audio model: {model.model_name}")
+        except Exception as e:
+            logger.error(f"Failed to register built-in model {model.model_name}: {e}")
+            raise
+
+    def unregister_builtin_model(self, model_name: str) -> None:
+        """Unregister a built-in audio model by removing its JSON file."""
+        persist_path = os.path.join(self.builtin_dir, f"{model_name}.json")
+
+        if os.path.exists(persist_path):
+            os.remove(persist_path)
+            logger.info(f"Unregistered built-in audio model: {model_name}")
+        else:
+            logger.warning(f"Built-in model file not found: {persist_path}")
+
+
+# Global registry instance
+_builtin_registry = None
+
+
+def get_builtin_audio_registry() -> BuiltinAudioModelRegistry:
+    """Get the global built-in audio model registry instance."""
+    global _builtin_registry
+    if _builtin_registry is None:
+        _builtin_registry = BuiltinAudioModelRegistry()
+    return _builtin_registry
+
+
+def get_builtin_audio_families() -> List:
+    """Get all built-in audio model families."""
+    return get_builtin_audio_registry().get_builtin_models()
+
+
+def register_builtin_audio(audio_family) -> None:
+    """Register a built-in audio model family."""
+    return get_builtin_audio_registry().register_builtin_model(audio_family)
+
+
+def unregister_builtin_audio(model_name: str) -> None:
+    """Unregister a built-in audio model family."""
+    return get_builtin_audio_registry().unregister_builtin_model(model_name)
@@ -16,8 +16,10 @@ def __init__(self, model_family: "CacheableModelSpec"):
         self._model_family = model_family
         self._v2_cache_dir_prefix = os.path.join(XINFERENCE_CACHE_DIR, "v2")
         self._v2_custom_dir_prefix = os.path.join(XINFERENCE_MODEL_DIR, "v2")
+        self._v2_builtin_dir_prefix = os.path.join(XINFERENCE_MODEL_DIR, "v2", "builtin")
         os.makedirs(self._v2_cache_dir_prefix, exist_ok=True)
         os.makedirs(self._v2_custom_dir_prefix, exist_ok=True)
+        os.makedirs(self._v2_builtin_dir_prefix, exist_ok=True)
         self._cache_dir = os.path.join(
             self._v2_cache_dir_prefix, self._model_family.model_name.replace(".", "_")
         )
@@ -109,19 +111,32 @@ def cache(self) -> str:
         return self._cache()
 
     def register_custom_model(self, model_type: str):
+        model_type_dir = model_type.lower()
         persist_path = os.path.join(
             self._v2_custom_dir_prefix,
-            model_type,
+            model_type_dir,
+            f"{self._model_family.model_name}.json",
+        )
+        os.makedirs(os.path.dirname(persist_path), exist_ok=True)
+        with open(persist_path, mode="w") as fd:
+            fd.write(self._model_family.json())
+
+    def register_builtin_model(self, model_type: str):
+        model_type_dir = model_type.lower()
+        persist_path = os.path.join(
+            self._v2_builtin_dir_prefix,
+            model_type_dir,
             f"{self._model_family.model_name}.json",
         )
         os.makedirs(os.path.dirname(persist_path), exist_ok=True)
         with open(persist_path, mode="w") as fd:
             fd.write(self._model_family.json())
 
     def unregister_custom_model(self, model_type: str):
+        model_type_dir = model_type.lower()
         persist_path = os.path.join(
             self._v2_custom_dir_prefix,
-            model_type,
+            model_type_dir,
             f"{self._model_family.model_name}.json",
         )
         if os.path.exists(persist_path):
 
@@ -118,6 +118,7 @@ def get_registry(cls, model_type: str) -> ModelRegistry:
         from .image.custom import ImageModelRegistry
         from .llm.custom import LLMModelRegistry
         from .rerank.custom import RerankModelRegistry
+        from .video.custom import VideoModelRegistry
 
         if model_type not in cls._instances:
             if model_type == "rerank":
@@ -126,6 +127,8 @@ def get_registry(cls, model_type: str) -> ModelRegistry:
                 cls._instances[model_type] = ImageModelRegistry()
             elif model_type == "audio":
                 cls._instances[model_type] = AudioModelRegistry()
+            elif model_type == "video":
+                cls._instances[model_type] = VideoModelRegistry()
             elif model_type == "llm":
                 cls._instances[model_type] = LLMModelRegistry()
             elif model_type == "flexible":
 
@@ -64,6 +64,31 @@ def register_custom_model():
                 warnings.warn(f"{user_defined_embedding_dir}/{f} has error, {e}")
 
 
+def register_builtin_model():
+    from ...constants import XINFERENCE_MODEL_DIR
+    from ..custom import RegistryManager
+
+    registry = RegistryManager.get_registry("embedding")
+    existing_model_names = {spec.model_name for spec in registry.get_custom_models()}
+
+    builtin_embedding_dir = os.path.join(XINFERENCE_MODEL_DIR, "v2", "builtin", "embedding")
+    if os.path.isdir(builtin_embedding_dir):
+        for f in os.listdir(builtin_embedding_dir):
+            if f.endswith(".json"):
+                try:
+                    with codecs.open(
+                        os.path.join(builtin_embedding_dir, f), encoding="utf-8"
+                    ) as fd:
+                        builtin_embedding_family = EmbeddingModelFamilyV2.parse_obj(json.load(fd))
+
+                        # Only register if model doesn't already exist
+                        if builtin_embedding_family.model_name not in existing_model_names:
+                            register_embedding(builtin_embedding_family, persist=False)
+                            existing_model_names.add(builtin_embedding_family.model_name)
+                except Exception as e:
+                    warnings.warn(f"{builtin_embedding_dir}/{f} has error, {e}")
+
+
 def check_format_with_engine(model_format, engine):
     if model_format in ["ggufv2"] and engine not in ["llama.cpp"]:
         return False
 
@@ -0,0 +1,110 @@
+# Copyright 2022-2025 XProbe Inc.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import json
+import logging
+import os
+from typing import List
+
+logger = logging.getLogger(__name__)
+
+
+class BuiltinEmbeddingModelRegistry:
+    """
+    Registry for built-in embedding models downloaded from official model hub.
+
+    These models are treated as built-in models.
+    They are stored in ~/.xinference/model/v2/builtin/embedding/ directory.
+    """
+
+    def __init__(self):
+        from ...constants import XINFERENCE_MODEL_DIR
+
+        self.builtin_dir = os.path.join(XINFERENCE_MODEL_DIR, "v2", "builtin", "embedding")
+        os.makedirs(self.builtin_dir, exist_ok=True)
+
+    def get_builtin_models(self) -> List:
+        """Load all built-in embedding models from the builtin directory."""
+        from .custom import EmbeddingModelFamilyV2
+
+        models = []
+
+        if not os.path.exists(self.builtin_dir):
+            return models
+
+        for filename in os.listdir(self.builtin_dir):
+            if filename.endswith(".json"):
+                file_path = os.path.join(self.builtin_dir, filename)
+                try:
+                    with open(file_path, "r", encoding="utf-8") as f:
+                        model_data = json.load(f)
+
+                    # Parse using EmbeddingFamilyV2
+                    model = EmbeddingModelFamilyV2.parse_obj(model_data)
+                    models.append(model)
+                    logger.info(f"Loaded built-in embedding model: {model.model_name}")
+
+                except Exception as e:
+                    logger.warning(f"Failed to load built-in model from {filename}: {e}")
+
+        return models
+
+    def register_builtin_model(self, model) -> None:
+        """Register a built-in embedding model by saving it to the builtin directory."""
+        persist_path = os.path.join(self.builtin_dir, f"{model.model_name}.json")
+
+        try:
+            with open(persist_path, "w", encoding="utf-8") as f:
+                f.write(model.json(exclude_none=True))
+            logger.info(f"Registered built-in embedding model: {model.model_name}")
+        except Exception as e:
+            logger.error(f"Failed to register built-in model {model.model_name}: {e}")
+            raise
+
+    def unregister_builtin_model(self, model_name: str) -> None:
+        """Unregister a built-in embedding model by removing its JSON file."""
+        persist_path = os.path.join(self.builtin_dir, f"{model_name}.json")
+
+        if os.path.exists(persist_path):
+            os.remove(persist_path)
+            logger.info(f"Unregistered built-in embedding model: {model_name}")
+        else:
+            logger.warning(f"Built-in model file not found: {persist_path}")
+
+
+# Global registry instance
+_builtin_registry = None
+
+
+def get_builtin_embedding_registry() -> BuiltinEmbeddingModelRegistry:
+    """Get the global built-in embedding model registry instance."""
+    global _builtin_registry
+    if _builtin_registry is None:
+        _builtin_registry = BuiltinEmbeddingModelRegistry()
+    return _builtin_registry
+
+
+def get_builtin_embedding_families() -> List:
+    """Get all built-in embedding model families."""
+    return get_builtin_embedding_registry().get_builtin_models()
+
+
+def register_builtin_embedding(embedding_family) -> None:
+    """Register a built-in embedding model family."""
+    return get_builtin_embedding_registry().register_builtin_model(embedding_family)
+
+
+def unregister_builtin_embedding(model_name: str) -> None:
+    """Unregister a built-in embedding model family."""
+    return get_builtin_embedding_registry().unregister_builtin_model(model_name)