From e04ca74f4d88631d3d58b9ee2e2e5e17d2a30652 Mon Sep 17 00:00:00 2001
From: Naveed Jooma <naveed@viam.com>
Date: Wed, 3 Sep 2025 15:16:16 -0400
Subject: [PATCH 1/3] Update CameraMimeType to allow for custom mimes

---
 src/viam/components/camera/camera.py  | 14 +++--
 src/viam/components/camera/client.py  | 16 ++---
 src/viam/components/camera/service.py | 12 ++--
 src/viam/components/component_base.py |  4 +-
 src/viam/media/utils/pil/__init__.py  |  6 +-
 src/viam/media/video.py               | 84 +++++++++++++++++++--------
 src/viam/services/vision/client.py    |  6 +-
 src/viam/services/vision/service.py   | 14 +++--
 tests/test_camera.py                  |  2 +
 tests/test_media.py                   | 49 ++++++++++++++++
 tests/test_vision_service.py          |  1 +
 11 files changed, 155 insertions(+), 53 deletions(-)

diff --git a/src/viam/components/camera/camera.py b/src/viam/components/camera/camera.py
index 7f4228c93..1243457e6 100644
--- a/src/viam/components/camera/camera.py
+++ b/src/viam/components/camera/camera.py
@@ -1,6 +1,6 @@
 import abc
 import sys
-from typing import Any, Dict, Final, List, Optional, Tuple
+from typing import Any, Dict, Final, Optional, Sequence, Tuple
 
 from viam.media.video import NamedImage, ViamImage
 from viam.proto.common import ResponseMetadata
@@ -66,11 +66,11 @@ async def get_image(
     async def get_images(
         self,
         *,
-        filter_source_names: Optional[List[str]] = None,
+        filter_source_names: Optional[Sequence[str]] = None,
         extra: Optional[Dict[str, Any]] = None,
         timeout: Optional[float] = None,
         **kwargs,
-    ) -> Tuple[List[NamedImage], ResponseMetadata]:
+    ) -> Tuple[Sequence[NamedImage], ResponseMetadata]:
         """Get simultaneous images from different imagers, along with associated metadata.
         This should not be used for getting a time series of images from the same imager.
 
@@ -82,9 +82,13 @@ async def get_images(
             first_image = images[0]
             timestamp = metadata.captured_at
 
+        Args:
+            filter_source_names (List[str]): The filter_source_names parameter can be used to filter only the images from the specified
+                source names. When unspecified, all images are returned.
+
         Returns:
-            Tuple[List[NamedImage], ResponseMetadata]: A tuple containing two values; the first [0] a list of images
-            returned from the camera system, and the second [1] the metadata associated with this response.
+            Tuple[Sequence[NamedImage], ResponseMetadata]: A tuple containing two values; the first [0] a list of images
+                returned from the camera system, and the second [1] the metadata associated with this response.
 
         For more information, see `Camera component <https://docs.viam.com/dev/reference/apis/components/camera/#getimages>`_.
         """
diff --git a/src/viam/components/camera/client.py b/src/viam/components/camera/client.py
index 493d219ed..6d18296ca 100644
--- a/src/viam/components/camera/client.py
+++ b/src/viam/components/camera/client.py
@@ -1,4 +1,4 @@
-from typing import Any, Dict, List, Mapping, Optional, Tuple
+from typing import Any, Dict, Mapping, Optional, Sequence, Tuple
 
 from grpclib.client import Channel
 
@@ -41,26 +41,26 @@ async def get_image(
         md = kwargs.get("metadata", self.Metadata()).proto
         request = GetImageRequest(name=self.name, mime_type=mime_type, extra=dict_to_struct(extra))
         response: GetImageResponse = await self.client.GetImage(request, timeout=timeout, metadata=md)
-        return ViamImage(response.image, response.mime_type)
+        return ViamImage(response.image, CameraMimeType.from_string(response.mime_type))
 
     async def get_images(
         self,
         *,
-        filter_source_names: Optional[List[str]] = None,
+        filter_source_names: Optional[Sequence[str]] = None,
         extra: Optional[Dict[str, Any]] = None,
         timeout: Optional[float] = None,
         **kwargs,
-    ) -> Tuple[List[NamedImage], ResponseMetadata]:
+    ) -> Tuple[Sequence[NamedImage], ResponseMetadata]:
         md = kwargs.get("metadata", self.Metadata()).proto
         request = GetImagesRequest(name=self.name, extra=dict_to_struct(extra), filter_source_names=filter_source_names)
         response: GetImagesResponse = await self.client.GetImages(request, timeout=timeout, metadata=md)
         imgs = []
         for img_data in response.images:
             if img_data.mime_type:
-                mime_type = img_data.mime_type
+                mime_type = CameraMimeType.from_string(img_data.mime_type)
             else:
                 # TODO(RSDK-11728): remove this once we deleted the format field
-                mime_type = str(CameraMimeType.from_proto(img_data.format))
+                mime_type = CameraMimeType.from_proto(img_data.format)
             img = NamedImage(img_data.source_name, img_data.image, mime_type)
             imgs.append(img)
         resp_metadata: ResponseMetadata = response.response_metadata
@@ -99,6 +99,8 @@ async def do_command(
         response: DoCommandResponse = await self.client.DoCommand(request, timeout=timeout, metadata=md)
         return struct_to_dict(response.result)
 
-    async def get_geometries(self, *, extra: Optional[Dict[str, Any]] = None, timeout: Optional[float] = None, **kwargs) -> List[Geometry]:
+    async def get_geometries(
+        self, *, extra: Optional[Dict[str, Any]] = None, timeout: Optional[float] = None, **kwargs
+    ) -> Sequence[Geometry]:
         md = kwargs.get("metadata", self.Metadata())
         return await get_geometries(self.client, self.name, extra, timeout, md)
diff --git a/src/viam/components/camera/service.py b/src/viam/components/camera/service.py
index e0a6a53f3..d41af7ab6 100644
--- a/src/viam/components/camera/service.py
+++ b/src/viam/components/camera/service.py
@@ -7,7 +7,6 @@
 from viam.proto.common import DoCommandRequest, DoCommandResponse, GetGeometriesRequest, GetGeometriesResponse
 from viam.proto.component.camera import (
     CameraServiceBase,
-    Format,
     GetImageRequest,
     GetImageResponse,
     GetImagesRequest,
@@ -54,16 +53,13 @@ async def GetImages(self, stream: Stream[GetImagesRequest, GetImagesResponse]) -
             timeout=timeout,
             metadata=stream.metadata,
             extra=struct_to_dict(request.extra),
-            filter_source_names=list(request.filter_source_names),
+            filter_source_names=request.filter_source_names,
         )
         img_bytes_lst = []
         for img in images:
-            try:
-                mime_type = CameraMimeType.from_string(img.mime_type)  # this can ValueError if the mime_type is not a CameraMimeType
-                fmt = mime_type.to_proto()
-            except ValueError:
-                # TODO(RSDK-11728): remove this once we deleted the format field
-                fmt = Format.FORMAT_UNSPECIFIED
+            mime_type = CameraMimeType.from_string(img.mime_type)
+            # TODO(RSDK-11728): remove this fmt logic once we deleted the format field
+            fmt = mime_type.to_proto()  # Will be Format.FORMAT_UNSPECIFIED if an unsupported/custom mime type is set
 
             img_bytes = img.data
             img_bytes_lst.append(Image(source_name=name, mime_type=img.mime_type, format=fmt, image=img_bytes))
diff --git a/src/viam/components/component_base.py b/src/viam/components/component_base.py
index 728b80761..90d07a369 100644
--- a/src/viam/components/component_base.py
+++ b/src/viam/components/component_base.py
@@ -1,6 +1,6 @@
 import abc
 from logging import Logger
-from typing import TYPE_CHECKING, Any, ClassVar, Dict, List, Mapping, Optional, SupportsBytes, SupportsFloat, Union, cast
+from typing import TYPE_CHECKING, Any, ClassVar, Dict, List, Mapping, Optional, Sequence, SupportsBytes, SupportsFloat, Union, cast
 
 from typing_extensions import Self
 
@@ -46,7 +46,7 @@ def from_robot(cls, robot: "RobotClient", name: str) -> Self:
     async def do_command(self, command: Mapping[str, ValueTypes], *, timeout: Optional[float] = None, **kwargs) -> Mapping[str, ValueTypes]:
         raise NotImplementedError()
 
-    async def get_geometries(self, *, extra: Optional[Dict[str, Any]] = None, timeout: Optional[float] = None) -> List[Geometry]:
+    async def get_geometries(self, *, extra: Optional[Dict[str, Any]] = None, timeout: Optional[float] = None) -> Sequence[Geometry]:
         """
         Get all geometries associated with the component, in their current configuration, in the
         `frame <https://docs.viam.com/operate/mobility/define-geometry/>`__ of the component.
diff --git a/src/viam/media/utils/pil/__init__.py b/src/viam/media/utils/pil/__init__.py
index 4335b2d09..7914e0120 100644
--- a/src/viam/media/utils/pil/__init__.py
+++ b/src/viam/media/utils/pil/__init__.py
@@ -39,6 +39,10 @@ def pil_to_viam_image(image: Image.Image, mime_type: CameraMimeType) -> ViamImag
     Returns:
         ViamImage: The resulting ViamImage
     """
+    # Make sure at runtime the mime_type string is actually a CameraMimeType
+    if not isinstance(mime_type, CameraMimeType):
+        raise ValueError(f"Cannot encode to unsupported mimetype: {mime_type}")
+
     if mime_type.name in LIBRARY_SUPPORTED_FORMATS:
         buf = BytesIO()
         if image.mode == "RGBA" and mime_type == CameraMimeType.JPEG:
@@ -46,6 +50,6 @@ def pil_to_viam_image(image: Image.Image, mime_type: CameraMimeType) -> ViamImag
         image.save(buf, format=mime_type.name)
         data = buf.getvalue()
     else:
-        raise ValueError(f"Cannot encode image to {mime_type}")
+        raise ValueError(f"Cannot encode to unsupported mimetype: {mime_type}")
 
     return ViamImage(data, mime_type)
diff --git a/src/viam/media/video.py b/src/viam/media/video.py
index b32d01e76..ac6c1d7ec 100644
--- a/src/viam/media/video.py
+++ b/src/viam/media/video.py
@@ -1,6 +1,5 @@
 from array import array
-from enum import Enum
-from typing import List, Optional, Tuple
+from typing import Any, List, Optional, Tuple
 
 from typing_extensions import Self
 
@@ -10,12 +9,47 @@
 from .viam_rgba import RGBA_HEADER_LENGTH, RGBA_MAGIC_NUMBER
 
 
-class CameraMimeType(str, Enum):
-    VIAM_RGBA = "image/vnd.viam.rgba"
-    VIAM_RAW_DEPTH = "image/vnd.viam.dep"
-    JPEG = "image/jpeg"
-    PNG = "image/png"
-    PCD = "pointcloud/pcd"
+class _FrozenClassAttributesMeta(type):
+    """
+    A metaclass that prevents the reassignment of existing class attributes.
+    """
+
+    def __setattr__(cls, name: str, value: Any):
+        # Check if the attribute `name` already exists on the class
+        if name in cls.__dict__:
+            # If it exists, raise an error to prevent overwriting
+            raise AttributeError(f"Cannot reassign constant '{name}'")
+        # If it's a new attribute, allow it to be set
+        super().__setattr__(name, value)
+
+
+class CameraMimeType(str, metaclass=_FrozenClassAttributesMeta):
+    VIAM_RGBA: Self
+    VIAM_RAW_DEPTH: Self
+    JPEG: Self
+    PNG: Self
+    PCD: Self
+
+    @property
+    def name(self) -> str:
+        for key, value in self.__class__.__dict__.items():
+            if value == self:
+                return key
+        return "CUSTOM"
+
+    @property
+    def value(self) -> str:
+        return self
+
+    @classmethod
+    def CUSTOM(cls, mime_type: str) -> Self:
+        """
+        Create a custom mime type.
+
+        Args:
+            mime_type (str): The mimetype as a string
+        """
+        return cls.from_string(mime_type)
 
     @classmethod
     def from_string(cls, value: str) -> Self:
@@ -28,13 +62,10 @@ def from_string(cls, value: str) -> Self:
             Self: The mimetype
         """
         value_mime = value[:-5] if value.endswith("+lazy") else value  # ViamImage lazy encodes by default
-        try:
-            return cls(value_mime)
-        except ValueError:
-            raise ValueError(f"Invalid mimetype: {value}")
+        return cls(value_mime)
 
     @classmethod
-    def from_proto(cls, format: Format.ValueType) -> "CameraMimeType":
+    def from_proto(cls, format: Format.ValueType) -> Self:
         """Returns the mimetype from a proto enum.
 
         Args:
@@ -44,12 +75,12 @@ def from_proto(cls, format: Format.ValueType) -> "CameraMimeType":
             Self: The mimetype.
         """
         mimetypes = {
-            Format.FORMAT_RAW_RGBA: CameraMimeType.VIAM_RGBA,
-            Format.FORMAT_RAW_DEPTH: CameraMimeType.VIAM_RAW_DEPTH,
-            Format.FORMAT_JPEG: CameraMimeType.JPEG,
-            Format.FORMAT_PNG: CameraMimeType.PNG,
+            Format.FORMAT_RAW_RGBA: cls.VIAM_RGBA,
+            Format.FORMAT_RAW_DEPTH: cls.VIAM_RAW_DEPTH,
+            Format.FORMAT_JPEG: cls.JPEG,
+            Format.FORMAT_PNG: cls.PNG,
         }
-        return mimetypes.get(format, CameraMimeType.JPEG)
+        return cls(mimetypes.get(format, cls.JPEG))
 
     def to_proto(self) -> Format.ValueType:
         """Returns the mimetype in a proto enum.
@@ -66,6 +97,13 @@ def to_proto(self) -> Format.ValueType:
         return formats.get(self, Format.FORMAT_UNSPECIFIED)
 
 
+CameraMimeType.VIAM_RGBA = CameraMimeType.from_string("image/vnd.viam.rgba")
+CameraMimeType.VIAM_RAW_DEPTH = CameraMimeType.from_string("image/vnd.viam.dep")
+CameraMimeType.JPEG = CameraMimeType.from_string("image/jpeg")
+CameraMimeType.PNG = CameraMimeType.from_string("image/png")
+CameraMimeType.PCD = CameraMimeType.from_string("pointcloud/pcd")
+
+
 class ViamImage:
     """A native implementation of an image.
 
@@ -73,11 +111,11 @@ class ViamImage:
     """
 
     _data: bytes
-    _mime_type: str
+    _mime_type: CameraMimeType
     _height: Optional[int] = None
     _width: Optional[int] = None
 
-    def __init__(self, data: bytes, mime_type: str) -> None:
+    def __init__(self, data: bytes, mime_type: CameraMimeType) -> None:
         self._data = data
         self._mime_type = mime_type
         self._width, self._height = _getDimensions(data, mime_type)
@@ -88,7 +126,7 @@ def data(self) -> bytes:
         return self._data
 
     @property
-    def mime_type(self) -> str:
+    def mime_type(self) -> CameraMimeType:
         """The mime type of the image"""
         return self._mime_type
 
@@ -131,12 +169,12 @@ class NamedImage(ViamImage):
     """The name of the image
     """
 
-    def __init__(self, name: str, data: bytes, mime_type: str) -> None:
+    def __init__(self, name: str, data: bytes, mime_type: CameraMimeType) -> None:
         self.name = name
         super().__init__(data, mime_type)
 
 
-def _getDimensions(image: bytes, mime_type: str) -> Tuple[Optional[int], Optional[int]]:
+def _getDimensions(image: bytes, mime_type: CameraMimeType) -> Tuple[Optional[int], Optional[int]]:
     try:
         if mime_type == CameraMimeType.JPEG:
             return _getDimensionsFromJPEG(image)
diff --git a/src/viam/services/vision/client.py b/src/viam/services/vision/client.py
index 930f02adf..77182c21d 100644
--- a/src/viam/services/vision/client.py
+++ b/src/viam/services/vision/client.py
@@ -69,7 +69,11 @@ async def capture_all_from_camera(
         result = CaptureAllResult()
         result.extra = struct_to_dict(response.extra)
         if return_image:
-            mime_type = CameraMimeType.from_proto(response.image.format)
+            # TODO(RSDK-11728): remove this branching logic once we deleted the format field
+            if response.image.mime_type:
+                mime_type = CameraMimeType.from_string(response.image.mime_type)
+            else:
+                mime_type = CameraMimeType.from_proto(response.image.format)
             img = ViamImage(response.image.image, mime_type)
             result.image = img
         if return_classifications:
diff --git a/src/viam/services/vision/service.py b/src/viam/services/vision/service.py
index 835cf753d..e6510614f 100644
--- a/src/viam/services/vision/service.py
+++ b/src/viam/services/vision/service.py
@@ -26,7 +26,7 @@
 from .vision import Vision
 
 
-class VisionRPCService(UnimplementedVisionServiceBase, ResourceRPCServiceBase):
+class VisionRPCService(UnimplementedVisionServiceBase, ResourceRPCServiceBase[Vision]):
     """
     gRPC service for a Vision service
     """
@@ -50,9 +50,11 @@ async def CaptureAllFromCamera(self, stream: Stream[CaptureAllFromCameraRequest,
         )
         img = None
         if result.image is not None:
-            fmt = result.image.mime_type.to_proto()
+            mime_type = CameraMimeType.from_string(result.image.mime_type)
+            # TODO(RSDK-11728): remove this fmt logic once we deleted the format field
+            fmt = mime_type.to_proto()  # Will be Format.FORMAT_UNSPECIFIED if an unsupported/custom mime type is set
             img_bytes = result.image.data
-            img = Image(source_name=request.camera_name, format=fmt, image=img_bytes)
+            img = Image(source_name=request.camera_name, mime_type=mime_type, format=fmt, image=img_bytes)
         response = CaptureAllFromCameraResponse(
             image=img,
             detections=result.detections,
@@ -79,7 +81,7 @@ async def GetDetections(self, stream: Stream[GetDetectionsRequest, GetDetections
         extra = struct_to_dict(request.extra)
         timeout = stream.deadline.time_remaining() if stream.deadline else None
 
-        image = ViamImage(request.image, request.mime_type)
+        image = ViamImage(request.image, CameraMimeType.from_string(request.mime_type))
 
         result = await vision.get_detections(image, extra=extra, timeout=timeout)
         response = GetDetectionsResponse(detections=result)
@@ -104,7 +106,7 @@ async def GetClassifications(self, stream: Stream[GetClassificationsRequest, Get
         extra = struct_to_dict(request.extra)
         timeout = stream.deadline.time_remaining() if stream.deadline else None
 
-        image = ViamImage(request.image, request.mime_type)
+        image = ViamImage(request.image, CameraMimeType.from_string(request.mime_type))
 
         result = await vision.get_classifications(image, request.n, extra=extra, timeout=timeout)
         response = GetClassificationsResponse(classifications=result)
@@ -117,7 +119,7 @@ async def GetObjectPointClouds(self, stream: Stream[GetObjectPointCloudsRequest,
         extra = struct_to_dict(request.extra)
         timeout = stream.deadline.time_remaining() if stream.deadline else None
         result = await vision.get_object_point_clouds(request.camera_name, extra=extra, timeout=timeout)
-        response = GetObjectPointCloudsResponse(mime_type=CameraMimeType.PCD.value, objects=result)
+        response = GetObjectPointCloudsResponse(mime_type=CameraMimeType.PCD, objects=result)
         await stream.send_message(response)
 
     async def GetProperties(self, stream: Stream[GetPropertiesRequest, GetPropertiesResponse]) -> None:
diff --git a/tests/test_camera.py b/tests/test_camera.py
index 7ba438311..229a8b750 100644
--- a/tests/test_camera.py
+++ b/tests/test_camera.py
@@ -13,6 +13,7 @@
 from viam.proto.component.camera import (
     CameraServiceStub,
     DistortionParameters,
+    Format,
     GetImageRequest,
     GetImageResponse,
     GetImagesRequest,
@@ -158,6 +159,7 @@ async def test_get_images(self, camera: MockCamera, service: CameraRPCService, m
             request = GetImagesRequest(name="camera")
             response: GetImagesResponse = await client.GetImages(request, timeout=18.1)
             raw_img = response.images[0]
+            assert raw_img.format == Format.FORMAT_PNG
             assert raw_img.mime_type == CameraMimeType.PNG
             assert raw_img.source_name == camera.name
             assert response.response_metadata == metadata
diff --git a/tests/test_media.py b/tests/test_media.py
index 2fb1596b6..1f565814a 100644
--- a/tests/test_media.py
+++ b/tests/test_media.py
@@ -11,6 +11,8 @@
 
 
 class TestViamImage:
+    UNSUPPORTED_MIME_TYPE = "unsupported_string_mime_type"
+
     def test_supported_image(self):
         i = Image.new("RGBA", (100, 100), "#AABBCCDD")
         b = BytesIO()
@@ -41,6 +43,10 @@ def test_dimensions(self):
         assert img4.width is None
         assert img4.height is None
 
+        img5 = ViamImage(b"data", CameraMimeType.CUSTOM(self.UNSUPPORTED_MIME_TYPE))
+        assert img5.width is None
+        assert img5.height is None
+
     def test_bytes_to_depth_array(self):
         with open(f"{os.path.dirname(__file__)}/data/fakeDM.vnd.viam.dep", "rb") as depth_map:
             img = ViamImage(depth_map.read(), CameraMimeType.VIAM_RAW_DEPTH)
@@ -68,6 +74,46 @@ def test_name(self):
         assert img.name == name
 
 
+class TestCameraMimeType:
+    def test_name(self):
+        mime_type = CameraMimeType.VIAM_RGBA
+        assert mime_type.name == "VIAM_RGBA"
+
+        mime_type = CameraMimeType.VIAM_RAW_DEPTH
+        assert mime_type.name == "VIAM_RAW_DEPTH"
+
+        mime_type = CameraMimeType.JPEG
+        assert mime_type.name == "JPEG"
+
+        mime_type = CameraMimeType.PNG
+        assert mime_type.name == "PNG"
+
+        mime_type = CameraMimeType.PCD
+        assert mime_type.name == "PCD"
+
+        mime_type = CameraMimeType.CUSTOM("SOME CUSTOM MIME TYPE")
+        assert mime_type.name == "CUSTOM"
+
+    def test_value(self):
+        mime_type = CameraMimeType.VIAM_RGBA
+        assert mime_type.value == "image/vnd.viam.rgba"
+
+        mime_type = CameraMimeType.VIAM_RAW_DEPTH
+        assert mime_type.value == "image/vnd.viam.dep"
+
+        mime_type = CameraMimeType.JPEG
+        assert mime_type.value == "image/jpeg"
+
+        mime_type = CameraMimeType.PNG
+        assert mime_type.value == "image/png"
+
+        mime_type = CameraMimeType.PCD
+        assert mime_type.value == "pointcloud/pcd"
+
+        mime_type = CameraMimeType.CUSTOM("SOME CUSTOM MIME TYPE")
+        assert mime_type.value == "SOME CUSTOM MIME TYPE"
+
+
 def test_image_conversion():
     i = Image.new("RGBA", (100, 100), "#AABBCCDD")
 
@@ -78,3 +124,6 @@ def test_image_conversion():
     pil_img = viam_to_pil_image(v_img)
     v_img2 = pil_to_viam_image(pil_img, CameraMimeType.JPEG)
     assert v_img2.data == v_img.data
+
+    with pytest.raises(ValueError, match=f"Cannot encode to unsupported mimetype: {TestViamImage.UNSUPPORTED_MIME_TYPE}"):
+        pil_to_viam_image(i, CameraMimeType.CUSTOM(TestViamImage.UNSUPPORTED_MIME_TYPE))
diff --git a/tests/test_vision_service.py b/tests/test_vision_service.py
index 72da84e76..071ead48e 100644
--- a/tests/test_vision_service.py
+++ b/tests/test_vision_service.py
@@ -206,6 +206,7 @@ async def test_capture_all_from_camera(self, vision: MockVision, service: Vision
             )
             response: CaptureAllFromCameraResponse = await client.CaptureAllFromCamera(request)
             assert response.image.image == VISION_IMAGE.data
+            assert response.image.mime_type == VISION_IMAGE.mime_type
             assert response.image.format == VISION_IMAGE.mime_type.to_proto()
             assert response.classifications == CLASSIFICATIONS
             assert response.detections == []

From b397f5bcf4385978e409694c63cad4eb17aa047e Mon Sep 17 00:00:00 2001
From: Naveed Jooma <naveed@viam.com>
Date: Wed, 3 Sep 2025 15:59:52 -0400
Subject: [PATCH 2/3] Mark as classvars

---
 src/viam/components/camera/camera.py |  2 +-
 src/viam/media/video.py              | 12 ++++++------
 2 files changed, 7 insertions(+), 7 deletions(-)

diff --git a/src/viam/components/camera/camera.py b/src/viam/components/camera/camera.py
index 1243457e6..6cade1a6a 100644
--- a/src/viam/components/camera/camera.py
+++ b/src/viam/components/camera/camera.py
@@ -83,7 +83,7 @@ async def get_images(
             timestamp = metadata.captured_at
 
         Args:
-            filter_source_names (List[str]): The filter_source_names parameter can be used to filter only the images from the specified
+            filter_source_names (Sequence[str]): The filter_source_names parameter can be used to filter only the images from the specified
                 source names. When unspecified, all images are returned.
 
         Returns:
diff --git a/src/viam/media/video.py b/src/viam/media/video.py
index ac6c1d7ec..8643cf856 100644
--- a/src/viam/media/video.py
+++ b/src/viam/media/video.py
@@ -1,7 +1,7 @@
 from array import array
 from typing import Any, List, Optional, Tuple
 
-from typing_extensions import Self
+from typing_extensions import Self, ClassVar
 
 from viam.errors import NotSupportedError
 from viam.proto.component.camera import Format
@@ -24,11 +24,11 @@ def __setattr__(cls, name: str, value: Any):
 
 
 class CameraMimeType(str, metaclass=_FrozenClassAttributesMeta):
-    VIAM_RGBA: Self
-    VIAM_RAW_DEPTH: Self
-    JPEG: Self
-    PNG: Self
-    PCD: Self
+    VIAM_RGBA: ClassVar[Self]
+    VIAM_RAW_DEPTH: ClassVar[Self]
+    JPEG: ClassVar[Self]
+    PNG: ClassVar[Self]
+    PCD: ClassVar[Self]
 
     @property
     def name(self) -> str:

From efcac4d9f8905ef3e67e71c0d2ac6616d237eece Mon Sep 17 00:00:00 2001
From: Naveed Jooma <naveed@viam.com>
Date: Thu, 4 Sep 2025 13:20:22 -0400
Subject: [PATCH 3/3] Add docs and tests

---
 src/viam/media/video.py                       | 17 ++++++-
 src/viam/services/worldstatestore/__init__.py |  2 +-
 tests/test_media.py                           | 48 ++++++++++++++++++-
 3 files changed, 63 insertions(+), 4 deletions(-)

diff --git a/src/viam/media/video.py b/src/viam/media/video.py
index 8643cf856..909924ce2 100644
--- a/src/viam/media/video.py
+++ b/src/viam/media/video.py
@@ -1,7 +1,7 @@
 from array import array
 from typing import Any, List, Optional, Tuple
 
-from typing_extensions import Self, ClassVar
+from typing_extensions import ClassVar, Self
 
 from viam.errors import NotSupportedError
 from viam.proto.component.camera import Format
@@ -24,6 +24,12 @@ def __setattr__(cls, name: str, value: Any):
 
 
 class CameraMimeType(str, metaclass=_FrozenClassAttributesMeta):
+    """
+    The compatible mime-types for cameras and vision services.
+
+    You can use the `CameraMimeType.CUSTOM(...)` method to use an unlisted mime-type.
+    """
+
     VIAM_RGBA: ClassVar[Self]
     VIAM_RAW_DEPTH: ClassVar[Self]
     JPEG: ClassVar[Self]
@@ -82,7 +88,8 @@ def from_proto(cls, format: Format.ValueType) -> Self:
         }
         return cls(mimetypes.get(format, cls.JPEG))
 
-    def to_proto(self) -> Format.ValueType:
+    @property
+    def proto(self) -> Format.ValueType:
         """Returns the mimetype in a proto enum.
 
         Returns:
@@ -96,6 +103,12 @@ def to_proto(self) -> Format.ValueType:
         }
         return formats.get(self, Format.FORMAT_UNSPECIFIED)
 
+    def to_proto(self) -> Format.ValueType:
+        """
+        DEPRECATED: Use `CameraMimeType.proto`
+        """
+        return self.proto
+
 
 CameraMimeType.VIAM_RGBA = CameraMimeType.from_string("image/vnd.viam.rgba")
 CameraMimeType.VIAM_RAW_DEPTH = CameraMimeType.from_string("image/vnd.viam.dep")
diff --git a/src/viam/services/worldstatestore/__init__.py b/src/viam/services/worldstatestore/__init__.py
index dc197c7df..d881a02f9 100644
--- a/src/viam/services/worldstatestore/__init__.py
+++ b/src/viam/services/worldstatestore/__init__.py
@@ -1,9 +1,9 @@
+from viam.proto.service.worldstatestore import StreamTransformChangesResponse, TransformChangeType
 from viam.resource.registry import Registry, ResourceRegistration
 
 from .client import WorldStateStoreClient
 from .service import WorldStateStoreService
 from .worldstatestore import WorldStateStore
-from viam.proto.service.worldstatestore import StreamTransformChangesResponse, TransformChangeType
 
 __all__ = [
     "WorldStateStore",
diff --git a/tests/test_media.py b/tests/test_media.py
index 1f565814a..ca0a82071 100644
--- a/tests/test_media.py
+++ b/tests/test_media.py
@@ -7,7 +7,7 @@
 
 from viam.errors import NotSupportedError
 from viam.media.utils.pil import pil_to_viam_image, viam_to_pil_image
-from viam.media.video import CameraMimeType, NamedImage, ViamImage
+from viam.media.video import CameraMimeType, Format, NamedImage, ViamImage
 
 
 class TestViamImage:
@@ -113,6 +113,52 @@ def test_value(self):
         mime_type = CameraMimeType.CUSTOM("SOME CUSTOM MIME TYPE")
         assert mime_type.value == "SOME CUSTOM MIME TYPE"
 
+    def test_from_proto(self):
+        format = Format.FORMAT_RAW_RGBA
+        mime_type = CameraMimeType.from_proto(format)
+        assert mime_type == CameraMimeType.VIAM_RGBA
+
+        format = Format.FORMAT_RAW_DEPTH
+        mime_type = CameraMimeType.from_proto(format)
+        assert mime_type == CameraMimeType.VIAM_RAW_DEPTH
+
+        format = Format.FORMAT_JPEG
+        mime_type = CameraMimeType.from_proto(format)
+        assert mime_type == CameraMimeType.JPEG
+
+        format = Format.FORMAT_PNG
+        mime_type = CameraMimeType.from_proto(format)
+        assert mime_type == CameraMimeType.PNG
+
+        format = Format.FORMAT_UNSPECIFIED
+        mime_type = CameraMimeType.from_proto(format)
+        assert mime_type == CameraMimeType.JPEG  # unspecified defaults to jpeg
+
+    def test_to_proto(self):
+        mime_type = CameraMimeType.VIAM_RGBA
+        format = mime_type.proto
+        assert format == Format.FORMAT_RAW_RGBA
+
+        mime_type = CameraMimeType.VIAM_RAW_DEPTH
+        format = mime_type.proto
+        assert format == Format.FORMAT_RAW_DEPTH
+
+        mime_type = CameraMimeType.JPEG
+        format = mime_type.proto
+        assert format == Format.FORMAT_JPEG
+
+        mime_type = CameraMimeType.PNG
+        format = mime_type.proto
+        assert format == Format.FORMAT_PNG
+
+        mime_type = CameraMimeType.PCD
+        format = mime_type.proto
+        assert format == Format.FORMAT_UNSPECIFIED
+
+        mime_type = CameraMimeType.CUSTOM("some custom mime")
+        format = mime_type.proto
+        assert format == Format.FORMAT_UNSPECIFIED
+
 
 def test_image_conversion():
     i = Image.new("RGBA", (100, 100), "#AABBCCDD")