databricks · nikhilsuri-db · Nov 28, 2025 · Nov 18, 2025 · Nov 18, 2025 · Nov 18, 2025
diff --git a/tests/e2e/test_telemetry_e2e.py b/tests/e2e/test_telemetry_e2e.py
@@ -0,0 +1,343 @@
+"""
+E2E test for telemetry - verifies telemetry behavior with different scenarios
+"""
+import time
+import threading
+import logging
+from contextlib import contextmanager
+from unittest.mock import patch
+import pytest
+from concurrent.futures import wait
+
+import databricks.sql as sql
+from databricks.sql.telemetry.telemetry_client import (
+    TelemetryClient,
+    TelemetryClientFactory,
+)
+
+log = logging.getLogger(__name__)
+
+
+class TelemetryTestBase:
+    """Simplified test base class for telemetry e2e tests"""
+
+    @pytest.fixture(autouse=True)
+    def get_details(self, connection_details):
+        self.arguments = connection_details.copy()
+
+    def connection_params(self):
+        return {
+            "server_hostname": self.arguments["host"],
+            "http_path": self.arguments["http_path"],
+            "access_token": self.arguments.get("access_token"),
+        }
+
+    @contextmanager
+    def connection(self, extra_params=()):
+        connection_params = dict(self.connection_params(), **dict(extra_params))
+        log.info("Connecting with args: {}".format(connection_params))
+        conn = sql.connect(**connection_params)
+        try:
+            yield conn
+        finally:
+            conn.close()
+
+
+class TestTelemetryE2E(TelemetryTestBase):
+    """E2E tests for telemetry scenarios"""
+
+    @pytest.fixture(autouse=True)
+    def telemetry_setup_teardown(self):
+        """Clean up telemetry client state before and after each test"""
+        try:
+            yield
+        finally:
+            if TelemetryClientFactory._executor:
+                TelemetryClientFactory._executor.shutdown(wait=True)
+                TelemetryClientFactory._executor = None
+            TelemetryClientFactory._stop_flush_thread()
+            TelemetryClientFactory._initialized = False
+
+    @pytest.fixture
+    def telemetry_interceptors(self):
+        """Setup reusable telemetry interceptors as a fixture"""
+        capture_lock = threading.Lock()
+        captured_events = []
+        captured_futures = []
+
+        original_export = TelemetryClient._export_event
+        original_callback = TelemetryClient._telemetry_request_callback
+
+        def export_wrapper(self_client, event):
+            with capture_lock:
+                captured_events.append(event)
+            return original_export(self_client, event)
+
+        def callback_wrapper(self_client, future, sent_count):
+            with capture_lock:
+                captured_futures.append(future)
+            original_callback(self_client, future, sent_count)
+
+        return captured_events, captured_futures, export_wrapper, callback_wrapper
+
+    # ==================== ASSERTION HELPERS ====================
+
+    def assert_system_config(self, event):
+        """Assert system configuration fields"""
+        sys_config = event.entry.sql_driver_log.system_configuration
+        assert sys_config is not None
+
+        # Check all required fields are non-empty
+        for field in ['driver_name', 'driver_version', 'os_name', 'os_version', 
+                      'os_arch', 'runtime_name', 'runtime_version', 'runtime_vendor',
+                      'locale_name', 'char_set_encoding']:
+            value = getattr(sys_config, field)
+            assert value and len(value) > 0, f"{field} should not be None or empty"
+
+        assert sys_config.driver_name == "Databricks SQL Python Connector"
+
+    def assert_connection_params(self, event, expected_http_path=None):
+        """Assert connection parameters"""
+        conn_params = event.entry.sql_driver_log.driver_connection_params
+        assert conn_params is not None
+        assert conn_params.http_path
+        assert conn_params.host_info is not None
+        assert conn_params.auth_mech is not None
+
+        if expected_http_path:
+            assert conn_params.http_path == expected_http_path
+
+        if conn_params.socket_timeout is not None:
+            assert conn_params.socket_timeout > 0
+
+    def assert_statement_execution(self, event):
+        """Assert statement execution details"""
+        sql_op = event.entry.sql_driver_log.sql_operation
+        assert sql_op is not None
+        assert sql_op.statement_type is not None
+        assert sql_op.execution_result is not None
+        assert hasattr(sql_op, "retry_count")
+
+        if sql_op.retry_count is not None:
+            assert sql_op.retry_count >= 0
+
+        latency = event.entry.sql_driver_log.operation_latency_ms
+        assert latency is not None and latency >= 0
+
+    def assert_error_info(self, event, expected_error_name=None):
+        """Assert error information"""
+        error_info = event.entry.sql_driver_log.error_info
+        assert error_info is not None
+        assert error_info.error_name and len(error_info.error_name) > 0
+        assert error_info.stack_trace and len(error_info.stack_trace) > 0
+
+        if expected_error_name:
+            assert error_info.error_name == expected_error_name
+
+    def verify_events(self, captured_events, captured_futures, expected_count):
+        """Common verification for event count and HTTP responses"""
+        if expected_count == 0:
+            assert len(captured_events) == 0, f"Expected 0 events, got {len(captured_events)}"
+            assert len(captured_futures) == 0, f"Expected 0 responses, got {len(captured_futures)}"
+        else:
+            assert len(captured_events) == expected_count, \
+                f"Expected {expected_count} events, got {len(captured_events)}"
+
+            time.sleep(2)
+            done, _ = wait(captured_futures, timeout=10)
+            assert len(done) == expected_count, \
+                f"Expected {expected_count} responses, got {len(done)}"
+
+            for future in done:
+                response = future.result()
+                assert 200 <= response.status < 300
+
+            # Assert common fields for all events
+            for event in captured_events:
+                self.assert_system_config(event)
+                self.assert_connection_params(event, self.arguments["http_path"])
+
+    # ==================== PARAMETERIZED TESTS ====================
+
+    @pytest.mark.parametrize("enable_telemetry,force_enable,expected_count,test_id", [
+        (True, False, 2, "enable_on_force_off"),
+        (False, True, 2, "enable_off_force_on"),
+        (False, False, 0, "both_off"),
+        (None, None, 0, "default_behavior"),
+    ])
+    def test_telemetry_flags(self, telemetry_interceptors, enable_telemetry, 
+                            force_enable, expected_count, test_id):
+        """Test telemetry behavior with different flag combinations"""
+        captured_events, captured_futures, export_wrapper, callback_wrapper = \
+            telemetry_interceptors
+
+        with patch.object(TelemetryClient, "_export_event", export_wrapper), \
+             patch.object(TelemetryClient, "_telemetry_request_callback", callback_wrapper):
+
+            extra_params = {"telemetry_batch_size": 1}
+            if enable_telemetry is not None:
+                extra_params["enable_telemetry"] = enable_telemetry
+            if force_enable is not None:
+                extra_params["force_enable_telemetry"] = force_enable
+
+            with self.connection(extra_params=extra_params) as conn:
+                with conn.cursor() as cursor:
+                    cursor.execute("SELECT 1")
+                    cursor.fetchone()
+
+            self.verify_events(captured_events, captured_futures, expected_count)
+
+            # Assert statement execution on latency event (if events exist)
+            if expected_count > 0:
+                self.assert_statement_execution(captured_events[-1])
+
+    @pytest.mark.parametrize("query,expected_error", [
+        ("SELECT * FROM WHERE INVALID SYNTAX 12345", "ServerOperationError"),
+        ("SELECT * FROM non_existent_table_xyz_12345", None),
+    ])
+    def test_sql_errors(self, telemetry_interceptors, query, expected_error):
+        """Test telemetry captures error information for different SQL errors"""
+        captured_events, captured_futures, export_wrapper, callback_wrapper = \
+            telemetry_interceptors
+
+        with patch.object(TelemetryClient, "_export_event", export_wrapper), \
+             patch.object(TelemetryClient, "_telemetry_request_callback", callback_wrapper):
+
+            with self.connection(extra_params={
+                "force_enable_telemetry": True,
+                "telemetry_batch_size": 1,
+            }) as conn:
+                with conn.cursor() as cursor:
+                    with pytest.raises(Exception):
+                        cursor.execute(query)
+                        cursor.fetchone()
+
+            time.sleep(2)
+            wait(captured_futures, timeout=10)
+
+            assert len(captured_events) >= 1
+
+            # Find event with error_info
+            error_event = next((e for e in captured_events 
+                               if e.entry.sql_driver_log.error_info), None)
+            assert error_event is not None
+
+            self.assert_system_config(error_event)
+            self.assert_connection_params(error_event, self.arguments["http_path"])
+            self.assert_error_info(error_event, expected_error)
+
+    def test_metadata_operation(self, telemetry_interceptors):
+        """Test telemetry for metadata operations (getCatalogs)"""
+        captured_events, captured_futures, export_wrapper, callback_wrapper = \
+            telemetry_interceptors
+
+        with patch.object(TelemetryClient, "_export_event", export_wrapper), \
+             patch.object(TelemetryClient, "_telemetry_request_callback", callback_wrapper):
+
+            with self.connection(extra_params={
+                "force_enable_telemetry": True,
+                "telemetry_batch_size": 1,
+            }) as conn:
+                with conn.cursor() as cursor:
+                    catalogs = cursor.catalogs()
+                    catalogs.fetchall()
+
+            time.sleep(2)
+            wait(captured_futures, timeout=10)
+
+            assert len(captured_events) >= 1
+            for event in captured_events:
+                self.assert_system_config(event)
+                self.assert_connection_params(event, self.arguments["http_path"])
+
+    def test_direct_results(self, telemetry_interceptors):
+        """Test telemetry with direct results (use_cloud_fetch=False)"""
+        captured_events, captured_futures, export_wrapper, callback_wrapper = \
+            telemetry_interceptors
+
+        with patch.object(TelemetryClient, "_export_event", export_wrapper), \
+             patch.object(TelemetryClient, "_telemetry_request_callback", callback_wrapper):
+
+            with self.connection(extra_params={
+                "force_enable_telemetry": True,
+                "telemetry_batch_size": 1,
+                "use_cloud_fetch": False,
+            }) as conn:
+                with conn.cursor() as cursor:
+                    cursor.execute("SELECT 100")
+                    result = cursor.fetchall()
+                    assert len(result) == 1 and result[0][0] == 100
+
+            time.sleep(2)
+            wait(captured_futures, timeout=10)
+
+            assert len(captured_events) >= 2
+            for event in captured_events:
+                self.assert_system_config(event)
+                self.assert_connection_params(event, self.arguments["http_path"])
+
+            self.assert_statement_execution(captured_events[-1])
+
+    @pytest.mark.parametrize("close_type", [
+        "context_manager",
+        "explicit_cursor",
+        "explicit_connection",
+        "implicit_fetchall",
+    ])
+    def test_cloudfetch_with_different_close_patterns(self, telemetry_interceptors, 
+                                                       close_type):
+        """Test telemetry with cloud fetch using different resource closing patterns"""
+        captured_events, captured_futures, export_wrapper, callback_wrapper = \
+            telemetry_interceptors
+
+        with patch.object(TelemetryClient, "_export_event", export_wrapper), \
+             patch.object(TelemetryClient, "_telemetry_request_callback", callback_wrapper):
+
+            if close_type == "explicit_connection":
+                # Test explicit connection close
+                conn = sql.connect(
+                    **self.connection_params(),
+                    force_enable_telemetry=True,
+                    telemetry_batch_size=1,
+                    use_cloud_fetch=True,
+                )
+                cursor = conn.cursor()
+                cursor.execute("SELECT * FROM range(1000)")
+                result = cursor.fetchall()
+                assert len(result) == 1000
+                conn.close()
+            else:
+                # Other patterns use connection context manager
+                with self.connection(extra_params={
+                    "force_enable_telemetry": True,
+                    "telemetry_batch_size": 1,
+                    "use_cloud_fetch": True,
+                }) as conn:
+                    if close_type == "context_manager":
+                        with conn.cursor() as cursor:
+                            cursor.execute("SELECT * FROM range(1000)")
+                            result = cursor.fetchall()
+                            assert len(result) == 1000
+
+                    elif close_type == "explicit_cursor":
+                        cursor = conn.cursor()
+                        cursor.execute("SELECT * FROM range(1000)")
+                        result = cursor.fetchall()
+                        assert len(result) == 1000
+                        cursor.close()
+
+                    elif close_type == "implicit_fetchall":
+                        cursor = conn.cursor()
+                        cursor.execute("SELECT * FROM range(1000)")
+                        result = cursor.fetchall()
+                        assert len(result) == 1000
+
+            time.sleep(2)
+            wait(captured_futures, timeout=10)
+
+            assert len(captured_events) >= 2
+            for event in captured_events:
+                self.assert_system_config(event)
+                self.assert_connection_params(event, self.arguments["http_path"])
+
+            self.assert_statement_execution(captured_events[-1])