diff --git a/CONTRIBUTING.md b/CONTRIBUTING.md
index 1c6a81e85..0628a8516 100644
--- a/CONTRIBUTING.md
+++ b/CONTRIBUTING.md
@@ -23,7 +23,7 @@ The monorepo has the following main projects, each of which correspond to a Java
 These packages power our RAG applications.
 
 - `mongodb-rag-core`: A set of common resources (modules, functions, types, etc.) shared across projects.
-  - You need to recompile `mongodb-rag-core` by running `npm run build` every time you update it for the changes to be accessible in the other projects that dependend on it.
+  - You need to recompile `mongodb-rag-core` by running `npm run build` every time you update it for the changes to be accessible in the other projects that depend on it.
 - `mongodb-rag-ingest`: CLI application that takes data from data sources and converts it to `embedded_content` used by Atlas Vector Search.
 
 ### MongoDB Chatbot Framework
@@ -40,7 +40,7 @@ general, we publish these as reusable packages on npm.
 These packages are our production chatbot. They build on top of the Chatbot
 Framework packages and add MongoDB-specific implementations.
 
-- `chatbot-eval-mongodb-public`: Test suites, evaluators, and reports for the MongoDB AI Chatbot
+- `chatbot-eval-mongodb-public`: Test suites, evaluators, and reports for the MongoDB AI Chatbot.
 - `chatbot-server-mongodb-public`: Chatbot server implementation with our MongoDB-specific configuration.
 - `ingest-mongodb-public`: RAG ingest service configured to ingest MongoDB Docs, DevCenter, MDBU, MongoDB Press, etc.
 
@@ -132,7 +132,7 @@ npm run dev
 
 ## Infrastructure
 
-The projects uses Drone for its CI/CD pipeline. All drone config is located in `.drone.yml`.
+The projects use Drone for their CI/CD pipeline. All drone configs are located in `.drone.yml`.
 
 Applications are deployed on Kubernetes using the Kanopy developer platform.
 Kubernetes/Kanopy configuration are found in the `<deployed project>/environments`
diff --git a/package-lock.json b/package-lock.json
index 98b9135dc..fc113398f 100644
--- a/package-lock.json
+++ b/package-lock.json
@@ -8813,13 +8813,6 @@
         "uuid": "dist/bin/uuid"
       }
     },
-    "node_modules/@langchain/openai/node_modules/@types/node": {
-      "version": "18.19.45",
-      "license": "MIT",
-      "dependencies": {
-        "undici-types": "~5.26.4"
-      }
-    },
     "node_modules/@langchain/openai/node_modules/ansi-styles": {
       "version": "5.2.0",
       "license": "MIT",
@@ -8840,10 +8833,6 @@
         "url": "https://github.com/sponsors/sindresorhus"
       }
     },
-    "node_modules/@langchain/openai/node_modules/form-data-encoder": {
-      "version": "1.7.2",
-      "license": "MIT"
-    },
     "node_modules/@langchain/openai/node_modules/langsmith": {
       "version": "0.1.42",
       "license": "MIT",
@@ -8872,34 +8861,6 @@
         }
       }
     },
-    "node_modules/@langchain/openai/node_modules/openai": {
-      "version": "4.95.0",
-      "license": "Apache-2.0",
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7"
-      },
-      "bin": {
-        "openai": "bin/cli"
-      },
-      "peerDependencies": {
-        "ws": "^8.18.0",
-        "zod": "^3.23.8"
-      },
-      "peerDependenciesMeta": {
-        "ws": {
-          "optional": true
-        },
-        "zod": {
-          "optional": true
-        }
-      }
-    },
     "node_modules/@langchain/openai/node_modules/semver": {
       "version": "7.6.3",
       "license": "ISC",
@@ -14632,6 +14593,12 @@
         "node": ">=18.0.0"
       }
     },
+    "node_modules/@standard-schema/spec": {
+      "version": "1.0.0",
+      "resolved": "https://registry.npmjs.org/@standard-schema/spec/-/spec-1.0.0.tgz",
+      "integrity": "sha512-m2bOd0f2RT9k8QJx1JN85cZYyH1RqFBdlwtkSlf4tBDYLCiiZnv1fIIwacK6cqwXavOydf0NPToMQgpKq+dVlA==",
+      "license": "MIT"
+    },
     "node_modules/@stdlib/array-base-accessor-getter": {
       "version": "0.2.1",
       "license": "Apache-2.0",
@@ -23819,15 +23786,6 @@
         "node": ">=18"
       }
     },
-    "node_modules/braintrust/node_modules/@types/node": {
-      "version": "18.19.43",
-      "license": "MIT",
-      "optional": true,
-      "peer": true,
-      "dependencies": {
-        "undici-types": "~5.26.4"
-      }
-    },
     "node_modules/braintrust/node_modules/ai": {
       "version": "3.4.33",
       "license": "Apache-2.0",
@@ -23933,12 +23891,6 @@
         "@esbuild/win32-x64": "0.25.1"
       }
     },
-    "node_modules/braintrust/node_modules/form-data-encoder": {
-      "version": "1.7.2",
-      "license": "MIT",
-      "optional": true,
-      "peer": true
-    },
     "node_modules/braintrust/node_modules/graceful-fs": {
       "version": "4.2.11",
       "license": "ISC"
@@ -23956,36 +23908,6 @@
         "url": "https://github.com/sponsors/isaacs"
       }
     },
-    "node_modules/braintrust/node_modules/openai": {
-      "version": "4.95.0",
-      "license": "Apache-2.0",
-      "optional": true,
-      "peer": true,
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7"
-      },
-      "bin": {
-        "openai": "bin/cli"
-      },
-      "peerDependencies": {
-        "ws": "^8.18.0",
-        "zod": "^3.23.8"
-      },
-      "peerDependenciesMeta": {
-        "ws": {
-          "optional": true
-        },
-        "zod": {
-          "optional": true
-        }
-      }
-    },
     "node_modules/braintrust/node_modules/source-map": {
       "version": "0.7.4",
       "license": "BSD-3-Clause",
@@ -34208,10 +34130,6 @@
         "node": ">= 12"
       }
     },
-    "node_modules/llamaindex/node_modules/form-data-encoder": {
-      "version": "1.7.2",
-      "license": "MIT"
-    },
     "node_modules/llamaindex/node_modules/js-base64": {
       "version": "3.7.7",
       "license": "BSD-3-Clause"
@@ -34238,63 +34156,6 @@
         "url": "https://opencollective.com/node-fetch"
       }
     },
-    "node_modules/llamaindex/node_modules/openai": {
-      "version": "4.95.0",
-      "license": "Apache-2.0",
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7"
-      },
-      "bin": {
-        "openai": "bin/cli"
-      },
-      "peerDependencies": {
-        "ws": "^8.18.0",
-        "zod": "^3.23.8"
-      },
-      "peerDependenciesMeta": {
-        "ws": {
-          "optional": true
-        },
-        "zod": {
-          "optional": true
-        }
-      }
-    },
-    "node_modules/llamaindex/node_modules/openai/node_modules/@types/node": {
-      "version": "18.19.70",
-      "license": "MIT",
-      "dependencies": {
-        "undici-types": "~5.26.4"
-      }
-    },
-    "node_modules/llamaindex/node_modules/openai/node_modules/node-fetch": {
-      "version": "2.7.0",
-      "license": "MIT",
-      "dependencies": {
-        "whatwg-url": "^5.0.0"
-      },
-      "engines": {
-        "node": "4.x || >=6.0.0"
-      },
-      "peerDependencies": {
-        "encoding": "^0.1.0"
-      },
-      "peerDependenciesMeta": {
-        "encoding": {
-          "optional": true
-        }
-      }
-    },
-    "node_modules/llamaindex/node_modules/openai/node_modules/undici-types": {
-      "version": "5.26.5",
-      "license": "MIT"
-    },
     "node_modules/llamaindex/node_modules/qs": {
       "version": "6.13.1",
       "license": "BSD-3-Clause",
@@ -34331,26 +34192,10 @@
         "safe-buffer": "~5.2.0"
       }
     },
-    "node_modules/llamaindex/node_modules/tr46": {
-      "version": "0.0.3",
-      "license": "MIT"
-    },
     "node_modules/llamaindex/node_modules/undici-types": {
       "version": "6.19.8",
       "license": "MIT"
     },
-    "node_modules/llamaindex/node_modules/webidl-conversions": {
-      "version": "3.0.1",
-      "license": "BSD-2-Clause"
-    },
-    "node_modules/llamaindex/node_modules/whatwg-url": {
-      "version": "5.0.0",
-      "license": "MIT",
-      "dependencies": {
-        "tr46": "~0.0.3",
-        "webidl-conversions": "^3.0.0"
-      }
-    },
     "node_modules/load-json-file": {
       "version": "6.2.0",
       "dev": true,
@@ -41518,20 +41363,47 @@
       }
     },
     "node_modules/openai": {
-      "version": "3.3.0",
-      "license": "MIT",
+      "version": "4.104.0",
+      "resolved": "https://registry.npmjs.org/openai/-/openai-4.104.0.tgz",
+      "integrity": "sha512-p99EFNsA/yX6UhVO93f5kJsDRLAg+CTA2RBqdHK4RtK8u5IJw32Hyb2dTGKbnnFmnuoBv5r7Z2CURI9sGZpSuA==",
       "dependencies": {
-        "axios": "^0.26.0",
-        "form-data": "^4.0.0"
+        "@types/node": "^18.11.18",
+        "@types/node-fetch": "^2.6.4",
+        "abort-controller": "^3.0.0",
+        "agentkeepalive": "^4.2.1",
+        "form-data-encoder": "1.7.2",
+        "formdata-node": "^4.3.2",
+        "node-fetch": "^2.6.7"
+      },
+      "bin": {
+        "openai": "bin/cli"
+      },
+      "peerDependencies": {
+        "ws": "^8.18.0",
+        "zod": "^3.23.8"
+      },
+      "peerDependenciesMeta": {
+        "ws": {
+          "optional": true
+        },
+        "zod": {
+          "optional": true
+        }
       }
     },
-    "node_modules/openai/node_modules/axios": {
-      "version": "0.26.1",
-      "license": "MIT",
+    "node_modules/openai/node_modules/@types/node": {
+      "version": "18.19.112",
+      "resolved": "https://registry.npmjs.org/@types/node/-/node-18.19.112.tgz",
+      "integrity": "sha512-i+Vukt9POdS/MBI7YrrkkI5fMfwFtOjphSmt4WXYLfwqsfr6z/HdCx7LqT9M7JktGob8WNgj8nFB4TbGNE4Cog==",
       "dependencies": {
-        "follow-redirects": "^1.14.8"
+        "undici-types": "~5.26.4"
       }
     },
+    "node_modules/openai/node_modules/form-data-encoder": {
+      "version": "1.7.2",
+      "resolved": "https://registry.npmjs.org/form-data-encoder/-/form-data-encoder-1.7.2.tgz",
+      "integrity": "sha512-qfqtYan3rxrnCk1VYaA4H+Ms9xdpPqvLZa6xmMgFvhO32x7/3J/ExcTd6qpxM0vH2GdMI+poehyBZvqfMTto8A=="
+    },
     "node_modules/openapi-types": {
       "version": "12.1.3",
       "license": "MIT"
@@ -53333,7 +53205,9 @@
       }
     },
     "node_modules/zod": {
-      "version": "3.25.48",
+      "version": "3.25.76",
+      "resolved": "https://registry.npmjs.org/zod/-/zod-3.25.76.tgz",
+      "integrity": "sha512-gzUt/qt81nXsFGKIFcC3YnfEAx5NkunCfnDlvuBSSFS02bcXu4Lmea0AFIUwbLWxWPx3d9p8S5QoaujKcNQxcQ==",
       "license": "MIT",
       "funding": {
         "url": "https://github.com/sponsors/colinhacks"
@@ -53489,10 +53363,6 @@
         "zod-to-json-schema": "^3.22.5"
       }
     },
-    "packages/benchmarks/node_modules/form-data-encoder": {
-      "version": "1.7.2",
-      "license": "MIT"
-    },
     "packages/benchmarks/node_modules/js-yaml": {
       "version": "4.1.0",
       "license": "MIT",
@@ -53507,30 +53377,6 @@
       "version": "1.0.0",
       "license": "MIT"
     },
-    "packages/benchmarks/node_modules/openai": {
-      "version": "4.47.1",
-      "license": "Apache-2.0",
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7",
-        "web-streams-polyfill": "^3.2.1"
-      },
-      "bin": {
-        "openai": "bin/cli"
-      }
-    },
-    "packages/benchmarks/node_modules/openai/node_modules/@types/node": {
-      "version": "18.19.86",
-      "license": "MIT",
-      "dependencies": {
-        "undici-types": "~5.26.4"
-      }
-    },
     "packages/benchmarks/node_modules/yaml": {
       "version": "2.7.1",
       "license": "ISC",
@@ -53545,9 +53391,11 @@
       "version": "0.21.2",
       "license": "Apache-2.0",
       "dependencies": {
+        "@ai-sdk/openai": "^2.0.0-beta.11",
         "@segment/analytics-node": "^2.2.1",
         "@slack/web-api": "^7.8.0",
         "ahocorasick": "^1.0.2",
+        "ai": "^5.0.0-beta.25",
         "common-tags": "^1.8.2",
         "cookie-parser": "^1.4.6",
         "dotenv": "^16.0.3",
@@ -53594,6 +53442,52 @@
         "npm": ">=8"
       }
     },
+    "packages/chatbot-server-mongodb-public/node_modules/@ai-sdk/openai": {
+      "version": "2.0.0-beta.11",
+      "resolved": "https://registry.npmjs.org/@ai-sdk/openai/-/openai-2.0.0-beta.11.tgz",
+      "integrity": "sha512-HQXUMb1V6Xr8EBYvEDwNb8ISyRqyxg2zUst7lzPb6s1nGDKJRBTfSyytNWRL9dZ9vxjM2wK34cltCfZbjaHpAA==",
+      "license": "Apache-2.0",
+      "dependencies": {
+        "@ai-sdk/provider": "2.0.0-beta.1",
+        "@ai-sdk/provider-utils": "3.0.0-beta.5"
+      },
+      "engines": {
+        "node": ">=18"
+      },
+      "peerDependencies": {
+        "zod": "^3.25.76 || ^4"
+      }
+    },
+    "packages/chatbot-server-mongodb-public/node_modules/@ai-sdk/openai/node_modules/@ai-sdk/provider-utils": {
+      "version": "3.0.0-beta.5",
+      "resolved": "https://registry.npmjs.org/@ai-sdk/provider-utils/-/provider-utils-3.0.0-beta.5.tgz",
+      "integrity": "sha512-4Dv/wiGZrvO6fI7P0yMLa4XZru0XW8LPibTObbkHBdweLUVGIze7aCfxxQeY44Uqcbl/h6/yBTkx2XmPtwf/Ow==",
+      "license": "Apache-2.0",
+      "dependencies": {
+        "@ai-sdk/provider": "2.0.0-beta.1",
+        "@standard-schema/spec": "^1.0.0",
+        "eventsource-parser": "^3.0.3",
+        "zod-to-json-schema": "^3.24.1"
+      },
+      "engines": {
+        "node": ">=18"
+      },
+      "peerDependencies": {
+        "zod": "^3.25.76 || ^4"
+      }
+    },
+    "packages/chatbot-server-mongodb-public/node_modules/@ai-sdk/provider": {
+      "version": "2.0.0-beta.1",
+      "resolved": "https://registry.npmjs.org/@ai-sdk/provider/-/provider-2.0.0-beta.1.tgz",
+      "integrity": "sha512-Z8SPncMtS3RsoXITmT7NVwrAq6M44dmw0DoUOYJqNNtCu8iMWuxB8Nxsoqpa0uEEy9R1V1ZThJAXTYgjTUxl3w==",
+      "license": "Apache-2.0",
+      "dependencies": {
+        "json-schema": "^0.4.0"
+      },
+      "engines": {
+        "node": ">=18"
+      }
+    },
     "packages/chatbot-server-mongodb-public/node_modules/@types/express-serve-static-core": {
       "version": "5.0.6",
       "dev": true,
@@ -53605,6 +53499,70 @@
         "@types/send": "*"
       }
     },
+    "packages/chatbot-server-mongodb-public/node_modules/ai": {
+      "version": "5.0.0-beta.25",
+      "resolved": "https://registry.npmjs.org/ai/-/ai-5.0.0-beta.25.tgz",
+      "integrity": "sha512-pbfFqtQvz7hiDw6TwUH75CK9FgrZFBsxqbW4yW0aqluHw3nRbhf0w1u2AMiYgvWMy8Xf8TkBbMtY4vyMc4neeA==",
+      "license": "Apache-2.0",
+      "dependencies": {
+        "@ai-sdk/gateway": "1.0.0-beta.11",
+        "@ai-sdk/provider": "2.0.0-beta.1",
+        "@ai-sdk/provider-utils": "3.0.0-beta.5",
+        "@opentelemetry/api": "1.9.0"
+      },
+      "bin": {
+        "ai": "dist/bin/ai.min.js"
+      },
+      "engines": {
+        "node": ">=18"
+      },
+      "peerDependencies": {
+        "zod": "^3.25.76 || ^4"
+      }
+    },
+    "packages/chatbot-server-mongodb-public/node_modules/ai/node_modules/@ai-sdk/gateway": {
+      "version": "1.0.0-beta.11",
+      "resolved": "https://registry.npmjs.org/@ai-sdk/gateway/-/gateway-1.0.0-beta.11.tgz",
+      "integrity": "sha512-dnRUPzSLvp3xvIx6M4FIz4ht8dfL8JkPKwH+akj10im4zbxUii3c3TQ3BJLRdx2Gq/SeljE9H0dX7PDtVyIrbQ==",
+      "license": "Apache-2.0",
+      "dependencies": {
+        "@ai-sdk/provider": "2.0.0-beta.1",
+        "@ai-sdk/provider-utils": "3.0.0-beta.5"
+      },
+      "engines": {
+        "node": ">=18"
+      },
+      "peerDependencies": {
+        "zod": "^3.25.76 || ^4"
+      }
+    },
+    "packages/chatbot-server-mongodb-public/node_modules/ai/node_modules/@ai-sdk/provider-utils": {
+      "version": "3.0.0-beta.5",
+      "resolved": "https://registry.npmjs.org/@ai-sdk/provider-utils/-/provider-utils-3.0.0-beta.5.tgz",
+      "integrity": "sha512-4Dv/wiGZrvO6fI7P0yMLa4XZru0XW8LPibTObbkHBdweLUVGIze7aCfxxQeY44Uqcbl/h6/yBTkx2XmPtwf/Ow==",
+      "license": "Apache-2.0",
+      "dependencies": {
+        "@ai-sdk/provider": "2.0.0-beta.1",
+        "@standard-schema/spec": "^1.0.0",
+        "eventsource-parser": "^3.0.3",
+        "zod-to-json-schema": "^3.24.1"
+      },
+      "engines": {
+        "node": ">=18"
+      },
+      "peerDependencies": {
+        "zod": "^3.25.76 || ^4"
+      }
+    },
+    "packages/chatbot-server-mongodb-public/node_modules/eventsource-parser": {
+      "version": "3.0.3",
+      "resolved": "https://registry.npmjs.org/eventsource-parser/-/eventsource-parser-3.0.3.tgz",
+      "integrity": "sha512-nVpZkTMM9rF6AQ9gPJpFsNAMt48wIzB5TQgiTLdHiuO8XEDhUgZEhqKlZWXbIzo9VmJ/HvysHqEaVeD5v9TPvA==",
+      "license": "MIT",
+      "engines": {
+        "node": ">=20.0.0"
+      }
+    },
     "packages/datasets": {
       "version": "1.1.2",
       "license": "ISC",
@@ -54591,11 +54549,11 @@
         "langchain": "^0.2.9",
         "lodash.clonedeep": "^4.5.0",
         "mongodb-rag-core": "*",
-        "openai": "^3.2.1",
         "pm2": "^5.3.0",
         "rate-limit-mongo": "^2.3.2",
         "stream-json": "^1.8.0",
         "winston": "^3.9.0",
+        "zod": "^3.25.67",
         "zod-error": "^1.5.0"
       },
       "devDependencies": {
@@ -54696,36 +54654,6 @@
         "uuid": "dist/bin/uuid"
       }
     },
-    "packages/mongodb-chatbot-server/node_modules/@langchain/core/node_modules/openai": {
-      "version": "4.95.0",
-      "license": "Apache-2.0",
-      "optional": true,
-      "peer": true,
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7"
-      },
-      "bin": {
-        "openai": "bin/cli"
-      },
-      "peerDependencies": {
-        "ws": "^8.18.0",
-        "zod": "^3.23.8"
-      },
-      "peerDependenciesMeta": {
-        "ws": {
-          "optional": true
-        },
-        "zod": {
-          "optional": true
-        }
-      }
-    },
     "packages/mongodb-chatbot-server/node_modules/@langchain/core/node_modules/uuid": {
       "version": "10.0.0",
       "funding": [
@@ -54737,15 +54665,6 @@
         "uuid": "dist/bin/uuid"
       }
     },
-    "packages/mongodb-chatbot-server/node_modules/@types/node": {
-      "version": "18.19.86",
-      "license": "MIT",
-      "optional": true,
-      "peer": true,
-      "dependencies": {
-        "undici-types": "~5.26.4"
-      }
-    },
     "packages/mongodb-chatbot-server/node_modules/ansi-styles": {
       "version": "5.2.0",
       "license": "MIT",
@@ -54770,12 +54689,6 @@
         "url": "https://github.com/sponsors/sindresorhus"
       }
     },
-    "packages/mongodb-chatbot-server/node_modules/form-data-encoder": {
-      "version": "1.7.2",
-      "license": "MIT",
-      "optional": true,
-      "peer": true
-    },
     "packages/mongodb-chatbot-server/node_modules/ip-address": {
       "version": "8.1.0",
       "license": "MIT",
@@ -55063,36 +54976,6 @@
         "uuid": "dist/bin/uuid"
       }
     },
-    "packages/mongodb-chatbot-server/node_modules/langchain/node_modules/openai": {
-      "version": "4.95.0",
-      "license": "Apache-2.0",
-      "optional": true,
-      "peer": true,
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7"
-      },
-      "bin": {
-        "openai": "bin/cli"
-      },
-      "peerDependencies": {
-        "ws": "^8.18.0",
-        "zod": "^3.23.8"
-      },
-      "peerDependenciesMeta": {
-        "ws": {
-          "optional": true
-        },
-        "zod": {
-          "optional": true
-        }
-      }
-    },
     "packages/mongodb-chatbot-server/node_modules/langchain/node_modules/uuid": {
       "version": "10.0.0",
       "funding": [
@@ -57393,7 +57276,7 @@
         "ignore": "^5.3.2",
         "langchain": "^0.3.5",
         "mongodb": "^6.3.0",
-        "openai": "^4.95.0",
+        "openai": "^5.9.1",
         "rimraf": "^6.0.1",
         "simple-git": "^3.27.0",
         "toml": "^3.0.0",
@@ -58011,6 +57894,45 @@
         "@langchain/core": ">=0.2.26 <0.4.0"
       }
     },
+    "packages/mongodb-rag-core/node_modules/@langchain/openai/node_modules/@types/node": {
+      "version": "18.19.120",
+      "resolved": "https://registry.npmjs.org/@types/node/-/node-18.19.120.tgz",
+      "integrity": "sha512-WtCGHFXnVI8WHLxDAt5TbnCM4eSE+nI0QN2NJtwzcgMhht2eNz6V9evJrk+lwC8bCY8OWV5Ym8Jz7ZEyGnKnMA==",
+      "license": "MIT",
+      "dependencies": {
+        "undici-types": "~5.26.4"
+      }
+    },
+    "packages/mongodb-rag-core/node_modules/@langchain/openai/node_modules/openai": {
+      "version": "4.104.0",
+      "resolved": "https://registry.npmjs.org/openai/-/openai-4.104.0.tgz",
+      "integrity": "sha512-p99EFNsA/yX6UhVO93f5kJsDRLAg+CTA2RBqdHK4RtK8u5IJw32Hyb2dTGKbnnFmnuoBv5r7Z2CURI9sGZpSuA==",
+      "license": "Apache-2.0",
+      "dependencies": {
+        "@types/node": "^18.11.18",
+        "@types/node-fetch": "^2.6.4",
+        "abort-controller": "^3.0.0",
+        "agentkeepalive": "^4.2.1",
+        "form-data-encoder": "1.7.2",
+        "formdata-node": "^4.3.2",
+        "node-fetch": "^2.6.7"
+      },
+      "bin": {
+        "openai": "bin/cli"
+      },
+      "peerDependencies": {
+        "ws": "^8.18.0",
+        "zod": "^3.23.8"
+      },
+      "peerDependenciesMeta": {
+        "ws": {
+          "optional": true
+        },
+        "zod": {
+          "optional": true
+        }
+      }
+    },
     "packages/mongodb-rag-core/node_modules/@types/jest": {
       "version": "26.0.24",
       "dev": true,
@@ -58248,17 +58170,10 @@
       }
     },
     "packages/mongodb-rag-core/node_modules/openai": {
-      "version": "4.95.0",
+      "version": "5.10.1",
+      "resolved": "https://registry.npmjs.org/openai/-/openai-5.10.1.tgz",
+      "integrity": "sha512-fq6xVfv1/gpLbsj8fArEt3b6B9jBxdhAK+VJ+bDvbUvNd+KTLlA3bnDeYZaBsGH9LUhJ1M1yXfp9sEyBLMx6eA==",
       "license": "Apache-2.0",
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7"
-      },
       "bin": {
         "openai": "bin/cli"
       },
@@ -58275,13 +58190,6 @@
         }
       }
     },
-    "packages/mongodb-rag-core/node_modules/openai/node_modules/@types/node": {
-      "version": "18.19.61",
-      "license": "MIT",
-      "dependencies": {
-        "undici-types": "~5.26.4"
-      }
-    },
     "packages/mongodb-rag-core/node_modules/path-scurry": {
       "version": "2.0.0",
       "license": "BlueOak-1.0.0",
@@ -60636,45 +60544,6 @@
         "uuid": "dist/bin/uuid"
       }
     },
-    "packages/release-notes-generator/node_modules/openai": {
-      "version": "4.104.0",
-      "resolved": "https://registry.npmjs.org/openai/-/openai-4.104.0.tgz",
-      "integrity": "sha512-p99EFNsA/yX6UhVO93f5kJsDRLAg+CTA2RBqdHK4RtK8u5IJw32Hyb2dTGKbnnFmnuoBv5r7Z2CURI9sGZpSuA==",
-      "license": "Apache-2.0",
-      "dependencies": {
-        "@types/node": "^18.11.18",
-        "@types/node-fetch": "^2.6.4",
-        "abort-controller": "^3.0.0",
-        "agentkeepalive": "^4.2.1",
-        "form-data-encoder": "1.7.2",
-        "formdata-node": "^4.3.2",
-        "node-fetch": "^2.6.7"
-      },
-      "bin": {
-        "openai": "bin/cli"
-      },
-      "peerDependencies": {
-        "ws": "^8.18.0",
-        "zod": "^3.23.8"
-      },
-      "peerDependenciesMeta": {
-        "ws": {
-          "optional": true
-        },
-        "zod": {
-          "optional": true
-        }
-      }
-    },
-    "packages/release-notes-generator/node_modules/openai/node_modules/@types/node": {
-      "version": "18.19.112",
-      "resolved": "https://registry.npmjs.org/@types/node/-/node-18.19.112.tgz",
-      "integrity": "sha512-i+Vukt9POdS/MBI7YrrkkI5fMfwFtOjphSmt4WXYLfwqsfr6z/HdCx7LqT9M7JktGob8WNgj8nFB4TbGNE4Cog==",
-      "license": "MIT",
-      "dependencies": {
-        "undici-types": "~5.26.4"
-      }
-    },
     "packages/release-notes-generator/node_modules/path-scurry": {
       "version": "2.0.0",
       "resolved": "https://registry.npmjs.org/path-scurry/-/path-scurry-2.0.0.tgz",
diff --git a/packages/chatbot-server-mongodb-public/package.json b/packages/chatbot-server-mongodb-public/package.json
index 8fc9de8ec..9acc3bc77 100644
--- a/packages/chatbot-server-mongodb-public/package.json
+++ b/packages/chatbot-server-mongodb-public/package.json
@@ -27,9 +27,11 @@
     "generate-eval-cases": "ts-node src/eval/bin/generateEvalCasesYamlFromCSV.ts"
   },
   "dependencies": {
+    "@ai-sdk/openai": "^2.0.0-beta.11",
     "@segment/analytics-node": "^2.2.1",
     "@slack/web-api": "^7.8.0",
     "ahocorasick": "^1.0.2",
+    "ai": "^5.0.0-beta.25",
     "common-tags": "^1.8.2",
     "cookie-parser": "^1.4.6",
     "dotenv": "^16.0.3",
diff --git a/packages/chatbot-server-mongodb-public/src/config.ts b/packages/chatbot-server-mongodb-public/src/config.ts
index 5bb7fa705..0b0b67808 100644
--- a/packages/chatbot-server-mongodb-public/src/config.ts
+++ b/packages/chatbot-server-mongodb-public/src/config.ts
@@ -19,6 +19,7 @@ import {
   defaultCreateConversationCustomData,
   defaultAddMessageToConversationCustomData,
   makeVerifiedAnswerGenerateResponse,
+  addMessageToConversationVerifiedAnswerStream,
 } from "mongodb-chatbot-server";
 import cookieParser from "cookie-parser";
 import { blockGetRequests } from "./middleware/blockGetRequests";
@@ -40,7 +41,6 @@ import {
 import { AzureOpenAI } from "mongodb-rag-core/openai";
 import { MongoClient } from "mongodb-rag-core/mongodb";
 import {
-  ANALYZER_ENV_VARS,
   AZURE_OPENAI_ENV_VARS,
   PREPROCESSOR_ENV_VARS,
   TRACING_ENV_VARS,
@@ -53,7 +53,10 @@ import {
 import { useSegmentIds } from "./middleware/useSegmentIds";
 import { makeSearchTool } from "./tools/search";
 import { makeMongoDbInputGuardrail } from "./processors/mongoDbInputGuardrail";
-import { makeGenerateResponseWithSearchTool } from "./processors/generateResponseWithSearchTool";
+import {
+  addMessageToConversationStream,
+  makeGenerateResponseWithSearchTool,
+} from "./processors/generateResponseWithSearchTool";
 import { makeBraintrustLogger } from "mongodb-rag-core/braintrust";
 import { makeMongoDbScrubbedMessageStore } from "./tracing/scrubbedMessages/MongoDbScrubbedMessageStore";
 import { MessageAnalysis } from "./tracing/scrubbedMessages/analyzeMessage";
@@ -231,6 +234,7 @@ export const generateResponse = wrapTraced(
         references: verifiedAnswer.references.map(addReferenceSourceType),
       };
     },
+    stream: addMessageToConversationVerifiedAnswerStream,
     onNoVerifiedAnswerFound: wrapTraced(
       makeGenerateResponseWithSearchTool({
         languageModel,
@@ -253,6 +257,7 @@ export const generateResponse = wrapTraced(
         searchTool: makeSearchTool(findContent),
         toolChoice: "auto",
         maxSteps: 5,
+        stream: addMessageToConversationStream,
       }),
       { name: "generateResponseWithSearchTool" }
     ),
@@ -386,6 +391,15 @@ export const config: AppConfig = {
     maxInputLengthCharacters: 3000,
     braintrustLogger,
   },
+  responsesRouterConfig: {
+    createResponse: {
+      conversations,
+      generateResponse,
+      supportedModels: ["mongodb-chat-latest"],
+      maxOutputTokens: 4000,
+      maxUserMessagesInConversation: 6,
+    },
+  },
   maxRequestTimeoutMs: 60000,
   corsOptions: {
     origin: allowedOrigins,
diff --git a/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.test.ts b/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.test.ts
index 3951d8141..723998986 100644
--- a/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.test.ts
+++ b/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.test.ts
@@ -351,18 +351,21 @@ describe("generateResponseWithSearchTool", () => {
     describe("streaming mode", () => {
       // Create a mock DataStreamer implementation
       const makeMockDataStreamer = () => {
-        const mockStreamData = jest.fn();
         const mockConnect = jest.fn();
         const mockDisconnect = jest.fn();
+        const mockStreamData = jest.fn();
+        const mockStreamResponses = jest.fn();
         const mockStream = jest.fn().mockImplementation(async () => {
           // Process the stream and return a string result
           return "Hello";
         });
+
         const dataStreamer = {
           connected: false,
           connect: mockConnect,
           disconnect: mockDisconnect,
           streamData: mockStreamData,
+          streamResponses: mockStreamResponses,
           stream: mockStream,
         } as DataStreamer;
 
diff --git a/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.ts b/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.ts
index 074184d5d..785f9977d 100644
--- a/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.ts
+++ b/packages/chatbot-server-mongodb-public/src/processors/generateResponseWithSearchTool.ts
@@ -6,12 +6,9 @@ import {
   AssistantMessage,
   ToolMessage,
 } from "mongodb-rag-core";
-
 import {
   CoreAssistantMessage,
   CoreMessage,
-  LanguageModel,
-  streamText,
   ToolCallPart,
   ToolChoice,
   ToolSet,
@@ -28,19 +25,25 @@ import {
   GenerateResponse,
   GenerateResponseReturnValue,
   InputGuardrailResult,
+  type StreamFunction,
 } from "mongodb-chatbot-server";
 import {
   MongoDbSearchToolArgs,
   SEARCH_TOOL_NAME,
   SearchTool,
 } from "../tools/search";
+// Using v5-beta version of ai-sdk for new functionality.
+// Refer to annoucement for more info https://v5.ai-sdk.dev/docs/announcing-ai-sdk-5-beta#announcing-ai-sdk-5-beta
+// Specifically, the new stopWhen option is useful
+import { streamText, LanguageModel, hasToolCall } from "ai";
 
+export type MakeSystemPrompt = (customSystemPrompt?: string) => SystemMessage;
 export interface GenerateResponseWithSearchToolParams {
   languageModel: LanguageModel;
   llmNotWorkingMessage: string;
   llmRefusalMessage: string;
   inputGuardrail?: InputGuardrail;
-  systemMessage: SystemMessage;
+  systemMessage: MakeSystemPrompt;
   filterPreviousMessages?: FilterPreviousMessages;
   /**
     Required tool for performing content search and gathering {@link References}
@@ -52,8 +55,59 @@ export interface GenerateResponseWithSearchToolParams {
     search_content: SearchTool;
   }>;
   searchTool: SearchTool;
+  stream?: {
+    onLlmNotWorking: StreamFunction<{ notWorkingMessage: string }>;
+    onLlmRefusal: StreamFunction<{ refusalMessage: string }>;
+    onReferenceLinks: StreamFunction<{ references: References }>;
+    onTextDelta: StreamFunction<{ delta: string }>;
+  };
 }
 
+export const addMessageToConversationStream: GenerateResponseWithSearchToolParams["stream"] =
+  {
+    onLlmNotWorking({ dataStreamer, notWorkingMessage }) {
+      dataStreamer?.streamData({
+        type: "delta",
+        data: notWorkingMessage,
+      });
+    },
+    onLlmRefusal({ dataStreamer, refusalMessage }) {
+      dataStreamer?.streamData({
+        type: "delta",
+        data: refusalMessage,
+      });
+    },
+    onReferenceLinks({ dataStreamer, references }) {
+      dataStreamer?.streamData({
+        type: "references",
+        data: references,
+      });
+    },
+    onTextDelta({ dataStreamer, delta }) {
+      dataStreamer?.streamData({
+        type: "delta",
+        data: delta,
+      });
+    },
+  };
+
+// TODO: implement this
+export const responsesApiStream: GenerateResponseWithSearchToolParams["stream"] =
+  {
+    onLlmNotWorking() {
+      throw new Error("not yet implemented");
+    },
+    onLlmRefusal() {
+      throw new Error("not yet implemented");
+    },
+    onReferenceLinks() {
+      throw new Error("not yet implemented");
+    },
+    onTextDelta() {
+      throw new Error("not yet implemented");
+    },
+  };
+
 /**
   Generate chatbot response using RAG and a search tool named {@link SEARCH_TOOL_NAME}.
  */
@@ -69,6 +123,7 @@ export function makeGenerateResponseWithSearchTool({
   maxSteps = 2,
   searchTool,
   toolChoice,
+  stream,
 }: GenerateResponseWithSearchToolParams): GenerateResponse {
   return async function generateResponseWithSearchTool({
     conversation,
@@ -79,10 +134,14 @@ export function makeGenerateResponseWithSearchTool({
     reqId,
     dataStreamer,
     request,
+    customSystemPrompt,
+    tools,
   }) {
-    if (shouldStream) {
-      assert(dataStreamer, "dataStreamer is required for streaming");
-    }
+    const streamingModeActive =
+      shouldStream === true &&
+      dataStreamer !== undefined &&
+      stream !== undefined;
+
     const userMessage: UserMessage = {
       role: "user",
       content: latestMessageText,
@@ -98,12 +157,13 @@ export function makeGenerateResponseWithSearchTool({
       const toolSet = {
         [SEARCH_TOOL_NAME]: searchTool,
         ...(additionalTools ?? {}),
+        // TODO: get the client-defined tools into here
       } satisfies ToolSet;
 
       const generationArgs = {
         model: languageModel,
         messages: [
-          systemMessage,
+          systemMessage(customSystemPrompt),
           ...filteredPreviousMessages,
           userMessage,
         ] satisfies CoreMessage[],
@@ -122,6 +182,8 @@ export function makeGenerateResponseWithSearchTool({
             reqId,
             dataStreamer,
             request,
+            tools,
+            customSystemPrompt,
           })
         : undefined;
 
@@ -147,6 +209,11 @@ export function makeGenerateResponseWithSearchTool({
           const result = streamText({
             ...generationArgs,
             abortSignal: generationController.signal,
+            // Something like this. refer to https://v5.ai-sdk.dev/docs/announcing-ai-sdk-5-beta#announcing-ai-sdk-5-beta
+            // Want to stop the generation after the client-defined tool is called
+            // But continue after the search tool
+            stopWhen: tools.map((tool) => hasToolCall(tool.name)),
+
             onStepFinish: async ({ toolResults, toolCalls }) => {
               toolCalls?.forEach((toolCall) => {
                 if (toolCall.toolName === SEARCH_TOOL_NAME) {
@@ -179,10 +246,10 @@ export function makeGenerateResponseWithSearchTool({
 
             switch (chunk.type) {
               case "text-delta":
-                if (shouldStream) {
-                  dataStreamer?.streamData({
-                    data: chunk.textDelta,
-                    type: "delta",
+                if (streamingModeActive) {
+                  stream.onTextDelta({
+                    dataStreamer,
+                    delta: chunk.textDelta,
                   });
                 }
                 break;
@@ -202,10 +269,10 @@ export function makeGenerateResponseWithSearchTool({
 
           // Stream references if we have any and weren't aborted
           if (references.length > 0 && !generationController.signal.aborted) {
-            if (shouldStream) {
-              dataStreamer?.streamData({
-                data: references,
-                type: "references",
+            if (streamingModeActive) {
+              stream.onReferenceLinks({
+                dataStreamer,
+                references,
               });
             }
           }
@@ -238,10 +305,10 @@ export function makeGenerateResponseWithSearchTool({
           ...userMessageCustomData,
           ...guardrailResult,
         };
-        if (shouldStream) {
-          dataStreamer?.streamData({
-            type: "delta",
-            data: llmRefusalMessage,
+        if (streamingModeActive) {
+          stream.onLlmRefusal({
+            dataStreamer,
+            refusalMessage: llmRefusalMessage,
           });
         }
         return handleReturnGeneration({
@@ -293,10 +360,10 @@ export function makeGenerateResponseWithSearchTool({
         });
       }
     } catch (error: unknown) {
-      if (shouldStream) {
-        dataStreamer?.streamData({
-          type: "delta",
-          data: llmNotWorkingMessage,
+      if (streamingModeActive) {
+        stream.onLlmNotWorking({
+          dataStreamer,
+          notWorkingMessage: llmNotWorkingMessage,
         });
       }
 
diff --git a/packages/chatbot-server-mongodb-public/src/processors/makeResponesSystemPrompt.ts b/packages/chatbot-server-mongodb-public/src/processors/makeResponesSystemPrompt.ts
new file mode 100644
index 000000000..c6efd59cc
--- /dev/null
+++ b/packages/chatbot-server-mongodb-public/src/processors/makeResponesSystemPrompt.ts
@@ -0,0 +1,24 @@
+import { systemPrompt } from "../systemPrompt";
+import { MakeSystemPrompt } from "./generateResponseWithSearchTool";
+
+// TODO: will need to evalute this new prompt works as expected
+export const makeResponsesSystemPrompt: MakeSystemPrompt = (
+  customSystemPrompt
+) => {
+  if (!customSystemPrompt) {
+    return systemPrompt;
+  } else {
+    return {
+      role: "system",
+      content: `
+Always adhere to the <meta-system-prompt>. This is your core behavior.
+The developer has also provided a <custom-system-prompt>. Follow these instructions as well.
+<meta-system-prompt>
+${systemPrompt.content}
+</meta-system-prompt>
+<custom-system-prompt>
+${customSystemPrompt}
+</custom-system-prompt>`,
+    };
+  }
+};
diff --git a/packages/chatbot-server-mongodb-public/src/processors/mongoDbInputGuardrail.ts b/packages/chatbot-server-mongodb-public/src/processors/mongoDbInputGuardrail.ts
index c9e565835..996011c32 100644
--- a/packages/chatbot-server-mongodb-public/src/processors/mongoDbInputGuardrail.ts
+++ b/packages/chatbot-server-mongodb-public/src/processors/mongoDbInputGuardrail.ts
@@ -206,12 +206,20 @@ ${JSON.stringify(examplePair.output, null, 2)}
 export interface MakeUserMessageMongoDbGuardrailParams {
   model: LanguageModelV1;
 }
+// TODO: will need to evalute this new flow works as expected
 export const makeMongoDbInputGuardrail = ({
   model,
 }: MakeUserMessageMongoDbGuardrailParams) => {
   const userMessageMongoDbGuardrail: InputGuardrail = async ({
     latestMessageText,
+    customSystemPrompt,
+    tools,
   }) => {
+    const userMessage = makeInputGuardrailUserMessage({
+      latestMessageText,
+      customSystemPrompt,
+      tools,
+    });
     const {
       object: { type, reasoning },
     } = await generateObject({
@@ -219,10 +227,7 @@ export const makeMongoDbInputGuardrail = ({
       schema: UserMessageMongoDbGuardrailFunctionSchema,
       schemaDescription: inputGuardrailMetadata.description,
       schemaName: inputGuardrailMetadata.name,
-      messages: [
-        { role: "system", content: systemPrompt },
-        { role: "user" as const, content: latestMessageText },
-      ],
+      messages: [{ role: "system", content: systemPrompt }, userMessage],
       mode: "json",
     });
     const rejected = type === "irrelevant" || type === "inappropriate";
@@ -234,3 +239,28 @@ export const makeMongoDbInputGuardrail = ({
   };
   return userMessageMongoDbGuardrail;
 };
+
+function makeInputGuardrailUserMessage({
+  latestMessageText,
+  customSystemPrompt,
+  tools,
+}: Pick<
+  GenerateResponseParams,
+  "latestMessageText" | "customSystemPrompt" | "tools"
+>) {
+  if (!customSystemPrompt && !tools) {
+    return {
+      role: "user" as const,
+      content: latestMessageText,
+    };
+  } else {
+    return {
+      role: "user" as const,
+      content: `<latest-user-message>${latestMessageText}</latest-user-message>${
+        customSystemPrompt
+          ? `<custom-system-prompt>${customSystemPrompt}</custom-system-prompt>`
+          : ""
+      }${tools ? `<tools>${tools}</tools>` : ""}`,
+    };
+  }
+}
diff --git a/packages/chatbot-server-mongodb-public/src/test/testHelpers.ts b/packages/chatbot-server-mongodb-public/src/test/testHelpers.ts
index eab861ff3..dcbacb139 100644
--- a/packages/chatbot-server-mongodb-public/src/test/testHelpers.ts
+++ b/packages/chatbot-server-mongodb-public/src/test/testHelpers.ts
@@ -64,7 +64,6 @@ export async function makeTestApp(defaultConfigOverrides?: Partial<AppConfig>) {
 
 export { systemPrompt };
 export {
-  generateUserPrompt,
   openAiClient,
   OPENAI_CHAT_COMPLETION_DEPLOYMENT,
   OPENAI_RETRIEVAL_EMBEDDING_DEPLOYMENT,
diff --git a/packages/mongodb-chatbot-server/package.json b/packages/mongodb-chatbot-server/package.json
index a7e10a4d4..1b996953f 100644
--- a/packages/mongodb-chatbot-server/package.json
+++ b/packages/mongodb-chatbot-server/package.json
@@ -50,11 +50,11 @@
     "langchain": "^0.2.9",
     "lodash.clonedeep": "^4.5.0",
     "mongodb-rag-core": "*",
-    "openai": "^3.2.1",
     "pm2": "^5.3.0",
     "rate-limit-mongo": "^2.3.2",
     "stream-json": "^1.8.0",
     "winston": "^3.9.0",
+    "zod": "^3.25.67",
     "zod-error": "^1.5.0"
   },
   "devDependencies": {
diff --git a/packages/mongodb-chatbot-server/src/app.ts b/packages/mongodb-chatbot-server/src/app.ts
index c2ae01a5e..41626dd5c 100644
--- a/packages/mongodb-chatbot-server/src/app.ts
+++ b/packages/mongodb-chatbot-server/src/app.ts
@@ -11,7 +11,9 @@ import "dotenv/config";
 import {
   ConversationsRouterParams,
   makeConversationsRouter,
-} from "./routes/conversations/conversationsRouter";
+  ResponsesRouterParams,
+  makeResponsesRouter,
+} from "./routes";
 import { logger } from "mongodb-rag-core";
 import { ObjectId } from "mongodb-rag-core/mongodb";
 import { getRequestId, logRequest, sendErrorResponse } from "./utils";
@@ -27,6 +29,11 @@ export interface AppConfig {
    */
   conversationsRouterConfig: ConversationsRouterParams;
 
+  /**
+    Configuration for the responses router.
+   */
+  responsesRouterConfig: ResponsesRouterParams;
+
   /**
     Maximum time in milliseconds for a request to complete before timing out.
     Defaults to 60000 (1 minute).
@@ -116,6 +123,7 @@ export const makeApp = async (config: AppConfig): Promise<Express> => {
   const {
     maxRequestTimeoutMs = DEFAULT_MAX_REQUEST_TIMEOUT_MS,
     conversationsRouterConfig,
+    responsesRouterConfig,
     corsOptions,
     apiPrefix = DEFAULT_API_PREFIX,
     expressAppConfig,
@@ -140,6 +148,7 @@ export const makeApp = async (config: AppConfig): Promise<Express> => {
     `${apiPrefix}/conversations`,
     makeConversationsRouter(conversationsRouterConfig)
   );
+  app.use(`${apiPrefix}/responses`, makeResponsesRouter(responsesRouterConfig));
 
   app.get("/health", (_req, res) => {
     const data = {
diff --git a/packages/mongodb-chatbot-server/src/processors/GenerateResponse.ts b/packages/mongodb-chatbot-server/src/processors/GenerateResponse.ts
index 8036319f1..b4f0ed59f 100644
--- a/packages/mongodb-chatbot-server/src/processors/GenerateResponse.ts
+++ b/packages/mongodb-chatbot-server/src/processors/GenerateResponse.ts
@@ -7,6 +7,7 @@ import {
   UserMessage,
 } from "mongodb-rag-core";
 import { Request as ExpressRequest } from "express";
+import { OpenAI } from "mongodb-rag-core/openai";
 
 export type ClientContext = Record<string, unknown>;
 
@@ -19,6 +20,8 @@ export interface GenerateResponseParams {
   reqId: string;
   conversation: Conversation;
   request?: ExpressRequest;
+  customSystemPrompt?: string;
+  toolDefinitions?: OpenAI.FunctionDefinition[];
 }
 
 export interface GenerateResponseReturnValue {
diff --git a/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.test.ts b/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.test.ts
index c5618c9d2..90d005c1f 100644
--- a/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.test.ts
+++ b/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.test.ts
@@ -1,5 +1,8 @@
 import { ObjectId } from "mongodb-rag-core/mongodb";
-import { makeVerifiedAnswerGenerateResponse } from "./makeVerifiedAnswerGenerateResponse";
+import {
+  makeVerifiedAnswerGenerateResponse,
+  type StreamFunction,
+} from "./makeVerifiedAnswerGenerateResponse";
 import { VerifiedAnswer, WithScore, DataStreamer } from "mongodb-rag-core";
 import { GenerateResponseReturnValue } from "./GenerateResponse";
 
@@ -24,6 +27,29 @@ describe("makeVerifiedAnswerGenerateResponse", () => {
     },
   ] satisfies GenerateResponseReturnValue["messages"];
 
+  const streamVerifiedAnswer: StreamFunction<{
+    verifiedAnswer: VerifiedAnswer;
+  }> = async ({ dataStreamer, verifiedAnswer }) => {
+    dataStreamer.streamData({
+      type: "metadata",
+      data: {
+        verifiedAnswer: {
+          _id: verifiedAnswer._id,
+          created: verifiedAnswer.created,
+          updated: verifiedAnswer.updated,
+        },
+      },
+    });
+    dataStreamer.streamData({
+      type: "delta",
+      data: verifiedAnswer.answer,
+    });
+    dataStreamer.streamData({
+      type: "references",
+      data: verifiedAnswer.references,
+    });
+  };
+
   // Create a mock verified answer
   const createMockVerifiedAnswer = (): WithScore<VerifiedAnswer> => ({
     answer: verifiedAnswerContent,
@@ -55,6 +81,7 @@ describe("makeVerifiedAnswerGenerateResponse", () => {
     connect: jest.fn(),
     disconnect: jest.fn(),
     stream: jest.fn(),
+    streamResponses: jest.fn(),
   });
 
   // Create base request parameters
@@ -79,6 +106,9 @@ describe("makeVerifiedAnswerGenerateResponse", () => {
     onNoVerifiedAnswerFound: async () => ({
       messages: noVerifiedAnswerFoundMessages,
     }),
+    stream: {
+      onVerifiedAnswerFound: streamVerifiedAnswer,
+    },
   });
 
   it("uses onNoVerifiedAnswerFound if no verified answer is found", async () => {
diff --git a/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.ts b/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.ts
index 01d3be4f6..d8df30147 100644
--- a/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.ts
+++ b/packages/mongodb-chatbot-server/src/processors/makeVerifiedAnswerGenerateResponse.ts
@@ -1,4 +1,8 @@
-import { VerifiedAnswer, FindVerifiedAnswerFunc } from "mongodb-rag-core";
+import {
+  VerifiedAnswer,
+  FindVerifiedAnswerFunc,
+  DataStreamer,
+} from "mongodb-rag-core";
 import { strict as assert } from "assert";
 import {
   GenerateResponse,
@@ -17,8 +21,40 @@ export interface MakeVerifiedAnswerGenerateResponseParams {
   onVerifiedAnswerFound?: (verifiedAnswer: VerifiedAnswer) => VerifiedAnswer;
 
   onNoVerifiedAnswerFound: GenerateResponse;
+
+  stream?: {
+    onVerifiedAnswerFound: StreamFunction<{ verifiedAnswer: VerifiedAnswer }>;
+  };
 }
 
+export type StreamFunction<Params> = (
+  params: { dataStreamer: DataStreamer } & Params
+) => void;
+
+export const addMessageToConversationVerifiedAnswerStream: MakeVerifiedAnswerGenerateResponseParams["stream"] =
+  {
+    onVerifiedAnswerFound: ({ verifiedAnswer, dataStreamer }) => {
+      dataStreamer.streamData({
+        type: "metadata",
+        data: {
+          verifiedAnswer: {
+            _id: verifiedAnswer._id,
+            created: verifiedAnswer.created,
+            updated: verifiedAnswer.updated,
+          },
+        },
+      });
+      dataStreamer.streamData({
+        type: "delta",
+        data: verifiedAnswer.answer,
+      });
+      dataStreamer.streamData({
+        type: "references",
+        data: verifiedAnswer.references,
+      });
+    },
+  };
+
 /**
   Searches for verified answers for the user query.
   If no verified answer can be found for the given query, the
@@ -28,6 +64,7 @@ export const makeVerifiedAnswerGenerateResponse = ({
   findVerifiedAnswer,
   onVerifiedAnswerFound,
   onNoVerifiedAnswerFound,
+  stream,
 }: MakeVerifiedAnswerGenerateResponseParams): GenerateResponse => {
   return async (args) => {
     const { latestMessageText, shouldStream, dataStreamer } = args;
@@ -54,17 +91,11 @@ export const makeVerifiedAnswerGenerateResponse = ({
 
     if (shouldStream) {
       assert(dataStreamer, "Must have dataStreamer if shouldStream=true");
-      dataStreamer.streamData({
-        type: "metadata",
-        data: metadata,
-      });
-      dataStreamer.streamData({
-        type: "delta",
-        data: answer,
-      });
-      dataStreamer.streamData({
-        type: "references",
-        data: references,
+      assert(stream, "Must have stream if shouldStream=true");
+
+      stream.onVerifiedAnswerFound({
+        dataStreamer,
+        verifiedAnswer,
       });
     }
 
diff --git a/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.test.ts b/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.test.ts
index dcf0680dc..20d1baa65 100644
--- a/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.test.ts
+++ b/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.test.ts
@@ -290,6 +290,9 @@ describe("POST /conversations/:conversationId/messages", () => {
 
     test("Should respond 500 if error with conversation service", async () => {
       const mockBrokenConversationsService: ConversationsService = {
+        async init() {
+          throw new Error("mock error");
+        },
         async create() {
           throw new Error("mock error");
         },
@@ -302,6 +305,9 @@ describe("POST /conversations/:conversationId/messages", () => {
         async findById() {
           throw new Error("Error finding conversation");
         },
+        async findByMessageId() {
+          throw new Error("Error finding conversation by message id");
+        },
         async rateMessage() {
           throw new Error("mock error");
         },
diff --git a/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.ts b/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.ts
index 24b150ffe..f6c11a0b1 100644
--- a/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.ts
+++ b/packages/mongodb-chatbot-server/src/routes/conversations/addMessageToConversation.ts
@@ -31,6 +31,7 @@ import {
   GenerateResponse,
   GenerateResponseParams,
 } from "../../processors/GenerateResponse";
+import { hasTooManyUserMessagesInConversation } from "../responses/createResponse";
 
 export const DEFAULT_MAX_INPUT_LENGTH = 3000; // magic number for max input size for LLM
 export const DEFAULT_MAX_USER_MESSAGES_IN_CONVERSATION = 7; // magic number for max messages in a conversation
@@ -207,11 +208,12 @@ export function makeAddMessageToConversationRoute({
       });
 
       // --- MAX CONVERSATION LENGTH CHECK ---
-      const numUserMessages = conversation.messages.reduce(
-        (acc, message) => (message.role === "user" ? acc + 1 : acc),
-        0
-      );
-      if (numUserMessages >= maxUserMessagesInConversation) {
+      if (
+        hasTooManyUserMessagesInConversation(
+          conversation,
+          maxUserMessagesInConversation
+        )
+      ) {
         // Omit the system prompt and assume the user always received one response per message
         throw makeRequestError({
           httpStatus: 400,
diff --git a/packages/mongodb-chatbot-server/src/routes/index.ts b/packages/mongodb-chatbot-server/src/routes/index.ts
index b9f9da7be..d3e816609 100644
--- a/packages/mongodb-chatbot-server/src/routes/index.ts
+++ b/packages/mongodb-chatbot-server/src/routes/index.ts
@@ -1 +1,2 @@
 export * from "./conversations";
+export * from "./responses";
diff --git a/packages/mongodb-chatbot-server/src/routes/responses/createResponse.test.ts b/packages/mongodb-chatbot-server/src/routes/responses/createResponse.test.ts
new file mode 100644
index 000000000..4690a6225
--- /dev/null
+++ b/packages/mongodb-chatbot-server/src/routes/responses/createResponse.test.ts
@@ -0,0 +1,875 @@
+import "dotenv/config";
+import type { Server } from "http";
+import { ObjectId } from "mongodb";
+import type {
+  Conversation,
+  ConversationsService,
+  SomeMessage,
+} from "mongodb-rag-core";
+import { type AppConfig } from "../../app";
+import {
+  makeTestLocalServer,
+  makeOpenAiClient,
+  makeCreateResponseRequestStream,
+  type Stream,
+} from "../../test/testHelpers";
+import { makeDefaultConfig } from "../../test/testConfig";
+import { ERR_MSG, type CreateResponseRequest } from "./createResponse";
+import { ERROR_CODE, ERROR_TYPE } from "./errors";
+
+jest.setTimeout(100000);
+
+describe("POST /responses", () => {
+  let appConfig: AppConfig;
+  let server: Server;
+  let ipAddress: string;
+  let origin: string;
+  let conversations: ConversationsService;
+
+  beforeEach(async () => {
+    appConfig = await makeDefaultConfig();
+
+    ({ conversations } = appConfig.responsesRouterConfig.createResponse);
+
+    // use a unique port so this doesn't collide with other test suites
+    const testPort = 5200;
+    ({ server, ipAddress, origin } = await makeTestLocalServer(
+      appConfig,
+      testPort
+    ));
+  });
+
+  afterEach(async () => {
+    server?.listening && server?.close();
+    jest.restoreAllMocks();
+  });
+
+  const makeClientAndRequest = (
+    body?: Partial<CreateResponseRequest["body"]>
+  ) => {
+    const openAiClient = makeOpenAiClient(origin, ipAddress);
+    return makeCreateResponseRequestStream(openAiClient, body);
+  };
+
+  describe("Valid requests", () => {
+    it("Should return responses given a string input", async () => {
+      const stream = await makeClientAndRequest();
+
+      await expectValidResponses({ requestBody: {}, stream });
+    });
+
+    it("Should return responses given a message array input", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        input: [
+          { role: "system", content: "You are a helpful assistant." },
+          { role: "user", content: "What is MongoDB?" },
+          { role: "assistant", content: "MongoDB is a document database." },
+          { role: "user", content: "What is a document database?" },
+        ],
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses given a valid request with instructions", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        instructions: "You are a helpful chatbot.",
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with valid max_output_tokens", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        max_output_tokens: 4000,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with valid metadata", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        metadata: { key1: "value1", key2: "value2" },
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with valid temperature", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        temperature: 0,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with previous_response_id", async () => {
+      const initialMessages: Array<SomeMessage> = [
+        { role: "user", content: "Initial message!" },
+      ];
+      const { messages } = await conversations.create({ initialMessages });
+
+      const previous_response_id = messages.at(-1)?.id.toString();
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        previous_response_id,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses if previous_response_id is the latest message", async () => {
+      const initialMessages: Array<SomeMessage> = [
+        { role: "user", content: "Initial message!" },
+        { role: "assistant", content: "Initial response!" },
+        { role: "user", content: "Another message!" },
+      ];
+      const { messages } = await conversations.create({ initialMessages });
+
+      const previous_response_id = messages.at(-1)?.id.toString();
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        previous_response_id,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with user", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        user: "some-user-id",
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with store=false", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        store: false,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with store=true", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        store: true,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with tools and tool_choice", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        tools: [
+          {
+            type: "function",
+            strict: true,
+            name: "test-tool",
+            description: "A tool for testing.",
+            parameters: {
+              type: "object",
+              properties: {
+                query: { type: "string" },
+              },
+              required: ["query"],
+            },
+          },
+        ],
+        tool_choice: "auto",
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with a specific function tool_choice", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        tools: [
+          {
+            type: "function",
+            strict: true,
+            name: "test-tool",
+            description: "A tool for testing.",
+            parameters: {
+              type: "object",
+              properties: {
+                query: { type: "string" },
+              },
+              required: ["query"],
+            },
+          },
+        ],
+        tool_choice: {
+          type: "function",
+          name: "test-tool",
+        },
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses given a message array with function_call", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        input: [
+          { role: "user", content: "What is MongoDB?" },
+          {
+            type: "function_call",
+            call_id: "call123",
+            name: "my_function",
+            arguments: `{"query": "value"}`,
+            status: "in_progress",
+          },
+        ],
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses given a message array with function_call_output", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        input: [
+          { role: "user", content: "What is MongoDB?" },
+          {
+            type: "function_call_output",
+            call_id: "call123",
+            output: `{"result": "success"}`,
+            status: "completed",
+          },
+        ],
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with a valid tool_choice", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        tool_choice: "none",
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should return responses with an empty tools array", async () => {
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        tools: [],
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      await expectValidResponses({ requestBody, stream });
+    });
+
+    it("Should store conversation messages if `storeMessageContent: undefined` and `store: true`", async () => {
+      const storeMessageContent = undefined;
+      const initialMessages: Array<SomeMessage> = [
+        { role: "user", content: "Initial message!" },
+      ];
+      const { _id, messages } = await conversations.create({
+        storeMessageContent,
+        initialMessages,
+      });
+
+      const store = true;
+      const previous_response_id = messages.at(-1)?.id.toString();
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        previous_response_id,
+        store,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      const updatedConversation = await conversations.findById({ _id });
+      if (!updatedConversation) {
+        return expect(updatedConversation).not.toBeNull();
+      }
+
+      await expectValidResponses({ requestBody, stream });
+
+      expect(updatedConversation?.storeMessageContent).toEqual(
+        storeMessageContent
+      );
+      expectDefaultMessageContent({
+        initialMessages,
+        updatedConversation,
+        store,
+      });
+    });
+
+    it("Should store conversation messages when `store: true`", async () => {
+      const store = true;
+      const userId = "customUserId";
+      const metadata = {
+        customMessage1: "customMessage1",
+        customMessage2: "customMessage2",
+      };
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        store,
+        metadata,
+        user: userId,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      const results = await expectValidResponses({ requestBody, stream });
+
+      const updatedConversation = await conversations.findByMessageId({
+        messageId: getMessageIdFromResults(results),
+      });
+      if (!updatedConversation) {
+        return expect(updatedConversation).not.toBeNull();
+      }
+
+      expect(updatedConversation.storeMessageContent).toEqual(store);
+      expectDefaultMessageContent({
+        updatedConversation,
+        userId,
+        store,
+        metadata,
+      });
+    });
+
+    it("Should not store conversation messages when `store: false`", async () => {
+      const store = false;
+      const userId = "customUserId";
+      const metadata = {
+        customMessage1: "customMessage1",
+        customMessage2: "customMessage2",
+      };
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        store,
+        metadata,
+        user: userId,
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      const results = await expectValidResponses({ requestBody, stream });
+
+      const updatedConversation = await conversations.findByMessageId({
+        messageId: getMessageIdFromResults(results),
+      });
+      if (!updatedConversation) {
+        return expect(updatedConversation).not.toBeNull();
+      }
+
+      expect(updatedConversation.storeMessageContent).toEqual(store);
+      expectDefaultMessageContent({
+        updatedConversation,
+        userId,
+        store,
+        metadata,
+      });
+    });
+
+    it("Should store function_call messages when `store: true`", async () => {
+      const store = true;
+      const functionCallType = "function_call";
+      const functionCallOutputType = "function_call_output";
+      const requestBody: Partial<CreateResponseRequest["body"]> = {
+        store,
+        input: [
+          {
+            type: functionCallType,
+            call_id: "call123",
+            name: "my_function",
+            arguments: `{"query": "value"}`,
+            status: "in_progress",
+          },
+          {
+            type: functionCallOutputType,
+            call_id: "call123",
+            output: `{"result": "success"}`,
+            status: "completed",
+          },
+        ],
+      };
+      const stream = await makeClientAndRequest(requestBody);
+
+      const results = await expectValidResponses({ requestBody, stream });
+
+      const updatedConversation = await conversations.findByMessageId({
+        messageId: getMessageIdFromResults(results),
+      });
+      if (!updatedConversation) {
+        return expect(updatedConversation).not.toBeNull();
+      }
+
+      expect(updatedConversation.storeMessageContent).toEqual(store);
+
+      expect(updatedConversation.messages[0].role).toEqual("system");
+      expect(updatedConversation.messages[0].content).toEqual(functionCallType);
+
+      expect(updatedConversation.messages[1].role).toEqual("system");
+      expect(updatedConversation.messages[1].content).toEqual(
+        functionCallOutputType
+      );
+    });
+  });
+
+  describe("Invalid requests", () => {
+    it("Should return error responses if empty input string", async () => {
+      const stream = await makeClientAndRequest({
+        input: "",
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: `Path: body.input - ${ERR_MSG.INPUT_STRING}`,
+      });
+    });
+
+    it("Should return error responses if empty message array", async () => {
+      const stream = await makeClientAndRequest({
+        input: [],
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: `Path: body.input - ${ERR_MSG.INPUT_ARRAY}`,
+      });
+    });
+
+    it("Should return error responses if model is not supported via config", async () => {
+      const invalidModel = "invalid-model";
+      const stream = await makeClientAndRequest({
+        model: invalidModel,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.MODEL_NOT_SUPPORTED(invalidModel),
+      });
+    });
+
+    it("Should return error responses if max_output_tokens is > allowed limit", async () => {
+      const max_output_tokens = 4001;
+      const stream = await makeClientAndRequest({
+        max_output_tokens,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.MAX_OUTPUT_TOKENS(max_output_tokens, 4000),
+      });
+    });
+
+    it("Should return error responses if metadata has too many fields", async () => {
+      const metadata: Record<string, string> = {};
+      for (let i = 0; i < 17; i++) {
+        metadata[`key${i}`] = "value";
+      }
+      const stream = await makeClientAndRequest({
+        metadata,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: `Path: body.metadata - ${ERR_MSG.METADATA_LENGTH}`,
+      });
+    });
+
+    it("Should return error responses if metadata value is too long", async () => {
+      const stream = await makeClientAndRequest({
+        metadata: { key1: "a".repeat(513) },
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message:
+          "Path: body.metadata.key1 - String must contain at most 512 character(s)",
+      });
+    });
+
+    it("Should return error responses if temperature is not 0", async () => {
+      const stream = await makeClientAndRequest({
+        temperature: 0.5 as any,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: `Path: body.temperature - ${ERR_MSG.TEMPERATURE}`,
+      });
+    });
+
+    it("Should return error responses if messages contain an invalid role", async () => {
+      const stream = await makeClientAndRequest({
+        input: [
+          { role: "user", content: "What is MongoDB?" },
+          {
+            role: "invalid-role" as any,
+            content: "This is an invalid role.",
+          },
+        ],
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: "Path: body.input - Invalid input",
+      });
+    });
+
+    it("Should return error responses if function_call has an invalid status", async () => {
+      const stream = await makeClientAndRequest({
+        input: [
+          {
+            type: "function_call",
+            call_id: "call123",
+            name: "my_function",
+            arguments: `{"query": "value"}`,
+            status: "invalid_status" as any,
+          },
+        ],
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: "Path: body.input - Invalid input",
+      });
+    });
+
+    it("Should return error responses if function_call_output has an invalid status", async () => {
+      const stream = await makeClientAndRequest({
+        input: [
+          {
+            type: "function_call_output",
+            call_id: "call123",
+            output: `{"result": "success"}`,
+            status: "invalid_status" as any,
+          },
+        ],
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: "Path: body.input - Invalid input",
+      });
+    });
+
+    it("Should return error responses with an invalid tool_choice string", async () => {
+      const stream = await makeClientAndRequest({
+        tool_choice: "invalid_choice" as any,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: "Path: body.tool_choice - Invalid input",
+      });
+    });
+
+    it("Should return error responses if max_output_tokens is negative", async () => {
+      const stream = await makeClientAndRequest({
+        max_output_tokens: -1,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message:
+          "Path: body.max_output_tokens - Number must be greater than or equal to 0",
+      });
+    });
+
+    it("Should return error responses if previous_response_id is not a valid ObjectId", async () => {
+      const previous_response_id = "some-id";
+      const stream = await makeClientAndRequest({
+        previous_response_id,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.INVALID_OBJECT_ID(previous_response_id),
+      });
+    });
+
+    it("Should return error responses if previous_response_id is not found", async () => {
+      const previous_response_id = "123456789012123456789012";
+      const stream = await makeClientAndRequest({
+        previous_response_id,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.MESSAGE_NOT_FOUND(previous_response_id),
+      });
+    });
+
+    it("Should return error responses if previous_response_id is not the latest message", async () => {
+      const initialMessages: Array<SomeMessage> = [
+        { role: "user", content: "Initial message!" },
+        { role: "assistant", content: "Initial response!" },
+        { role: "user", content: "Another message!" },
+      ];
+      const { messages } = await conversations.create({ initialMessages });
+
+      const previous_response_id = messages[0].id.toString();
+      const stream = await makeClientAndRequest({
+        previous_response_id,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.MESSAGE_NOT_LATEST(previous_response_id),
+      });
+    });
+
+    it("Should return error responses if there are too many messages in the conversation", async () => {
+      const { maxUserMessagesInConversation } =
+        appConfig.responsesRouterConfig.createResponse;
+
+      const initialMessages = Array(maxUserMessagesInConversation).fill({
+        role: "user",
+        content: "Initial message!",
+      });
+      const { messages } = await conversations.create({ initialMessages });
+
+      const previous_response_id = messages.at(-1)?.id.toString();
+      const stream = await makeClientAndRequest({
+        previous_response_id,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.TOO_MANY_MESSAGES(maxUserMessagesInConversation),
+      });
+    });
+
+    it("Should return error responses if user id has changed since the conversation was created", async () => {
+      const userId = "user1";
+      const badUserId = "user2";
+
+      const initialMessages: Array<SomeMessage> = [
+        { role: "user", content: "Initial message!" },
+      ];
+      const { messages } = await conversations.create({
+        userId,
+        initialMessages,
+      });
+
+      const previous_response_id = messages.at(-1)?.id.toString();
+      const stream = await makeClientAndRequest({
+        previous_response_id,
+        user: badUserId,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.CONVERSATION_USER_ID_CHANGED,
+      });
+    });
+
+    it("Should return error responses if `store: false` and `previous_response_id` is provided", async () => {
+      const stream = await makeClientAndRequest({
+        previous_response_id: "123456789012123456789012",
+        store: false,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.STORE_NOT_SUPPORTED,
+      });
+    });
+
+    it("Should return error responses if `store: true` and `storeMessageContent: false`", async () => {
+      const initialMessages: Array<SomeMessage> = [
+        { role: "user", content: "Initial message!" },
+      ];
+      const { messages } = await conversations.create({
+        storeMessageContent: false,
+        initialMessages,
+      });
+
+      const previous_response_id = messages.at(-1)?.id.toString();
+      const stream = await makeClientAndRequest({
+        previous_response_id,
+        store: true,
+      });
+
+      await expectInvalidResponses({
+        stream,
+        message: ERR_MSG.CONVERSATION_STORE_MISMATCH,
+      });
+    });
+  });
+});
+
+// --- HELPERS ---
+
+const getMessageIdFromResults = (results?: Array<any>) => {
+  if (!results?.length) throw new Error("No results found");
+
+  const messageId = results.at(-1)?.response?.id;
+
+  if (typeof messageId !== "string") throw new Error("Message ID not found");
+
+  return new ObjectId(messageId);
+};
+
+interface ExpectInvalidResponsesParams {
+  stream: Stream;
+  message: string;
+}
+
+const expectInvalidResponses = async ({
+  stream,
+  message,
+}: ExpectInvalidResponsesParams) => {
+  const responses: any[] = [];
+  try {
+    for await (const event of stream) {
+      responses.push(event);
+    }
+
+    fail("expected error");
+  } catch (err: any) {
+    expect(err.type).toBe(ERROR_TYPE);
+    expect(err.code).toBe(ERROR_CODE.INVALID_REQUEST_ERROR);
+    expect(err.error.type).toBe(ERROR_TYPE);
+    expect(err.error.code).toBe(ERROR_CODE.INVALID_REQUEST_ERROR);
+    expect(err.error.message).toBe(message);
+  }
+
+  expect(Array.isArray(responses)).toBe(true);
+  expect(responses.length).toBe(0);
+};
+
+interface ExpectValidResponsesParams {
+  stream: Stream;
+  requestBody: Partial<CreateResponseRequest["body"]>;
+}
+
+const expectValidResponses = async ({
+  stream,
+  requestBody,
+}: ExpectValidResponsesParams) => {
+  const responses: any[] = [];
+  for await (const event of stream) {
+    responses.push(event);
+  }
+
+  expect(Array.isArray(responses)).toBe(true);
+  expect(responses.length).toBe(3);
+
+  expect(responses[0].type).toBe("response.created");
+  expect(responses[1].type).toBe("response.in_progress");
+  expect(responses[2].type).toBe("response.completed");
+
+  responses.forEach(({ response, sequence_number }, index) => {
+    // basic response properties
+    expect(sequence_number).toBe(index);
+    expect(typeof response.id).toBe("string");
+    expect(typeof response.created_at).toBe("number");
+    expect(response.object).toBe("response");
+    expect(response.error).toBeNull();
+    expect(response.incomplete_details).toBeNull();
+    expect(response.model).toBe("mongodb-chat-latest");
+    expect(response.output_text).toBe("");
+    expect(response.output).toEqual([]);
+    expect(response.parallel_tool_calls).toBe(true);
+    expect(response.temperature).toBe(0);
+    expect(response.stream).toBe(true);
+    expect(response.top_p).toBeNull();
+
+    // conditional upon request body properties
+    if (requestBody.instructions) {
+      expect(response.instructions).toBe(requestBody.instructions);
+    } else {
+      expect(response.instructions).toBeNull();
+    }
+    if (requestBody.max_output_tokens) {
+      expect(response.max_output_tokens).toBe(requestBody.max_output_tokens);
+    } else {
+      expect(response.max_output_tokens).toBe(1000);
+    }
+    if (requestBody.previous_response_id) {
+      expect(response.previous_response_id).toBe(
+        requestBody.previous_response_id
+      );
+    } else {
+      expect(response.previous_response_id).toBeNull();
+    }
+    if (typeof requestBody.store === "boolean") {
+      expect(response.store).toBe(requestBody.store);
+    } else {
+      expect(response.store).toBe(true);
+    }
+    if (requestBody.tool_choice) {
+      expect(response.tool_choice).toEqual(requestBody.tool_choice);
+    } else {
+      expect(response.tool_choice).toBe("auto");
+    }
+    if (requestBody.tools) {
+      expect(response.tools).toEqual(requestBody.tools);
+    } else {
+      expect(response.tools).toEqual([]);
+    }
+    if (requestBody.user) {
+      expect(response.user).toBe(requestBody.user);
+    } else {
+      expect(response.user).toBeUndefined();
+    }
+    if (requestBody.metadata) {
+      expect(response.metadata).toEqual(requestBody.metadata);
+    } else {
+      expect(response.metadata).toBeNull();
+    }
+  });
+
+  return responses;
+};
+
+interface ExpectDefaultMessageContentParams {
+  initialMessages?: Array<SomeMessage>;
+  updatedConversation: Conversation;
+  store: boolean;
+  userId?: string;
+  metadata?: Record<string, string> | null;
+}
+
+const expectDefaultMessageContent = ({
+  initialMessages,
+  updatedConversation,
+  store,
+  userId,
+  metadata = null,
+}: ExpectDefaultMessageContentParams) => {
+  expect(updatedConversation.userId).toEqual(userId);
+  if (metadata) expect(updatedConversation.customData).toEqual({ metadata });
+
+  const defaultMessagesLength = 3;
+  const initialMessagesLength = initialMessages?.length ?? 0;
+  const totalMessagesLength = defaultMessagesLength + initialMessagesLength;
+
+  const { messages } = updatedConversation;
+  expect(messages.length).toEqual(totalMessagesLength);
+
+  initialMessages?.forEach((initialMessage, index) => {
+    expect(messages[index].role).toEqual(initialMessage.role);
+    expect(messages[index].content).toEqual(initialMessage.content);
+    expect(messages[index].metadata).toEqual(initialMessage.metadata);
+    expect(messages[index].customData).toEqual(initialMessage.customData);
+  });
+
+  const firstMessage = messages[initialMessagesLength];
+  const secondMessage = messages[initialMessagesLength + 1];
+  const thirdMessage = messages[initialMessagesLength + 2];
+
+  expect(firstMessage.role).toBe("user");
+  expect(firstMessage.content).toBe(store ? "What is MongoDB?" : "");
+  expect(firstMessage.metadata).toEqual(metadata);
+
+  expect(secondMessage.role).toEqual("user");
+  expect(secondMessage.content).toBeFalsy();
+  expect(secondMessage.metadata).toEqual(metadata);
+
+  expect(thirdMessage.role).toEqual("assistant");
+  expect(thirdMessage.content).toEqual(store ? "some content" : "");
+  expect(thirdMessage.metadata).toEqual(metadata);
+};
diff --git a/packages/mongodb-chatbot-server/src/routes/responses/createResponse.ts b/packages/mongodb-chatbot-server/src/routes/responses/createResponse.ts
new file mode 100644
index 000000000..500e8fa07
--- /dev/null
+++ b/packages/mongodb-chatbot-server/src/routes/responses/createResponse.ts
@@ -0,0 +1,556 @@
+import { z } from "zod";
+import type {
+  Request as ExpressRequest,
+  Response as ExpressResponse,
+} from "express";
+import { ObjectId } from "mongodb";
+import type { OpenAI } from "mongodb-rag-core/openai";
+import {
+  type ConversationsService,
+  type Conversation,
+  makeDataStreamer,
+} from "mongodb-rag-core";
+import { SomeExpressRequest } from "../../middleware";
+import { getRequestId } from "../../utils";
+import type { GenerateResponse } from "../../processors";
+import {
+  makeBadRequestError,
+  makeInternalServerError,
+  generateZodErrorMessage,
+  sendErrorResponse,
+  ERROR_TYPE,
+  type SomeOpenAIAPIError,
+} from "./errors";
+
+type StreamCreatedMessage = Omit<
+  OpenAI.Responses.ResponseCreatedEvent,
+  "sequence_number"
+>;
+type StreamInProgressMessage = Omit<
+  OpenAI.Responses.ResponseInProgressEvent,
+  "sequence_number"
+>;
+type StreamCompletedMessage = Omit<
+  OpenAI.Responses.ResponseCompletedEvent,
+  "sequence_number"
+>;
+
+export const ERR_MSG = {
+  INPUT_STRING: "Input must be a non-empty string",
+  INPUT_ARRAY:
+    "Input must be a string or array of messages. See https://platform.openai.com/docs/api-reference/responses/create#responses-create-input for more information.",
+  CONVERSATION_USER_ID_CHANGED:
+    "Path: body.user - User ID has changed since the conversation was created.",
+  METADATA_LENGTH: "Too many metadata fields. Max 16.",
+  TEMPERATURE: "Temperature must be 0 or unset",
+  STREAM: "'stream' must be true",
+  INVALID_OBJECT_ID: (id: string) =>
+    `Path: body.previous_response_id - ${id} is not a valid ObjectId`,
+  MESSAGE_NOT_FOUND: (messageId: string) =>
+    `Path: body.previous_response_id - Message ${messageId} not found`,
+  MESSAGE_NOT_LATEST: (messageId: string) =>
+    `Path: body.previous_response_id - Message ${messageId} is not the latest message in the conversation`,
+  TOO_MANY_MESSAGES: (max: number) =>
+    `Too many messages. You cannot send more than ${max} messages in this conversation.`,
+  MODEL_NOT_SUPPORTED: (model: string) =>
+    `Path: body.model - ${model} is not supported.`,
+  MAX_OUTPUT_TOKENS: (input: number, max: number) =>
+    `Path: body.max_output_tokens - ${input} is greater than the maximum allowed ${max}.`,
+  STORE_NOT_SUPPORTED:
+    "Path: body.previous_response_id | body.store - to use previous_response_id the store flag must be true",
+  CONVERSATION_STORE_MISMATCH:
+    "Path: body.previous_response_id | body.store - the conversation store flag does not match the store flag provided",
+};
+
+const CreateResponseRequestBodySchema = z.object({
+  model: z.string(),
+  instructions: z.string().optional(),
+  input: z.union([
+    z.string().refine((input) => input.length > 0, ERR_MSG.INPUT_STRING),
+    z
+      .array(
+        z.union([
+          z.object({
+            type: z.literal("message").optional(),
+            role: z.enum(["user", "assistant", "system"]),
+            content: z.string(),
+          }),
+          // function tool call
+          z.object({
+            type: z.literal("function_call"),
+            call_id: z.string().describe("Unique ID of the function tool call"),
+            name: z.string().describe("Name of the function tool to call"),
+            arguments: z
+              .string()
+              .describe(
+                "JSON string of arguments passed to the function tool call"
+              ),
+            status: z.enum(["in_progress", "completed", "incomplete"]),
+          }),
+          // function tool call output
+          z.object({
+            type: z.literal("function_call_output"),
+            id: z
+              .string()
+              .optional()
+              .describe("The unique ID of the function tool call output"),
+            call_id: z
+              .string()
+              .describe(
+                "Unique ID of the function tool call generated by the model"
+              ),
+            output: z
+              .string()
+              .describe("JSON string of the function tool call"),
+            status: z.enum(["in_progress", "completed", "incomplete"]),
+          }),
+        ])
+      )
+      .refine((input) => input.length > 0, ERR_MSG.INPUT_ARRAY),
+  ]),
+  max_output_tokens: z.number().min(0).default(1000),
+  metadata: z
+    .record(z.string(), z.string().max(512))
+    .optional()
+    .refine(
+      (metadata) => Object.keys(metadata ?? {}).length <= 16,
+      ERR_MSG.METADATA_LENGTH
+    ),
+  previous_response_id: z
+    .string()
+    .optional()
+    .describe("The unique ID of the previous response to the model."),
+  store: z
+    .boolean()
+    .optional()
+    .describe("Whether to store the response in the conversation.")
+    .default(true),
+  stream: z.boolean().refine((stream) => stream, ERR_MSG.STREAM),
+  temperature: z
+    .number()
+    .refine((temperature) => temperature === 0, ERR_MSG.TEMPERATURE)
+    .optional()
+    .describe("Temperature for the model. Defaults to 0.")
+    .default(0),
+  tool_choice: z
+    .union([
+      z.enum(["none", "auto", "required"]),
+      z
+        .object({
+          type: z.literal("function"),
+          name: z.string(),
+        })
+        .describe("Function tool choice"),
+    ])
+    .optional()
+    .describe("Tool choice for the model. Defaults to 'auto'.")
+    .default("auto"),
+  tools: z
+    .array(
+      z.object({
+        type: z.literal("function"),
+        strict: z.boolean(),
+        name: z.string(),
+        description: z.string().optional(),
+        parameters: z
+          .record(z.string(), z.unknown())
+          .describe(
+            "A JSON schema object describing the parameters of the function."
+          ),
+      })
+    )
+    .optional()
+    .describe("Tools for the model to use."),
+
+  user: z.string().optional().describe("The user ID of the user."),
+});
+
+const CreateResponseRequestSchema = SomeExpressRequest.merge(
+  z.object({
+    headers: z.object({
+      "req-id": z.string(),
+    }),
+    body: CreateResponseRequestBodySchema,
+  })
+);
+
+export type CreateResponseRequest = z.infer<typeof CreateResponseRequestSchema>;
+
+export interface CreateResponseRouteParams {
+  conversations: ConversationsService;
+  generateResponse: GenerateResponse;
+  supportedModels: string[];
+  maxOutputTokens: number;
+  maxUserMessagesInConversation: number;
+}
+
+export function makeCreateResponseRoute({
+  conversations,
+  generateResponse,
+  supportedModels,
+  maxOutputTokens,
+  maxUserMessagesInConversation,
+}: CreateResponseRouteParams) {
+  return async (
+    req: ExpressRequest,
+    res: ExpressResponse<{ status: string }, any> // TODO: fix type
+  ) => {
+    const reqId = getRequestId(req);
+    const headers = req.headers as Record<string, string>;
+    const dataStreamer = makeDataStreamer();
+
+    try {
+      dataStreamer.connect(res);
+
+      // --- INPUT VALIDATION ---
+      const { error, data } = CreateResponseRequestSchema.safeParse(req);
+      if (error) {
+        throw makeBadRequestError({
+          error: new Error(generateZodErrorMessage(error)),
+          headers,
+        });
+      }
+
+      const {
+        body: {
+          model,
+          max_output_tokens,
+          previous_response_id,
+          store,
+          metadata,
+          user,
+          input,
+        },
+      } = data;
+
+      // --- MODEL CHECK ---
+      if (!supportedModels.includes(model)) {
+        throw makeBadRequestError({
+          error: new Error(ERR_MSG.MODEL_NOT_SUPPORTED(model)),
+          headers,
+        });
+      }
+
+      // --- MAX OUTPUT TOKENS CHECK ---
+      if (max_output_tokens > maxOutputTokens) {
+        throw makeBadRequestError({
+          error: new Error(
+            ERR_MSG.MAX_OUTPUT_TOKENS(max_output_tokens, maxOutputTokens)
+          ),
+          headers,
+        });
+      }
+
+      // --- STORE CHECK ---
+      if (previous_response_id && !store) {
+        throw makeBadRequestError({
+          error: new Error(ERR_MSG.STORE_NOT_SUPPORTED),
+          headers,
+        });
+      }
+
+      // --- LOAD CONVERSATION ---
+      const conversation = await loadConversationByMessageId({
+        messageId: previous_response_id,
+        conversations,
+        headers,
+        metadata,
+        userId: user,
+        storeMessageContent: store,
+      });
+
+      // --- CONVERSATION USER ID CHECK ---
+      if (hasConversationUserIdChanged(conversation, user)) {
+        throw makeBadRequestError({
+          error: new Error(ERR_MSG.CONVERSATION_USER_ID_CHANGED),
+          headers,
+        });
+      }
+
+      // --- MAX CONVERSATION LENGTH CHECK ---
+      if (
+        hasTooManyUserMessagesInConversation(
+          conversation,
+          maxUserMessagesInConversation
+        )
+      ) {
+        throw makeBadRequestError({
+          error: new Error(
+            ERR_MSG.TOO_MANY_MESSAGES(maxUserMessagesInConversation)
+          ),
+          headers,
+        });
+      }
+
+      // generate responseId to use in conversation DB AND Responses API stream
+      const responseId = new ObjectId();
+      const baseResponse = makeBaseResponseData({
+        responseId,
+        data: data.body,
+      });
+
+      const createdMessage: StreamCreatedMessage = {
+        type: "response.created",
+        response: {
+          ...baseResponse,
+          created_at: Date.now(),
+        },
+      };
+      dataStreamer.streamResponses(createdMessage);
+
+      const inProgressMessage: StreamInProgressMessage = {
+        type: "response.in_progress",
+        response: {
+          ...baseResponse,
+          created_at: Date.now(),
+        },
+      };
+      dataStreamer.streamResponses(inProgressMessage);
+
+      // TODO: actually implement this call
+      // Also pass the toolDefinitions and customSystemPrompt
+      const { messages } = await generateResponse({} as any);
+
+      // --- STORE MESSAGES IN CONVERSATION ---
+      await saveMessagesToConversation({
+        conversations,
+        conversation,
+        store,
+        metadata,
+        input,
+        messages,
+        responseId,
+      });
+
+      const completedMessage: StreamCompletedMessage = {
+        type: "response.completed",
+        response: {
+          ...baseResponse,
+          created_at: Date.now(),
+        },
+      };
+      dataStreamer.streamResponses(completedMessage);
+    } catch (error) {
+      const standardError =
+        (error as SomeOpenAIAPIError)?.type === ERROR_TYPE
+          ? (error as SomeOpenAIAPIError)
+          : makeInternalServerError({ error: error as Error, headers });
+
+      if (dataStreamer.connected) {
+        dataStreamer.streamResponses({
+          ...standardError,
+          type: ERROR_TYPE,
+        });
+      } else {
+        sendErrorResponse({
+          res,
+          reqId,
+          error: standardError,
+        });
+      }
+    } finally {
+      if (dataStreamer.connected) {
+        dataStreamer.disconnect();
+      }
+    }
+  };
+}
+
+interface LoadConversationByMessageIdParams {
+  messageId?: string;
+  conversations: ConversationsService;
+  headers: Record<string, string>;
+  metadata?: Record<string, string>;
+  userId?: string;
+  storeMessageContent: boolean;
+}
+
+const loadConversationByMessageId = async ({
+  messageId,
+  conversations,
+  headers,
+  metadata,
+  userId,
+  storeMessageContent,
+}: LoadConversationByMessageIdParams): Promise<Conversation> => {
+  if (!messageId) {
+    return await conversations.create({
+      userId,
+      storeMessageContent,
+      customData: { metadata },
+    });
+  }
+
+  const conversation = await conversations.findByMessageId({
+    messageId: convertToObjectId(messageId, headers),
+  });
+
+  if (!conversation) {
+    throw makeBadRequestError({
+      error: new Error(ERR_MSG.MESSAGE_NOT_FOUND(messageId)),
+      headers,
+    });
+  }
+
+  // The default should be true because, if unset, we assume message data is stored
+  const shouldStoreConversation = conversation.storeMessageContent ?? true;
+  // this ensures that conversations will respect the store flag initially set
+  if (shouldStoreConversation !== storeMessageContent) {
+    throw makeBadRequestError({
+      error: new Error(ERR_MSG.CONVERSATION_STORE_MISMATCH),
+      headers,
+    });
+  }
+
+  const latestMessage = conversation.messages[conversation.messages.length - 1];
+  if (latestMessage.id.toString() !== messageId) {
+    throw makeBadRequestError({
+      error: new Error(ERR_MSG.MESSAGE_NOT_LATEST(messageId)),
+      headers,
+    });
+  }
+
+  return conversation;
+};
+
+const convertToObjectId = (
+  inputString: string,
+  headers: Record<string, string>
+): ObjectId => {
+  try {
+    return new ObjectId(inputString);
+  } catch (error) {
+    throw makeBadRequestError({
+      error: new Error(ERR_MSG.INVALID_OBJECT_ID(inputString)),
+      headers,
+    });
+  }
+};
+
+// ideally this doesn't need to be exported once nothing else relies on it (addMessageToConversation for now)
+export const hasTooManyUserMessagesInConversation = (
+  conversation: Conversation,
+  maxUserMessagesInConversation: number
+): boolean => {
+  const numUserMessages = conversation.messages.reduce(
+    (acc, message) => (message.role === "user" ? acc + 1 : acc),
+    0
+  );
+  return numUserMessages >= maxUserMessagesInConversation;
+};
+
+const hasConversationUserIdChanged = (
+  conversation: Conversation,
+  userId?: string
+): boolean => {
+  return conversation.userId !== userId;
+};
+
+type MessagesParam = Parameters<
+  ConversationsService["addManyConversationMessages"]
+>[0]["messages"];
+
+interface AddMessagesToConversationParams {
+  conversations: ConversationsService;
+  conversation: Conversation;
+  store: boolean;
+  metadata?: Record<string, string>;
+  input: CreateResponseRequest["body"]["input"];
+  messages: MessagesParam;
+  responseId: ObjectId;
+}
+
+const saveMessagesToConversation = async ({
+  conversations,
+  conversation,
+  store,
+  metadata,
+  input,
+  messages,
+  responseId,
+}: AddMessagesToConversationParams) => {
+  const messagesToAdd = [
+    ...convertInputToDBMessages(input, store, metadata),
+    ...messages.map((message) => formatMessage(message, store, metadata)),
+  ];
+  // handle setting the response id for the last message
+  // this corresponds to the response id in the response stream
+  if (messagesToAdd.length > 0) {
+    messagesToAdd[messagesToAdd.length - 1].id = responseId;
+  }
+
+  return await conversations.addManyConversationMessages({
+    conversationId: conversation._id,
+    messages: messagesToAdd,
+  });
+};
+
+const convertInputToDBMessages = (
+  input: CreateResponseRequest["body"]["input"],
+  store: boolean,
+  metadata?: Record<string, string>
+): MessagesParam => {
+  if (typeof input === "string") {
+    return [formatMessage({ role: "user", content: input }, store, metadata)];
+  }
+
+  return input.map((message) => {
+    // handle function tool calls and outputs
+    const role = message.type === "message" ? message.role : "system";
+    const content =
+      message.type === "message" ? message.content : message.type ?? "";
+
+    return formatMessage({ role, content }, store, metadata);
+  });
+};
+
+const formatMessage = (
+  message: MessagesParam[number],
+  store: boolean,
+  metadata?: Record<string, string>
+): MessagesParam[number] => {
+  // store a placeholder string if we're not storing message data
+  const content = store ? message.content : "";
+  // handle cleaning custom data if we're not storing message data
+  const customData = {
+    ...message.customData,
+    query: store ? message.customData?.query : "",
+    reason: store ? message.customData?.reason : "",
+  };
+
+  return {
+    ...message,
+    content,
+    metadata,
+    customData,
+  };
+};
+
+interface BaseResponseData {
+  responseId: ObjectId;
+  data: CreateResponseRequest["body"];
+}
+
+const makeBaseResponseData = ({ responseId, data }: BaseResponseData) => {
+  return {
+    id: responseId.toString(),
+    object: "response" as const,
+    error: null,
+    incomplete_details: null,
+    instructions: data.instructions ?? null,
+    max_output_tokens: data.max_output_tokens ?? null,
+    model: data.model,
+    output_text: "",
+    output: [],
+    parallel_tool_calls: true,
+    previous_response_id: data.previous_response_id ?? null,
+    store: data.store,
+    temperature: data.temperature,
+    stream: data.stream,
+    tool_choice: data.tool_choice,
+    tools: data.tools ?? [],
+    top_p: null,
+    user: data.user,
+    metadata: data.metadata ?? null,
+  };
+};
diff --git a/packages/mongodb-chatbot-server/src/routes/responses/errors.ts b/packages/mongodb-chatbot-server/src/routes/responses/errors.ts
new file mode 100644
index 000000000..e4fd783c4
--- /dev/null
+++ b/packages/mongodb-chatbot-server/src/routes/responses/errors.ts
@@ -0,0 +1,132 @@
+import {
+  type APIError,
+  BadRequestError,
+  InternalServerError,
+  NotFoundError,
+  RateLimitError,
+} from "mongodb-rag-core/openai";
+import { logger } from "mongodb-rag-core";
+import type { Response as ExpressResponse } from "express";
+import type { ZodError } from "zod";
+import { generateErrorMessage } from "zod-error";
+
+interface SendErrorResponseParams {
+  reqId: string;
+  res: ExpressResponse;
+  error: APIError;
+}
+
+export const sendErrorResponse = ({
+  reqId,
+  res,
+  error,
+}: SendErrorResponseParams) => {
+  const httpStatus = error.status ?? 500;
+
+  logger.error({
+    reqId,
+    message: `Responding with ${httpStatus} status and error message: ${error.message}.`,
+  });
+
+  if (!res.writableEnded) {
+    return res.status(httpStatus).json(error);
+  }
+};
+
+// --- OPENAI ERROR CONSTANTS ---
+export const ERROR_TYPE = "error";
+export enum ERROR_CODE {
+  INVALID_REQUEST_ERROR = "invalid_request_error",
+  NOT_FOUND_ERROR = "not_found_error",
+  RATE_LIMIT_ERROR = "rate_limit_error",
+  SERVER_ERROR = "server_error",
+}
+
+// --- OPENAI ERROR WRAPPERS ---
+export type SomeOpenAIAPIError =
+  | APIError
+  | BadRequestError
+  | NotFoundError
+  | RateLimitError
+  | InternalServerError;
+
+interface MakeOpenAIErrorParams {
+  error: Error;
+  headers: Record<string, string>;
+}
+
+export const makeInternalServerError = ({
+  error,
+  headers,
+}: MakeOpenAIErrorParams) => {
+  const message = error.message ?? "Internal server error";
+  const _error = {
+    ...error,
+    type: ERROR_TYPE,
+    code: ERROR_CODE.SERVER_ERROR,
+    message,
+  };
+  return new InternalServerError(500, _error, message, headers);
+};
+
+export const makeBadRequestError = ({
+  error,
+  headers,
+}: MakeOpenAIErrorParams) => {
+  const message = error.message ?? "Bad request";
+  const _error = {
+    ...error,
+    type: ERROR_TYPE,
+    code: ERROR_CODE.INVALID_REQUEST_ERROR,
+    message,
+  };
+  return new BadRequestError(400, _error, message, headers);
+};
+
+export const makeNotFoundError = ({
+  error,
+  headers,
+}: MakeOpenAIErrorParams) => {
+  const message = error.message ?? "Not found";
+  const _error = {
+    ...error,
+    type: ERROR_TYPE,
+    code: ERROR_CODE.NOT_FOUND_ERROR,
+    message,
+  };
+  return new NotFoundError(404, _error, message, headers);
+};
+
+export const makeRateLimitError = ({
+  error,
+  headers,
+}: MakeOpenAIErrorParams) => {
+  const message = error.message ?? "Rate limit exceeded";
+  const _error = {
+    ...error,
+    type: ERROR_TYPE,
+    code: ERROR_CODE.RATE_LIMIT_ERROR,
+    message,
+  };
+  return new RateLimitError(429, _error, message, headers);
+};
+
+// --- ZOD VALIDATION ERROR MESSAGE GENERATION ---
+export const generateZodErrorMessage = (error: ZodError) => {
+  return generateErrorMessage(error.issues, {
+    delimiter: {
+      component: " - ",
+    },
+    path: {
+      enabled: true,
+      type: "objectNotation",
+    },
+    code: {
+      enabled: false,
+    },
+    message: {
+      enabled: true,
+      label: "",
+    },
+  });
+};
diff --git a/packages/mongodb-chatbot-server/src/routes/responses/index.ts b/packages/mongodb-chatbot-server/src/routes/responses/index.ts
new file mode 100644
index 000000000..a0523d4ea
--- /dev/null
+++ b/packages/mongodb-chatbot-server/src/routes/responses/index.ts
@@ -0,0 +1 @@
+export * from "./responsesRouter";
diff --git a/packages/mongodb-chatbot-server/src/routes/responses/responsesRouter.test.ts b/packages/mongodb-chatbot-server/src/routes/responses/responsesRouter.test.ts
new file mode 100644
index 000000000..38c735e8b
--- /dev/null
+++ b/packages/mongodb-chatbot-server/src/routes/responses/responsesRouter.test.ts
@@ -0,0 +1,189 @@
+import type { Server } from "http";
+import {
+  makeTestLocalServer,
+  makeOpenAiClient,
+  makeCreateResponseRequestStream,
+  type Stream,
+} from "../../test/testHelpers";
+import { makeDefaultConfig } from "../../test/testConfig";
+import {
+  ERROR_CODE,
+  ERROR_TYPE,
+  makeBadRequestError,
+  type SomeOpenAIAPIError,
+} from "./errors";
+
+jest.setTimeout(60000);
+
+describe("Responses Router", () => {
+  let server: Server;
+  let ipAddress: string;
+  let origin: string;
+
+  afterEach(async () => {
+    if (server?.listening) {
+      await new Promise<void>((resolve) => {
+        server.close(() => resolve());
+      });
+    }
+    jest.clearAllMocks();
+  });
+
+  it("should return responses given a valid request", async () => {
+    ({ server, ipAddress, origin } = await makeTestLocalServer());
+
+    const openAiClient = makeOpenAiClient(origin, ipAddress);
+    const stream = await makeCreateResponseRequestStream(openAiClient);
+
+    await expectValidResponses({ stream });
+  });
+
+  it("should return an OpenAI error when handling an unknown error", async () => {
+    const errorMessage = "Unknown error";
+
+    const appConfig = await makeDefaultConfig();
+    appConfig.responsesRouterConfig.createResponse.generateResponse = () => {
+      throw new Error(errorMessage);
+    };
+
+    ({ server, ipAddress, origin } = await makeTestLocalServer(appConfig));
+
+    const openAiClient = makeOpenAiClient(origin, ipAddress);
+    const stream = await makeCreateResponseRequestStream(openAiClient);
+
+    await expectInvalidResponses({
+      stream,
+      error: {
+        type: ERROR_TYPE,
+        code: ERROR_CODE.SERVER_ERROR,
+        message: errorMessage,
+      },
+    });
+  });
+
+  it("should return the OpenAI error when service throws an OpenAI error", async () => {
+    const errorMessage = "Bad request input";
+
+    const appConfig = await makeDefaultConfig();
+    appConfig.responsesRouterConfig.createResponse.generateResponse = () =>
+      Promise.reject(
+        makeBadRequestError({
+          error: new Error(errorMessage),
+          headers: {},
+        })
+      );
+
+    ({ server, ipAddress, origin } = await makeTestLocalServer(appConfig));
+
+    const openAiClient = makeOpenAiClient(origin, ipAddress);
+    const stream = await makeCreateResponseRequestStream(openAiClient);
+
+    await expectInvalidResponses({
+      stream,
+      error: {
+        type: ERROR_TYPE,
+        code: ERROR_CODE.INVALID_REQUEST_ERROR,
+        message: errorMessage,
+      },
+    });
+  });
+
+  it("Should return an OpenAI error when rate limit is hit", async () => {
+    const rateLimitErrorMessage = "Error: rate limit exceeded!";
+
+    const appConfig = await makeDefaultConfig();
+    appConfig.responsesRouterConfig.rateLimitConfig = {
+      routerRateLimitConfig: {
+        windowMs: 500000, // Big window to cover test duration
+        max: 1, // Only one request should be allowed
+        message: rateLimitErrorMessage,
+      },
+    };
+
+    ({ server, ipAddress, origin } = await makeTestLocalServer(appConfig));
+
+    const openAiClient = makeOpenAiClient(origin, ipAddress);
+    const stream = await makeCreateResponseRequestStream(openAiClient);
+
+    try {
+      await makeCreateResponseRequestStream(openAiClient);
+
+      fail("expected rate limit error");
+    } catch (error) {
+      expect((error as SomeOpenAIAPIError).status).toBe(429);
+      expect((error as SomeOpenAIAPIError).error).toEqual({
+        type: ERROR_TYPE,
+        code: ERROR_CODE.RATE_LIMIT_ERROR,
+        message: rateLimitErrorMessage,
+      });
+    }
+
+    await expectValidResponses({ stream });
+  });
+});
+
+// --- HELPERS ---
+
+interface ExpectValidResponsesParams {
+  stream: Stream;
+}
+
+const expectValidResponses = async ({ stream }: ExpectValidResponsesParams) => {
+  const responses: any[] = [];
+  for await (const event of stream) {
+    responses.push(event);
+  }
+
+  expect(Array.isArray(responses)).toBe(true);
+  expect(responses.length).toBe(3);
+
+  expect(responses[0].type).toBe("response.created");
+  expect(responses[1].type).toBe("response.in_progress");
+  expect(responses[2].type).toBe("response.completed");
+
+  responses.forEach(({ sequence_number, response }, index) => {
+    expect(sequence_number).toBe(index);
+    expect(typeof response.id).toBe("string");
+    expect(response.object).toBe("response");
+    expect(response.error).toBeNull();
+    expect(response.model).toBe("mongodb-chat-latest");
+  });
+};
+
+interface ExpectInvalidResponsesParams {
+  stream: Stream;
+  error: {
+    type: string;
+    code: string;
+    message: string;
+  };
+}
+
+const expectInvalidResponses = async ({
+  stream,
+  error,
+}: ExpectInvalidResponsesParams) => {
+  const responses: any[] = [];
+  try {
+    for await (const event of stream) {
+      responses.push(event);
+    }
+
+    fail("expected error");
+  } catch (err: any) {
+    expect(err.type).toBe(error.type);
+    expect(err.code).toBe(error.code);
+    expect(err.error.type).toBe(error.type);
+    expect(err.error.code).toBe(error.code);
+    expect(err.error.message).toBe(error.message);
+  }
+
+  expect(Array.isArray(responses)).toBe(true);
+  expect(responses.length).toBe(2);
+
+  expect(responses[0].type).toBe("response.created");
+  expect(responses[1].type).toBe("response.in_progress");
+
+  expect(responses[0].sequence_number).toBe(0);
+  expect(responses[1].sequence_number).toBe(1);
+};
diff --git a/packages/mongodb-chatbot-server/src/routes/responses/responsesRouter.ts b/packages/mongodb-chatbot-server/src/routes/responses/responsesRouter.ts
new file mode 100644
index 000000000..c88ecebbe
--- /dev/null
+++ b/packages/mongodb-chatbot-server/src/routes/responses/responsesRouter.ts
@@ -0,0 +1,63 @@
+import Router from "express-promise-router";
+import type { ConversationsService } from "mongodb-rag-core";
+import { makeCreateResponseRoute } from "./createResponse";
+import type { GenerateResponse } from "../../processors";
+import { getRequestId } from "../../utils";
+import {
+  makeRateLimit,
+  makeSlowDown,
+  type RateLimitOptions,
+  type SlowDownOptions,
+} from "../../middleware";
+import { makeRateLimitError, sendErrorResponse } from "./errors";
+
+export interface ResponsesRouterParams {
+  rateLimitConfig?: {
+    routerRateLimitConfig?: RateLimitOptions;
+    routerSlowDownConfig?: SlowDownOptions;
+  };
+  createResponse: {
+    conversations: ConversationsService;
+    generateResponse: GenerateResponse;
+    supportedModels: string[];
+    maxOutputTokens: number;
+    maxUserMessagesInConversation: number;
+  };
+}
+
+/**
+  Constructor function to make the /responses/* Express.js router.
+ */
+export function makeResponsesRouter({
+  rateLimitConfig,
+  createResponse,
+}: ResponsesRouterParams) {
+  const responsesRouter = Router();
+
+  /*
+    Global rate limit the requests to the responsesRouter.
+   */
+  const rateLimit = makeRateLimit({
+    ...rateLimitConfig?.routerRateLimitConfig,
+    handler: (req, res, next, options) => {
+      const reqId = getRequestId(req);
+      const error = makeRateLimitError({
+        error: new Error(options.message),
+        headers: req.headers as Record<string, string>,
+      });
+      return sendErrorResponse({ reqId, res, error });
+    },
+  });
+  responsesRouter.use(rateLimit);
+  /*
+    Slow down the response to the responsesRouter after certain number
+    of requests in the time window.
+   */
+  const globalSlowDown = makeSlowDown(rateLimitConfig?.routerSlowDownConfig);
+  responsesRouter.use(globalSlowDown);
+
+  // Create Response API
+  responsesRouter.post("/", makeCreateResponseRoute(createResponse));
+
+  return responsesRouter;
+}
diff --git a/packages/mongodb-chatbot-server/src/test/testConfig.ts b/packages/mongodb-chatbot-server/src/test/testConfig.ts
index 100757731..b826cf63f 100644
--- a/packages/mongodb-chatbot-server/src/test/testConfig.ts
+++ b/packages/mongodb-chatbot-server/src/test/testConfig.ts
@@ -171,6 +171,13 @@ export const mockGenerateResponse: GenerateResponse = async ({
   };
 };
 
+export const MONGO_CHAT_MODEL = "mongodb-chat-latest";
+
+export const basicResponsesRequestBody = {
+  model: MONGO_CHAT_MODEL,
+  input: "What is MongoDB?",
+};
+
 export async function makeDefaultConfig(): Promise<AppConfig> {
   const conversations = makeMongoDbConversationsService(memoryDb);
   return {
@@ -178,6 +185,15 @@ export async function makeDefaultConfig(): Promise<AppConfig> {
       generateResponse: mockGenerateResponse,
       conversations,
     },
+    responsesRouterConfig: {
+      createResponse: {
+        conversations,
+        generateResponse: mockGenerateResponse,
+        supportedModels: [MONGO_CHAT_MODEL],
+        maxOutputTokens: 4000,
+        maxUserMessagesInConversation: 6,
+      },
+    },
     maxRequestTimeoutMs: 30000,
     corsOptions: {
       origin: allowedOrigins,
diff --git a/packages/mongodb-chatbot-server/src/test/testHelpers.ts b/packages/mongodb-chatbot-server/src/test/testHelpers.ts
index 0455abcd9..156a9af43 100644
--- a/packages/mongodb-chatbot-server/src/test/testHelpers.ts
+++ b/packages/mongodb-chatbot-server/src/test/testHelpers.ts
@@ -1,6 +1,13 @@
 import { strict as assert } from "assert";
-import { AppConfig, makeApp } from "../app";
-import { makeDefaultConfig, memoryDb, systemPrompt } from "./testConfig";
+import { OpenAI } from "mongodb-rag-core/openai";
+import { AppConfig, DEFAULT_API_PREFIX, makeApp } from "../app";
+import {
+  makeDefaultConfig,
+  memoryDb,
+  systemPrompt,
+  basicResponsesRequestBody,
+} from "./testConfig";
+import type { CreateResponseRequest } from "../routes/responses/createResponse";
 
 export async function makeTestAppConfig(
   defaultConfigOverrides?: PartialAppConfig
@@ -18,6 +25,10 @@ export async function makeTestAppConfig(
       ...config.conversationsRouterConfig,
       ...(defaultConfigOverrides?.conversationsRouterConfig ?? {}),
     },
+    responsesRouterConfig: {
+      ...config.responsesRouterConfig,
+      ...(defaultConfigOverrides?.responsesRouterConfig ?? {}),
+    },
   };
   assert(memoryDb, "memoryDb must be defined");
   return { appConfig, systemPrompt, mongodb: memoryDb };
@@ -25,12 +36,15 @@ export async function makeTestAppConfig(
 
 export type PartialAppConfig = Omit<
   Partial<AppConfig>,
-  "conversationsRouterConfig"
+  "conversationsRouterConfig" | "responsesRouterConfig"
 > & {
   conversationsRouterConfig?: Partial<AppConfig["conversationsRouterConfig"]>;
+  responsesRouterConfig?: Partial<AppConfig["responsesRouterConfig"]>;
+  port?: number;
 };
 
-export const TEST_ORIGIN = "http://localhost:5173";
+export const TEST_PORT = 5173;
+export const TEST_ORIGIN = `http://localhost:`;
 
 /**
   Helper function to quickly make an app for testing purposes. Can't be called
@@ -40,7 +54,7 @@ export const TEST_ORIGIN = "http://localhost:5173";
 export async function makeTestApp(defaultConfigOverrides?: PartialAppConfig) {
   // ip address for local host
   const ipAddress = "127.0.0.1";
-  const origin = TEST_ORIGIN;
+  const origin = TEST_ORIGIN + (defaultConfigOverrides?.port ?? TEST_PORT);
 
   const { appConfig, systemPrompt, mongodb } = await makeTestAppConfig(
     defaultConfigOverrides
@@ -58,6 +72,53 @@ export async function makeTestApp(defaultConfigOverrides?: PartialAppConfig) {
   };
 }
 
+export const TEST_OPENAI_API_KEY = "test-api-key";
+
+/**
+  Helper function to quickly make a local server for testing purposes.
+  Builds on the other helpers for app/config stuff.
+  @param defaultConfigOverrides - optional overrides for default app config
+ */
+export const makeTestLocalServer = async (
+  defaultConfigOverrides?: PartialAppConfig,
+  port?: number
+) => {
+  const testAppResult = await makeTestApp({
+    ...defaultConfigOverrides,
+    port,
+  });
+
+  const server = testAppResult.app.listen(port ?? TEST_PORT);
+
+  return { ...testAppResult, server };
+};
+
+export const makeOpenAiClient = (origin: string, ipAddress: string) => {
+  return new OpenAI({
+    baseURL: origin + DEFAULT_API_PREFIX,
+    apiKey: TEST_OPENAI_API_KEY,
+    defaultHeaders: {
+      Origin: origin,
+      "X-Forwarded-For": ipAddress,
+    },
+  });
+};
+
+export type Stream = Awaited<
+  ReturnType<typeof makeCreateResponseRequestStream>
+>;
+
+export const makeCreateResponseRequestStream = (
+  openAiClient: OpenAI,
+  body?: Omit<Partial<CreateResponseRequest["body"]>, "stream">
+) => {
+  return openAiClient.responses.create({
+    ...basicResponsesRequestBody,
+    ...body,
+    stream: true,
+  });
+};
+
 /**
   Create a URL to represent a client-side route on the test origin.
   @param path - path to append to the origin base URL.
diff --git a/packages/mongodb-rag-core/package.json b/packages/mongodb-rag-core/package.json
index 2b3b5e42e..b6892a1ff 100644
--- a/packages/mongodb-rag-core/package.json
+++ b/packages/mongodb-rag-core/package.json
@@ -32,7 +32,6 @@
     "./mongodb": "./build/mongodb.js",
     "./mongoDbMetadata": "./build/mongoDbMetadata/index.js",
     "./openai": "./build/openai.js",
-    "./aiSdk": "./build/aiSdk.js",
     "./braintrust": "./build/braintrust.js",
     "./dataSources": "./build/dataSources/index.js",
     "./models": "./build/models/index.js",
@@ -102,7 +101,7 @@
     "ignore": "^5.3.2",
     "langchain": "^0.3.5",
     "mongodb": "^6.3.0",
-    "openai": "^4.95.0",
+    "openai": "^5.9.1",
     "rimraf": "^6.0.1",
     "simple-git": "^3.27.0",
     "toml": "^3.0.0",
diff --git a/packages/mongodb-rag-core/src/DataStreamer.test.ts b/packages/mongodb-rag-core/src/DataStreamer.test.ts
index b38b97a3d..a661cdbd2 100644
--- a/packages/mongodb-rag-core/src/DataStreamer.test.ts
+++ b/packages/mongodb-rag-core/src/DataStreamer.test.ts
@@ -1,16 +1,23 @@
-import { DataStreamer, makeDataStreamer } from "./DataStreamer";
+import {
+  DataStreamer,
+  makeDataStreamer,
+  type ResponsesStreamParams,
+} from "./DataStreamer";
 import { OpenAI } from "openai";
 import { createResponse } from "node-mocks-http";
 import { EventEmitter } from "events";
 import { Response } from "express";
 
-let res: ReturnType<typeof createResponse> & Response;
-const dataStreamer = makeDataStreamer();
 describe("Data Streaming", () => {
+  let dataStreamer: DataStreamer;
+  let res: ReturnType<typeof createResponse> & Response;
+
+  beforeAll(() => {
+    dataStreamer = makeDataStreamer();
+  });
+
   beforeEach(() => {
-    res = createResponse({
-      eventEmitter: EventEmitter,
-    });
+    res = createResponse({ eventEmitter: EventEmitter });
     dataStreamer.connect(res);
   });
 
@@ -79,6 +86,30 @@ describe("Data Streaming", () => {
       `data: {"type":"delta","data":"Once upon"}\n\ndata: {"type":"delta","data":" a time there was a"}\n\ndata: {"type":"delta","data":" very long string."}\n\n`
     );
   });
+
+  it("Streams Responses API events as valid SSE events to the client", () => {
+    dataStreamer.streamResponses({
+      type: "response.created",
+      id: "test1",
+    } as ResponsesStreamParams);
+    dataStreamer.streamResponses({
+      type: "response.in_progress",
+      id: "test2",
+    } as ResponsesStreamParams);
+    dataStreamer.streamResponses({
+      type: "response.output_text.delta",
+      id: "test3",
+    } as ResponsesStreamParams);
+    dataStreamer.streamResponses({
+      type: "response.completed",
+      id: "test4",
+    } as ResponsesStreamParams);
+
+    const data = res._getData();
+    expect(data).toBe(
+      `event: response.created\ndata: {"type":"response.created","id":"test1","sequence_number":0}\n\nevent: response.in_progress\ndata: {"type":"response.in_progress","id":"test2","sequence_number":1}\n\nevent: response.output_text.delta\ndata: {"type":"response.output_text.delta","id":"test3","sequence_number":2}\n\nevent: response.completed\ndata: {"type":"response.completed","id":"test4","sequence_number":3}\n\n`
+    );
+  });
 });
 
 function createChatCompletionWithDelta(
diff --git a/packages/mongodb-rag-core/src/DataStreamer.ts b/packages/mongodb-rag-core/src/DataStreamer.ts
index 423e6ec21..12d56b2bf 100644
--- a/packages/mongodb-rag-core/src/DataStreamer.ts
+++ b/packages/mongodb-rag-core/src/DataStreamer.ts
@@ -16,6 +16,7 @@ interface ServerSentEventDispatcher<Data extends object | string> {
   disconnect(): void;
   sendData(data: Data): void;
   sendEvent(eventType: string, data: Data): void;
+  sendResponsesEvent(data: OpenAI.Responses.ResponseStreamEvent): void;
 }
 
 type ServerSentEventData = object | string;
@@ -43,6 +44,10 @@ function makeServerSentEventDispatcher<
       res.write(`event: ${eventType}\n`);
       res.write(`data: ${JSON.stringify(data)}\n\n`);
     },
+    sendResponsesEvent(data) {
+      res.write(`event: ${data.type}\n`);
+      res.write(`data: ${JSON.stringify(data)}\n\n`);
+    },
   };
 }
 
@@ -53,6 +58,10 @@ interface StreamParams {
 
 type StreamEvent = { type: string; data: unknown };
 
+export type ResponsesStreamParams =
+  | Omit<OpenAI.Responses.ResponseStreamEvent, "sequence_number">
+  | Omit<OpenAI.Responses.ResponseErrorEvent, "sequence_number">;
+
 /**
   Event when server streams additional message response to the client.
  */
@@ -122,6 +131,7 @@ export interface DataStreamer {
   disconnect(): void;
   streamData(data: SomeStreamEvent): void;
   stream(params: StreamParams): Promise<string>;
+  streamResponses(data: ResponsesStreamParams): void;
 }
 
 /**
@@ -130,6 +140,7 @@ export interface DataStreamer {
 export function makeDataStreamer(): DataStreamer {
   let connected = false;
   let sse: ServerSentEventDispatcher<SomeStreamEvent> | undefined;
+  let responseSequenceNumber = 0;
 
   return {
     get connected() {
@@ -161,7 +172,7 @@ export function makeDataStreamer(): DataStreamer {
     /**
       Streams single item of data in an event stream.
      */
-    streamData(data: SomeStreamEvent) {
+    streamData(data) {
       if (!this.connected) {
         throw new Error(
           `Tried to stream data, but there's no SSE connection. Call DataStreamer.connect() first.`
@@ -173,7 +184,7 @@ export function makeDataStreamer(): DataStreamer {
     /**
       Streams all message events in an event stream.
      */
-    async stream({ stream }: StreamParams) {
+    async stream({ stream }) {
       if (!this.connected) {
         throw new Error(
           `Tried to stream data, but there's no SSE connection. Call DataStreamer.connect() first.`
@@ -197,5 +208,19 @@ export function makeDataStreamer(): DataStreamer {
       }
       return streamedData;
     },
+
+    async streamResponses(data) {
+      if (!this.connected) {
+        throw new Error(
+          `Tried to stream data, but there's no SSE connection. Call DataStreamer.connect() first.`
+        );
+      }
+      sse?.sendResponsesEvent({
+        ...data,
+        sequence_number: responseSequenceNumber,
+      } as OpenAI.Responses.ResponseStreamEvent);
+
+      responseSequenceNumber++;
+    },
   };
 }
diff --git a/packages/mongodb-rag-core/src/conversations/ConversationsService.ts b/packages/mongodb-rag-core/src/conversations/ConversationsService.ts
index 5bc97bfe5..2288486ad 100644
--- a/packages/mongodb-rag-core/src/conversations/ConversationsService.ts
+++ b/packages/mongodb-rag-core/src/conversations/ConversationsService.ts
@@ -162,6 +162,10 @@ export interface Conversation<
   createdAt: Date;
   /** The hostname that the request originated from. */
   requestOrigin?: string;
+  /** The user id that the request originated from. */
+  userId?: string;
+  /** Whether to store the message's content data. */
+  storeMessageContent?: boolean;
 
   /**
     Custom data to include in the Conversation persisted to the database.
@@ -172,6 +176,8 @@ export interface Conversation<
 export type CreateConversationParams = {
   initialMessages?: SomeMessage[];
   customData?: ConversationCustomData;
+  userId?: string;
+  storeMessageContent?: boolean;
 };
 
 export type AddMessageParams<T extends SomeMessage> = Omit<T, "createdAt"> & {
@@ -213,6 +219,9 @@ export type AddManyConversationMessagesParams = {
 export interface FindByIdParams {
   _id: ObjectId;
 }
+export interface FindByMessageIdParams {
+  messageId: ObjectId;
+}
 export interface RateMessageParams {
   conversationId: ObjectId;
   messageId: ObjectId;
@@ -245,6 +254,11 @@ export interface ConversationConstants {
 export interface ConversationsService {
   conversationConstants: ConversationConstants;
 
+  /**
+    Initialize the conversations service.
+   */
+  init?: () => Promise<void>;
+
   /**
     Create a new {@link Conversation}.
    */
@@ -264,6 +278,13 @@ export interface ConversationsService {
   ) => Promise<Message[]>;
   findById: ({ _id }: FindByIdParams) => Promise<Conversation | null>;
 
+  /**
+    Find a {@link Conversation} by the id of a {@link Message} in the conversation.
+   */
+  findByMessageId: ({
+    messageId,
+  }: FindByMessageIdParams) => Promise<Conversation | null>;
+
   /**
     Rate a {@link Message} in a {@link Conversation}.
    */
diff --git a/packages/mongodb-rag-core/src/conversations/MongoDbConversations.test.ts b/packages/mongodb-rag-core/src/conversations/MongoDbConversations.test.ts
index 6e8a3888f..5a7ca43b6 100644
--- a/packages/mongodb-rag-core/src/conversations/MongoDbConversations.test.ts
+++ b/packages/mongodb-rag-core/src/conversations/MongoDbConversations.test.ts
@@ -55,6 +55,31 @@ describe("Conversations Service", () => {
       .findOne({ _id: conversation._id });
     expect(conversationInDb).toStrictEqual(conversation);
   });
+  test("Should create a conversation with userId", async () => {
+    const userId = "123";
+    const conversation = await conversationsService.create({
+      userId,
+    });
+    const conversationInDb = await mongodb
+      .collection("conversations")
+      .findOne({ _id: conversation._id });
+
+    expect(conversationInDb).toHaveProperty("userId", userId);
+  });
+  test("Should create a conversation with storeMessageContent", async () => {
+    const storeMessageContent = true;
+    const conversation = await conversationsService.create({
+      storeMessageContent,
+    });
+    const conversationInDb = await mongodb
+      .collection("conversations")
+      .findOne({ _id: conversation._id });
+
+    expect(conversationInDb).toHaveProperty(
+      "storeMessageContent",
+      storeMessageContent
+    );
+  });
   test("Should add a message to a conversation", async () => {
     const conversation = await conversationsService.create({
       initialMessages: [systemPrompt],
@@ -201,6 +226,22 @@ describe("Conversations Service", () => {
     });
     expect(conversationInDb).toBeNull();
   });
+  test("should find a conversation by message id", async () => {
+    const conversation = await conversationsService.create({
+      initialMessages: [systemPrompt],
+    });
+    const messageId = conversation.messages[0].id;
+    const conversationInDb = await conversationsService.findByMessageId({
+      messageId,
+    });
+    expect(conversationInDb).toEqual(conversation);
+  });
+  test("should return null if cannot find a conversation by message id", async () => {
+    const conversationInDb = await conversationsService.findByMessageId({
+      messageId: new BSON.ObjectId(),
+    });
+    expect(conversationInDb).toBeNull();
+  });
   test("Should rate a message", async () => {
     const { _id: conversationId } = await conversationsService.create({
       initialMessages: [systemPrompt],
diff --git a/packages/mongodb-rag-core/src/conversations/MongoDbConversations.ts b/packages/mongodb-rag-core/src/conversations/MongoDbConversations.ts
index ea093f2d5..9cf1e796d 100644
--- a/packages/mongodb-rag-core/src/conversations/MongoDbConversations.ts
+++ b/packages/mongodb-rag-core/src/conversations/MongoDbConversations.ts
@@ -4,18 +4,12 @@ import {
   defaultConversationConstants,
   ConversationsService,
   Conversation,
-  CreateConversationParams,
-  AddConversationMessageParams,
-  FindByIdParams,
-  RateMessageParams,
   Message,
   UserMessage,
-  AddManyConversationMessagesParams,
-  AddSomeMessageParams,
   AssistantMessage,
   SystemMessage,
-  CommentMessageParams,
   ToolMessage,
+  AddSomeMessageParams,
 } from "./ConversationsService";
 
 /**
@@ -29,10 +23,17 @@ export function makeMongoDbConversationsService(
     database.collection<Conversation>("conversations");
   return {
     conversationConstants,
-    async create(params?: CreateConversationParams) {
+
+    async init() {
+      await conversationsCollection.createIndex("messages.id");
+      // NOTE: createdAt index is only used via the production collection
+      await conversationsCollection.createIndex("createdAt");
+    },
+
+    async create(params) {
       const customData = params?.customData;
       const initialMessages = params?.initialMessages;
-      const newConversation = {
+      const newConversation: Conversation = {
         _id: new ObjectId(),
         messages: initialMessages
           ? initialMessages?.map(createMessageFromOpenAIChatMessage)
@@ -43,6 +44,13 @@ export function makeMongoDbConversationsService(
         // which we don't want.
         ...(customData !== undefined && { customData }),
       };
+      if (params?.userId !== undefined) {
+        newConversation.userId = params.userId;
+      }
+      if (params?.storeMessageContent !== undefined) {
+        newConversation.storeMessageContent = params.storeMessageContent;
+      }
+
       const insertResult = await conversationsCollection.insertOne(
         newConversation
       );
@@ -56,7 +64,7 @@ export function makeMongoDbConversationsService(
       return newConversation;
     },
 
-    async addConversationMessage(params: AddConversationMessageParams) {
+    async addConversationMessage(params) {
       const { conversationId, message } = params;
       const newMessage = createMessage(message);
       const updateResult = await conversationsCollection.updateOne(
@@ -75,9 +83,7 @@ export function makeMongoDbConversationsService(
       return newMessage;
     },
 
-    async addManyConversationMessages(
-      params: AddManyConversationMessagesParams
-    ) {
+    async addManyConversationMessages(params) {
       const { messages, conversationId } = params;
       const newMessages = messages.map(createMessage);
       const updateResult = await conversationsCollection.updateOne(
@@ -98,16 +104,19 @@ export function makeMongoDbConversationsService(
       return newMessages;
     },
 
-    async findById({ _id }: FindByIdParams) {
+    async findById({ _id }) {
       const conversation = await conversationsCollection.findOne({ _id });
       return conversation;
     },
 
-    async rateMessage({
-      conversationId,
-      messageId,
-      rating,
-    }: RateMessageParams) {
+    async findByMessageId({ messageId }) {
+      const conversation = await conversationsCollection.findOne({
+        "messages.id": messageId,
+      });
+      return conversation;
+    },
+
+    async rateMessage({ conversationId, messageId, rating }) {
       const updateResult = await conversationsCollection.updateOne(
         {
           _id: conversationId,
@@ -129,11 +138,7 @@ export function makeMongoDbConversationsService(
       return true;
     },
 
-    async commentMessage({
-      conversationId,
-      messageId,
-      comment,
-    }: CommentMessageParams) {
+    async commentMessage({ conversationId, messageId, comment }) {
       const updateResult = await conversationsCollection.updateOne(
         {
           _id: conversationId,