Free-Agent-Vtuber 🤖🎙️

一个基于事件驱动架构、可灵活扩展的 AI 虚拟主播项目。

关于项目

Free-Agent-Vtuber 是一个个人实验项目，旨在探索构建一个真正由 AI 驱动、能够进行实时交互的虚拟主播。

本项目的核心特点在于其架构：

事件驱动 (Event-Driven)：整个系统通过中心化的消息总线（Redis）进行通信，各个功能模块高度解耦。
技术异构 (Polyglot)：架构允许使用任何编程语言，只要该语言能与 Redis 交互。
可扩展性 (Scalable)：得益于解耦设计，可以像搭积木一样添加新功能（如长期记忆、视觉感知、工具使用等）。

目标不仅是创建一个单一的 AI 主播，而是构建一个能够持续进化的强大 AI Agent 框架。

技术栈

后端架构

核心架构：微服务，事件驱动
消息总线：Redis
主要开发语言：Python 3.10+
AI 大语言模型：可插拔设计，支持各类 LLM API（如 OpenAI GPT、Google Gemini 等）
语音合成 (TTS)：可插拔设计（如 Edge-TTS、ElevenLabs 等）

前端界面

框架：Vue.js 3
UI 组件库：Vuetify 3
构建工具：Vite
虚拟形象：Live2D

管理与监控

本地开发管理：Flask - 轻量级 Web 管理界面
进程管理：Python subprocess + psutil - 本地服务生命周期管理
实时监控：WebSocket + 日志流 - 本地开发时的实时服务状态监控
生产部署：Docker 独立容器部署

测试框架

测试框架：pytest + pytest-asyncio

快速开始

先决条件

Docker & Docker Compose
Node.js 18+
Python 3.10+（用于本地工具）

克隆项目

git clone https://github.com/your_username/Free-Agent-Vtuber.git
cd Free-Agent-Vtuber
cp .env.example .env

.env 默认开启 ENABLE_LTM=true，如需禁用长期记忆可将其设为 false。

Docker 一键启动

docker compose up -d
# 或者开发环境热重载
# docker compose -f docker-compose.dev.yml up

前端开发

cd front_end
npm install
npm run dev

开发与测试

开发环境

pip install -r requirements-dev.txt

运行测试

每个服务模块都有独立测试套件，进入对应服务目录运行：

cd services/<service>
pytest -q

系统消息流与契约

本项目采用 Redis 作为消息总线，服务通过队列（list）与频道（pub/sub）通信。输入归一化由 input-handler 负责，采用 “content 优先” 的策略。

端到端数据流（语音 / 文本 → 对话 → TTS）：

网关统一入口：前端通过 WebSocket 连接 gateway，分别路由到 input-handler（输入）和 output-handler（输出）。
输入处理：input-handler 将文本或音频上传整理后，直接调用 dialog-engine 的 /chat/stream（文本）或 /chat/audio（语音）接口。
同进程编排：dialog-engine 内部完成 ASR、上下文记忆检索、LLM 对话生成以及 TTS 流式推送（通过内部 WebSocket 接口写入 output-handler）。
结果分发：input-handler 根据 dialog-engine 返回的最终文本和统计数据，向 Redis 发布 task_response:{task_id} 消息。
前端呈现：output-handler 订阅 task_response:{task_id}，将 AI 回复（及可选的音频分片）推送给前端客户端。

兼容性提示：原先依赖 user_input_queue / ai_responses 的旧链路已经在同步架构重构中移除。前端与外部调用方无需做额外调整，仍然通过 Gateway 的 /ws/input 上传文本或音频，并在 /ws/output/{task_id} 获取流式文本与音频分片；接口字段与顺序保持不变。

开发路线图

我们将分阶段构建 Free-Agent-Vtuber：

未来展望

长期记忆模块：集成数据库，让 Agent 拥有记忆
情感感知模块：通过文本分析赋予 Agent 情感表达能力
视觉感知模块：让 Agent 能够 "看到" 屏幕或摄像头
工具使用模块：允许 Agent 调用外部 API（天气、搜索等）

参与贡献

我们欢迎任何形式的贡献！

Fork 本项目
创建您的功能分支 (git checkout -b feature/AmazingFeature)
提交您的更改 (git commit -m 'feat: add AmazingFeature')
推送到分支 (git push origin feature/AmazingFeature)
打开一个 Pull Request

许可证

本项目采用 MIT 许可证。详情请见 LICENSE 文件。

Free-Agent-Vtuber - An AI Soul in a Digital Shell.

Name		Name	Last commit message	Last commit date
Latest commit History 260 Commits
.claude		.claude
.github		.github
.kiro/specs/tts-module		.kiro/specs/tts-module
demo/sauc_python		demo/sauc_python
docs		docs
front_end		front_end
scripts		scripts
services		services
utils		utils
.env.example		.env.example
.gitattributes		.gitattributes
.gitignore		.gitignore
AGENTS.md		AGENTS.md
README.md		README.md
backend-architecture.md		backend-architecture.md
deploy.bat		deploy.bat
deploy.sh		deploy.sh
docker-compose.dev.yml		docker-compose.dev.yml
docker-compose.yml		docker-compose.yml
requirements-dev.txt		requirements-dev.txt
test_plan.md		test_plan.md
接口文档.md		接口文档.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Free-Agent-Vtuber 🤖🎙️

目录

关于项目

技术栈

后端架构

前端界面

管理与监控

测试框架

快速开始

先决条件

克隆项目

Docker 一键启动

前端开发

开发与测试

开发环境

运行测试

系统消息流与契约

开发路线图

未来展望

参与贡献

许可证

About

Uh oh!

Releases

Packages

Contributors 4

Uh oh!

Languages

pixelsama/Free-Agent-Vtuber

Folders and files

Latest commit

History

Repository files navigation

Free-Agent-Vtuber 🤖🎙️

目录

关于项目

技术栈

后端架构

前端界面

管理与监控

测试框架

快速开始

先决条件

克隆项目

Docker 一键启动

前端开发

开发与测试

开发环境

运行测试

系统消息流与契约

开发路线图

未来展望

参与贡献

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Uh oh!

Languages

Packages