D.Va拥有一部强大的机甲,它具有两台全自动的近距离聚变机炮、可以使机甲飞跃敌人或障碍物的推进器、 还有可以抵御来自正面的远程攻击的防御矩阵
—— From OverWatch
D.VA 是一个基于大模型优化的端到端多人TTS引擎,专注于播客节目创作。
dva.mp4
- 端到端多人TTS: 支持生成包含多个说话人的音频。
- 定制化音色: 允许用户设计和使用独特的音色。
- 拟人化输出: 生成更自然、更像人类说话的语音。
- 背景音乐定制: 支持添加和调整背景音乐。
- 关键词生成播客: 输入关键词即可自动生成多人音频播客节目。
ai_podcast.webm
提示:如果无法在线播放,请尝试下载音频文件 (注意:此链接可能指向项目内的相对路径)。
- AI语音新闻: 自动生成每日AI语音新闻。
- 内容创作: 为播客频道、小红书等平台持续产出音频内容。
- 🗞️ 智能采集: 每日自动采集多领域专业新闻。
- ✂️ 稿件整理: 自动分解整理成高质量新闻稿。
- 🎤 语音合成: 转化为包含片头片尾的精美语音内容(建议时长控制在4分钟以内)。
- 操作系统: Linux (推荐)
- Python: 3.12+
- 系统依赖:
ffmpeg
,rubberband-cli
# 更新包列表并安装系统依赖
sudo apt update
sudo apt install ffmpeg rubberband-cli git-lfs -y
# 进入模型目录
cd models/
# 启用 Git LFS
git lfs install
# 克隆模型仓库 (选择一个源)
# Hugging Face (推荐)
git clone https://huggingface.co/echonoshy/d.va .
# 或者使用镜像站 (如果访问Hugging Face困难)
# git clone https://hf-mirror.com/echonoshy/d.va .
# 返回项目根目录
cd ..
推荐使用 uv
进行环境管理。
# 安装 uv (如果尚未安装)
# curl -LsSf https://astral.sh/uv/install.sh | sh
# source $HOME/.cargo/env
# 或者使用 pip 安装: pip install uv
# (可选) 更换为国内 PyPI 镜像源以加速下载
export UV_INDEX_URL=https://mirrors.aliyun.com/pypi/simple/
# (可选) 创建并激活虚拟环境 (如果需要指定Python版本)
# uv venv --python 3.12 .venv
# source .venv/bin/activate
# 使用 uv 同步依赖 (会自动读取 pyproject.toml)
uv sync
注意:项目依赖定义在 pyproject.toml
中,推荐使用 uv sync
或 pip install .
来安装。
在项目根目录创建 .env
文件,并添加你的 DeepSeek API Key:
# .env
DEEPSEEK_API_KEY=your_api_key_here
启动 Web 界面:
uv run webui.py
或者直接使用 Python:
source .venv/bin/activate
python webui.py
本项目采用 GNU Affero General Public License v3.0。
本项目借鉴了众多开源项目的思路和解决方案,在此感谢他们的贡献: