返回首页
TEN Agent

TEN Agent

4.6 (107)
5 次浏览0 人收藏
视频生成AI聊天机器人开发者工具文本AI聊天视频生成开发者工具
web

关于

### 主要功能 - **实时头像**:使用Trulience的免费头像选项,需配置头像ID和token。 - **实时语音与MCP服务器**:集成MCP服务器扩展LLM能力,支持通过Playground添加MCP URL。 - **实时硬件通信**:支持Espressif ESP32-S3 Korvo V3开发板,实现硬件与LLM的实时交互。 - **实时视觉和屏幕共享检测**:集成Google Gemini Multimodal Live API,提供实时视觉和屏幕共享功能。 - **图像生成**:通过StoryTeller扩展支持实时图像生成,集成天气检查和网页搜索工具。 - **其他LLM平台集成**:支持Dify等平台,增强实时交互体验。 ### 使用说明 - **本地运行**: 1. 前置条件:Docker/Docker Compose、Node.js v18、API密钥(Agora App ID和证书、OpenAI API密钥、Deepgram ASR、Elevenlabs TTS)。 2. 克隆仓库,进入`ai_agents`目录,复制`.env.example

### 主要功能 - **实时头像**:使用Trulience的免费头像选项,需配置头像ID和token。 - **实时语音与MCP服务器**:集成MCP服务器扩展LLM能力,支持通过Playground添加MCP URL。 - **实时硬件通信**:支持Espressif ESP32-S3 Korvo V3开发板,实现硬件与LLM的实时交互。 - **实时视觉和屏幕共享检测**:集成Google Gemini Multimodal Live API,提供实时视觉和屏幕共享功能。 - **图像生成**:通过StoryTeller扩展支持实时图像生成,集成天气检查和网页搜索工具。 - **其他LLM平台集成**:支持Dify等平台,增强实时交互体验。 ### 使用说明 - **本地运行**: 1. 前置条件:Docker/Docker Compose、Node.js v18、API密钥(Agora App ID和证书、OpenAI API密钥、Deepgram ASR、Elevenlabs TTS)。 2. 克隆仓库,进入`ai_agents`目录,复制`.env.example`为`.env`并配置密钥。 3. 运行`docker compose up -d`启动容器,进入容器后使用`task use AGENT=voice-assistant`构建代理。 4. 启动Web服务器:`task build`和`task run`。 - **TMAN Designer定制**: 1. 访问http://localhost:49483。 2. 右键STT、LLM、TTS扩展配置API。 3. 通过Apps Manager运行应用并勾选'Run with TEN Agent'。 - **自托管部署**:支持Docker部署,创建发布镜像。 ### 目标用户 开发者、AI研究者、企业用户,适用于构建语音助手、视觉AI代理和多模态交互系统。 ### 核心优势 - **开源免费**:Apache 2.0许可证,无费用。 - **多模态支持**:语音、视觉、头像实时交互。 - **高性能**:低延迟、实时处理。 - **跨平台**:支持C、Python、C++、Rust、TypeScript、Go语言。 - **社区生态**:包括TEN Framework、TEN Turn Detection、TEN VAD等组件,提供Discord、Hugging Face社区支持。 ### 典型用例 - AI语音助手(如实时对话代理)。 - 硬件集成(如ESP32设备通信)。 - 视觉AI应用(如屏幕共享分析)。 - 图像生成(如StoryTeller)。 ### 收费模式 完全免费开源,无付费层级或订阅费用。