关于

## 主要功能 ### 文本生成提供高效、用户友好和可扩展的LLM模型，具有开箱即用的推理加速能力，包括Llama3、Mixtral、Qwen、Deepseek等模型。 ### 嵌入/重排器包含多种Embedding和Reranker模型，使您的RAG更加高效和简单。 ### 图像生成涵盖多种文本到图像和文本到视频模型，如SDXL、SDXL lightning、photomaker、instantid等。 ### 语音生成使用最新技术加速ASR/TTS模型，以最小延迟生成语音。 ## 核心优势 - 高速生成能力 - 超低延迟的API服务 - 开箱即用的推理加速 - 成本效益显著 ## 使用方式开发者只需一行代码即可无缝集成Horay.ai最快的模型服务。 ## 典型应用 - 基于超低延迟的快速交互Agent应用 - 利用超低延迟创建的实时响应chat2DB应用 - 基于优化API显著降低成本的图像生成 ## 定价模式 - 采用按使用付费模式 - 新用户自动获得免费额度 - 无服务器推理按token计费 - 按需部署按GPU使用时间计费 - 企业级安全性和可靠性需