返回首页
Horay.ai
3.2 (39)
5 次浏览0 人收藏web
关于
## 主要功能 ### 文本生成 提供高效、用户友好和可扩展的LLM模型,具有开箱即用的推理加速能力,包括Llama3、Mixtral、Qwen、Deepseek等模型。 ### 嵌入/重排器 包含多种Embedding和Reranker模型,使您的RAG更加高效和简单。 ### 图像生成 涵盖多种文本到图像和文本到视频模型,如SDXL、SDXL lightning、photomaker、instantid等。 ### 语音生成 使用最新技术加速ASR/TTS模型,以最小延迟生成语音。 ## 核心优势 - 高速生成能力 - 超低延迟的API服务 - 开箱即用的推理加速 - 成本效益显著 ## 使用方式 开发者只需一行代码即可无缝集成Horay.ai最快的模型服务。 ## 典型应用 - 基于超低延迟的快速交互Agent应用 - 利用超低延迟创建的实时响应chat2DB应用 - 基于优化API显著降低成本的图像生成 ## 定价模式 - 采用按使用付费模式 - 新用户自动获得免费额度 - 无服务器推理按token计费 - 按需部署按GPU使用时间计费 - 企业级安全性和可靠性需
## 主要功能
### 文本生成
提供高效、用户友好和可扩展的LLM模型,具有开箱即用的推理加速能力,包括Llama3、Mixtral、Qwen、Deepseek等模型。
### 嵌入/重排器
包含多种Embedding和Reranker模型,使您的RAG更加高效和简单。
### 图像生成
涵盖多种文本到图像和文本到视频模型,如SDXL、SDXL lightning、photomaker、instantid等。
### 语音生成
使用最新技术加速ASR/TTS模型,以最小延迟生成语音。
## 核心优势
- 高速生成能力
- 超低延迟的API服务
- 开箱即用的推理加速
- 成本效益显著
## 使用方式
开发者只需一行代码即可无缝集成Horay.ai最快的模型服务。
## 典型应用
- 基于超低延迟的快速交互Agent应用
- 利用超低延迟创建的实时响应chat2DB应用
- 基于优化API显著降低成本的图像生成
## 定价模式
- 采用按使用付费模式
- 新用户自动获得免费额度
- 无服务器推理按token计费
- 按需部署按GPU使用时间计费
- 企业级安全性和可靠性需联系[email protected]
## 速率限制
- 限制方式包括RPM(每分钟请求数)、RPD(每日请求数)、TPM(每分钟token数)、TPD(每日token数)、IPM(每分钟图像数)
- 根据使用层级自动提升消费限额配额
## 开始使用
访问https://dash.horay.ai注册账户,即可获得免费额度开始使用无服务器推理和按需部署。