文本转视频 - 第2页 - AI工具导航

VidMe

VidMe

## 主要功能 - **AI UGC视频生成**：使用AI虚拟形象生成真实的用户生成内容视频 - **自定义虚拟形象**：通过60秒视频创建个人AI虚拟形象 - **AI产品展示**：将产品图片转换为带有AI模型的互动演示视频 - **病毒式钩子视频**：生成引人注目的视频开头 - **内容调度器**：规划和自动化内容发布到各大平台 - **AI视频编辑器**：自动修剪、增强和添加特效 - **AI语音合成**：多语言、多风格的文字转语音 ## 使用流程 1. 编写脚本或输入产品链接 2. 选择或创建AI虚拟形象 3. AI自动生成视频 4. 编辑和优化（可选） 5. 发布到社交平台 ## 目标用户 - 社交媒体经理 - 电商/DTC品牌 - 营销机构 - 内容创作者 - 中小企业主 ## 核心优势 - 5分钟内完成视频制作 - 无需编辑技能 - 成本比雇佣创作者低8倍 - 支持29种语言 - 批量内容生成 - 24/7自动化内容生产 ## 定价方案 - **基础版**：$29/月，500积分，约5个UGC广告视频 - **成长版**：$59/月，1000积分，约10个UGC广

视频生成

Image to Video

Image to Video

### 主要功能 ToVideo 提供一系列AI视频生成与编辑工具，核心功能包括： - **图像转视频 (Image to Video)**：将静态照片转换为动态、引人注目的视频，添加平滑过渡和电影效果。 - **视频转视频 (Video to Video)**：通过添加AI效果、更改风格、调整长度或升级质量来增强现有视频片段。 - **文本转视频 (Text to Video)**：输入脚本，AI即可生成包含场景、背景和动态视觉效果的完整动画视频。 - **人脸交换 (Face Swap)**：在图像和视频中无缝交换人脸，创建个性化内容。 - **唇形同步 (Lip Sync Video)**：自动将唇部动作与任何音频（语音、歌唱、旁白）对齐。 - **角色一致性 (Consistent Character Video)**：确保角色在多个场景和项目中保持统一的外观、风格和表情。 - **角色动画 (Character Animation Video)**：将静态图像转换为动画角色视频，为面部表情、手势和场景添加动画。 - **特效 (Effects)**：提供如AI功夫视频等特殊效

个性化视频

AnimateMyPic

AnimateMyPic

## 主要功能 - **图像到视频生成器**：具有增强语义理解能力，能够从任何图像生成视频 - **文本到视频生成器**：从任何提示词生成视频 - **30+ AI动画效果**：包括AI Twerk、AI Kissing、AI Dancing、AI Hug、AI Old Photo Animation等多种有趣模板 ## 核心特点 - 高质量输出 - 商业使用许可 - 多种动画风格 - 无水印输出 - 优先处理（高级计划） - 专属客户支持（最高级计划） ## 定价方案 ### 月付计划 - **基础版**：$6.99/月，300积分/月 - **标准版**：$13.99/月，800积分/月，包含所有动画效果和优先处理 - **专业版**：$27.99/月，2000积分/月，最高质量输出和专属支持 ### 一次性积分包 - $9.99：200积分 - $19.99：600积分 - $39.99：1500积分年付计划享受30%折扣 ## 目标用户内容创作者、社交媒体用户、普通用户 ## 典型用例 - 动画化老照片 - 创建有趣的社交媒体内容 - 制作个性化视频 - 文本描

视频生成

Wavespeed

Wavespeed

## 主要功能 WaveSpeedAI提供全面的AI媒体生成解决方案： - **视频生成**：支持文本到视频、图像到视频生成，包括Alibaba WAN 2.5、ByteDance Seedance、Kling V2.1、Google Veo3等先进模型 - **图像生成**：集成Seedream 4.0、Flux、Ideogram等SOTA模型，支持4K分辨率生成 - **编辑工具**：提供图像背景移除、对象移除、视频水印移除、图像/视频增强等编辑功能 - **3D创建**：支持从图像或文本生成3D资产 - **语音合成**：提供文本转语音功能 - **虚拟形象**：InfiniteTalk支持音频驱动的对话AI视频生成 ## 核心优势 - **快速**：极速图像和视频生成，最大化生产力 - **全面**：在一个API中集成所有前沿SOTA AI模型 - **高效**：最佳价格，不牺牲质量和可靠性 ## 价格信息平台采用按使用量付费模式，具体价格因模型而异： - WAN 2.5文本到视频：$0.25 - WAN 2.5图像到视频：$0.25 - Seedream 4.0图像生成

视频生成

ModelsLab

ModelsLab

主要功能：提供文本到图像（如Google Imagen 4、Seedream 4.0）、文本到视频（如Wan 2.5 T2V、Google Veo 3）、图像到视频（如Veo 2 Image to Video）、文本到语音（如Elevenlabs Text To Speech）、音乐生成（如Sonauto/Music、Elevenlabs/Music）、3D生成（如Text to 3d、Image to 3D）等API。支持多种模型，包括Wan 2.5、Seedream、Google Imagen、Google Veo、Runway Gen 4等。主要特点：模型多样，覆盖14种文本到图像、7种文本到视频等用例；提供API文档和工作流库；支持AI图像编辑、深度伪造、虚拟试穿等高级功能。目标用户：开发者、企业、内容创作者。核心优势：集成简单，提供免费试用和付费计划（免费用户有限制，付费用户解锁更多功能）；支持企业级解决方案和开发者社区。使用流程：用户注册后通过API密钥调用模型，文档位于docs.modelslab.com。收费模式：Freemium模式，基础功能免费，高级功能需付费（具体

视频生成

Mirto AI

Mirto AI

### 主要功能 - **文本生成视频**: 将书面描述转化为令人惊叹的视频，适用于社交媒体、营销和故事叙述。 - **图像生成视频**: 通过先进的图像转视频技术，让静态图片动起来，创建动态视频。 ### 主要特点 - **高分辨率输出**: 生成高清视频，适用于专业内容创作和社交媒体平台。 - **风格定制**: 提供多种艺术风格选择，可自定义视频的每个方面以匹配品牌或创意构想。 - **逼真运动**: 采用先进的运动预测技术，生成流畅自然的视频动态。 - **批量处理**: 高效的批量处理系统可同时创建多个视频，非常适合内容创作者和机构。 - **自定义时长**: 可创建4到8秒的视频，并支持后续延长生成的视频。 - **多种宽高比**: 支持16:9、9:16和1:1等多种宽高比，以完美适配任何平台或设备。 ### 使用流程 1. **构思愿景**: 详细描述视频概念，包括镜头角度、光线、风格和期望的动作。 2. **自定义设置**: 通过直观的控制面板调整视频生成的时长、风格和质量设置。 3. **生成与下载**: AI将愿景变为现实，即时下载高质量视频，与受众分享。

个性化视频

Reela AI

Reela AI

## 核心功能 - **AI虚拟形象视频**：通过脚本生成多风格、多语言的虚拟形象视频，支持多场景和多机位自动切换，以及140多种语言的准确唇形同步。 - **AI视频生成**：将创意想法转化为高质量视频，支持通过上传图片来创建精确的产品视频，并能将文本转换为带配音的视觉故事书。 - **AI驱动视频混剪**：提供纯视觉模式（静音原音频）和音频集成模式（保留原声音轨）的视频混剪。 - **统一多模态视频创作**：可在单一工作流中结合虚拟形象、AI场景、视频片段、插画和B-roll，创建无缝视频。 ## 主要特点 - **快速创作**：5分钟内生成发布就绪的视频，无需剪辑、无需时间轴操作。 - **一体化输出**：自动整合虚拟形象、配音、场景、字幕、节奏和B-roll，输出完整精良的视频。 - **Reela编辑器**：提供直观的时间轴编辑器，可编辑场景、字幕、配音和音乐，并支持导出为Premiere Pro和CapCut可编辑文件。 - **多语言支持**：支持超过140种语言的视频创作和字幕。 - **多格式适配**：支持16:9、9:16和1:1多种宽高比。 - **AI增强功能

视频生成

Wan 2.2 by Alibaba Wan AI

Wan 2.2 by Alibaba Wan AI

## 主要功能 - **文本到视频（Text to Video）**：基于文本描述生成高质量视频 - **图像到视频（Image to Video）**：将静态图像转换为动态视频 - **首尾帧控制**：支持指定起始帧和结束帧生成中间过渡 - **高级控制功能**：提供精确的视频生成控制和创意选项 - **角色参考与动作参考**：结合角色风格和参考动作创建个性化视频内容 ## 技术特点 - **SOTA性能**：在多个基准测试中超越现有开源模型和商业解决方案 - **消费级GPU支持**：T2V-1.3B模型仅需8.19GB显存，兼容几乎所有消费级GPU - **多任务能力**：在文本到视频、图像到视频、视频编辑、文本到图像和视频到音频等任务上表现优异 - **视觉文本生成**：首个能够生成中英文文本的视频模型 - **强大的视频VAE**：Wan-VAE提供卓越的效率和性能，能够编码和解码任意长度的1080P视频 ## 模型版本 - **Wan2.2-I2V**：14B参数模型，支持480P和720P分辨率 - **Wan2.2-T2V**：14B参数模型，支持480P和720P

视频生成

WAN22 AI Powered by WAN 2.2 Technology

WAN22 AI Powered by WAN 2.2 Technology

## 主要功能 - **文本到视频生成**：将文本提示转换为动态视频 - **图像到视频生成**：将静态图像制作为动画视频 - **多种宽高比支持**：16:9(横向)、9:16(纵向)、1:1(方形) - **高质量输出**：720P分辨率，24fps帧率，5秒视频长度 ## 核心技术特点 - **5B参数模型**：采用WAN 2.2 TI2V-5B模型，具备50亿参数 - **混合专家架构**：使用Mixture-of-Experts架构优化性能 - **高效压缩技术**：采用4×16×16 VAE压缩技术 - **开源模型**：基于Apache 2.0许可证完全开源 - **消费者GPU友好**：可在RTX 4090等消费级硬件上运行 ## 使用流程 1. **输入内容**：提供文本提示或图像 2. **配置参数**：设置输出偏好，选择宽高比 3. **AI处理**：WAN22 AI使用专业模型生成视频，消费级GPU上处理5秒视频需9分钟内 4. **导出视频**：下载720P分辨率的成品视频 ## 定价方案 - **Starter免费版**：每月5个视频，720P分辨率，

视频生成

LTX Video

LTX Video

## 核心功能 - **图像转视频生成**：将静态图像转换为动态视频内容 - **文本转视频创建**：通过文本描述生成高质量视频 - **DiT架构处理**：采用创新的Diffusion Transformer技术 - **高分辨率输出**：生成768p分辨率、24 FPS、最长5秒的视频 ## 技术特点 - **时序一致性**：确保视频帧间流畅过渡 - **双模式生成**：同时支持图像和文本输入 - **开源平台**：在Hugging Face和GitHub提供完整模型 - **快速处理**：DiT架构实现高效视频生成 ## 使用流程 1. 输入内容：上传图像或输入文本描述 2. DiT处理：分析输入并规划视频生成 3. 视频生成：创建高质量视频内容 4. 下载使用：获取生成的视频用于项目 ## 定价方案 - **开源免费访问**：包含模型访问、示例代码、社区支持 - **开发者访问**（即将推出）：API访问、高级功能、优先处理、商业许可 - **企业定制**：定制部署、白标解决方案、专属支持 ## 目标用户 - 内容创作者和视频制作人 - AI研究人员和开发者 - 企业视

视频生成

FramePack Studio

FramePack Studio

## 核心功能 FramePack Studio提供革命性的图像到视频生成服务，使用帧上下文打包技术实现高效视频创作。 ## 主要特点 - **帧上下文打包技术**：创新技术将输入上下文压缩为恒定长度，实现高效处理 - **渐进式帧生成**：下一帧预测神经网络以O(1)计算复杂度生成视频，保持一致性能 - **高效内存使用**：仅需6GB+ GPU内存即可生成30FPS、60秒以上视频 - **抗漂移技术**：先进算法配合双向采样防止长视频质量退化 - **开源平台**：完整模型、代码和实现可在GitHub获取 ## 使用流程 1. **输入图像**：上传图像进行图像到视频生成 2. **上下文打包**：应用帧上下文打包技术压缩输入上下文 3. **渐进式生成**：使用下一帧预测网络逐帧生成高质量视频 4. **下载使用**：下载生成的高质量视频用于创意项目 ## 定价方案 - **开源访问**：免费，包含GitHub模型访问、示例和文档 - **开发者访问**：即将推出，月费模式，包含API访问和高级功能 - **企业版**：定制定价，提供定制部署和白标解决方案 ## 目标用

视频生成

ImageToVideoMaker

ImageToVideoMaker

### 主要功能 - **文字转视频**: 通过自然语言描述生成包含对话、特效和环境音的4K视频。 - **图像转视频**: 利用增强的语义理解能力，将静态图片转换为动态视频。 - **AI数字人**: 仅需一张照片即可创建具有超逼真唇形同步的会说话头像，提供15+种声音或支持自定义音频。 - **视频放大**: 使用AI技术将模糊视频提升至2K/4K分辨率，增强细节和色彩。 - **AI视频特效与模板**: 提供数百种AI驱动的视频特效和模板，如AI Twerk、肌肉视频、街头采访等，无需编辑技能即可快速制作。 - **AI图像生成**: 包括文字转图像和图像转图像功能，用于创意图像生成和风格转换。 ### 主要特点 - **一体化平台**: 整合多种顶级AI模型（Veo 3, Kling 2.1, Hailuo 02, Seedance, Wan 2.2/2.5等），通过单一订阅即可全部使用。 - **无需学习曲线**: 上传和生成过程简单，无需技术技能。 - **电影级画质**: 支持生成4K视频，具有流畅的过渡效果。 - **高效生成**: 优化的AI引擎可在数分钟内完成视频

视频生成

AiVideoMaker

AiVideoMaker

## 主要功能 - **文本转视频**：通过文字描述瞬间创建视频 - **图像转视频**：一键将静态图像转换为精彩动画视频 - **AI会说话照片**：将图像转换为逼真的AI说话视频 - **为视频添加声音**：AI为视频智能添加背景音轨 - **AI视频升级器**：使用专业AI升级技术增强视频质量 ## 核心特点 - **免费在线使用**：无限制制作短视频，无需隐藏付费墙或信用卡 - **无限生成**：生成任意数量的片段，适合测试提示、完善想法或快速原型制作 - **无需注册**：即时开始创建，只需输入文本或上传图像 - **基于Wan 2.2模型**：构建在快速、现代的AI模型上，提供流畅运动、可靠渲染和创意结果 - **升级选项**：解锁720p导出、多个并发任务和YouTube、TikTok或客户项目的使用权 ## 使用流程 1. 输入文本或上传图像 2. 点击生成，AI将创建5秒480p视频 3. 下载并分享，免费用于个人项目或升级获得HD、更快工作流程和商业权利 ## 定价方案 - **免费计划**：$0/周，480p视频输出，5秒视频长度，标准队列速度，仅个人使用

个性化视频

Audio to Video AI Generator

Audio to Video AI Generator

## 主要功能 - 将音频文件转换为专业级说话视频 - 电影级质量的音频驱动人体动画 - 长视频动态一致性保持 - 高级动作和环境控制 - 自然的表情和手势生成 ## 核心优势 - 革命性的音频到视频AI技术 - 电影级输出质量 - 专业级人体动画 - 精确的环境和动作控制 - 长视频动态一致性 ## 目标用户 - 电影制作人 - 内容创作者 - 开发者 - 制作沉浸式AI驱动故事的专业人士 ## 使用场景 - 商务演示 - 教育内容 - 营销视频 - 故事叙述 - 专业内容创作 ## 定价模式提供免费试用，付费计划包含完整的商业使用权，适用于电影、电视、营销、广告等商业用途。 ## 数据安全 - 256位加密 - 100%隐私保护 - 24/7监控 - 音频文件安全处理，不与第三方共享 - 处理后自动删除数据 ## 处理时间大多数音频到视频转换在1-2分钟内完成，具体取决于音频长度和复杂度。

个性化视频

Fast Wan

Fast Wan

## 主要功能 - **Wan 2.2模型**：最新的视频生成模型，具有增强的视频生成能力、改进的质量和更快的处理速度 - **经典Wan 2.1**：经过验证的视频生成模型，提供可靠的结果和既定的质量标准 - **高质量输出**：专业级视频输出，具有惊人的视觉质量和细节保留 - **先进的AI技术**：利用尖端AI技术，提供高效强大的视频生成能力 - **创意控制**：通过可定制参数和灵活输入选项，享受精确的创意控制 - **快速处理**：优化的处理管道，减少创意项目的等待时间 ## 目标用户内容创作者、视频制作人、设计师、营销人员以及任何需要高质量AI生成视频的用户 ## 核心优势 - 提供两种强大的AI模型选择（Wan 2.2和Wan 2.1） - 专业级视频质量和细节保留 - 快速的视频生成处理速度 - 精确的创意控制和参数自定义 - 支持多种视频生成场景和风格 ## 典型用例 - 动漫角色视频生成 - 魔法厨房场景制作 - 快速汽车视频创作 - 美丽场景视频生成 - 赛博生物学主题视频 - 家庭场景视频制作 ## 附加工具平台还提供多种视频工具，包括：视频背景移除

个性化视频

Framepack AI

Framepack AI

## 主要功能 - **固定长度上下文压缩**：将所有输入帧压缩成固定长度的上下文'笔记'，防止内存使用随视频长度扩展 - **低硬件要求**：仅需6GB显存即可生成60-120秒30fps高质量视频，兼容RTX 30XX、40XX和50XX系列NVIDIA GPU - **高效生成**：在RTX 4090上约2.5秒/帧，使用teacache优化可降至1.5秒/帧 - **强抗漂移能力**：通过渐进式压缩和按重要性差异化处理帧，减轻'漂移'现象 - **多种注意力机制**：支持PyTorch attention、xformers、flash-attn和sage-attention ## 技术特点 - 基于下一帧预测神经网络结构 - 计算负载与视频长度解耦 - 支持FP16和BF16数据格式 - 开源免费，GitHub公开可用 ## 目标用户 - 内容创作者 - 视频制作从业者 - AI研究者 - 拥有消费级GPU的用户 ## 核心优势 - 显存需求极低（6GB即可运行）- 可生成长视频（60-120秒）- 开源免费，无使用限制 - 运行在本地设备，保护隐私 ## 使用流程 1

视频生成

Nereo

Nereo

### 工具简介 Nereo 是一个终极的一站式 AI 图像转视频生成器，旨在帮助用户快速将创意转化为专业视频。 ### 核心功能 - **图像转视频**：通过上传一张图片并提供文字提示，让静态图像动起来。 - **使用流程**：上传原始图片 -> 输入提示词（例如：“小女孩一直对着镜头微笑，并用手指戳镜头”）-> 生成视频。 - **文本转视频**：通过输入文字描述，直接生成视频内容。 - **使用流程**：输入提示词（例如：“动漫风格的玫瑰在吊桥前绽放，花瓣在空中飞舞”）-> 生成视频。 ### 主要特点与优势 - **一体化平台**：在一个地方访问包括 Veo3、Seedance、Wan2.2 和 Hailuo 在内的行业领先视频模型，无需在多个平台之间切换。 - **免费使用**：提供免费的 AI 视频生成服务。 - **快速高效**：能在几分钟内完成视频的生成，提升创作效率。 - **专业模型**：支持多种先进模型，以创建高质量、令人惊叹的视觉效果。 ### 支持的视频模型 - Veo 3 - Seedance - Wan 2.2 - Hailuo - 以及更多

视频生成

DeepVideo

DeepVideo

## 主要功能 - **AI数字主播**：支持多语言播报的逼真数字主播 - **头像克隆**：一键真人克隆，创建专属数字头像 - **声音克隆技术**：高保真声音克隆，完美重现声音特征 - **图像克隆**：从单张照片创建数字头像 ## 核心特点 - **超现实AI头像**：500+逼真头像，自然表情、手势和完美唇同步 - **全球语言矩阵**：120+语言和地区变体，一键本地化 - **声音DNA技术**：毫秒级精度声音克隆，可调节情感、节奏和语调 - **AI数字人工厂**：深度学习引擎创造无限超现实虚拟主持人 - **大型资源库**：100+专业数字主持人，300+工作室级声音 - **企业批量引擎**：高性能并行渲染，支持1000+同时视频生成 ## 使用流程 1. 注册获得1200免费积分 2. 选择500+AI头像之一或创建自定义头像 3. 输入脚本文本 4. AI自动生成视频（约5分钟） ## 定价模式 - 新用户注册赠送1200积分（可生成约2分钟HD视频） - 推荐朋友双方各获得1200积分 - 付费计划从$1起（页面显示$5起） - 相比传统制作成本降低99%

视频生成