将文本和图像转化为影片,提供顶级AI视频生成体验。
Seedance 1.0 AI是一款顶级视频生成器,具有行业领先的提示理解和多镜头连贯性,可将您的创意转化为电影杰作。其主要优点在于处理复杂的电影序列,维持完美的风格一致性,以及提供真正的1080p影院级质量输出。价格和定位信息请查阅官方网站。
ModAstera提供用于医疗AI开发的平台,让您比竞争对手更快地进行创新。
ModAstera提供一站式的医疗AI开发平台,利用AI辅助数据标注和医疗AI工程代理加速研发进程,降低开发成本,并比竞争对手更快地推向市场。产品符合医疗健康行业的数字化转型需求。
AI驱动的财经科技新闻伴侣。
Morning Expert提供AI驱动的个性化财经科技新闻,旨在消除信息噪音,为用户提供有价值的资讯,并保持领先竞争。产品背景信息,定位于为繁忙的专业人士提供精准的新闻服务。
领先的虚拟试穿技术,改变时尚活动和消费者体验。
FASHN 是一种创新的虚拟试穿技术,旨在帮助时尚行业提升客户体验与市场推广效率。通过 FASHN,用户可以快速生成虚拟试穿效果,帮助设计师、品牌及零售商更好地展示服装。该平台支持无需复杂训练即可使用,适合各种规模的时尚企业,助力他们在竞争激烈的市场中脱颖而出。
国产视频生成大模型 Vidu Q1,支持高清 1080p 视频生成,性价比极高。
Vidu Q1 是由生数科技推出的国产视频生成大模型,专为视频创作者设计,支持高清 1080p 视频生成,具备电影级运镜效果和首尾帧功能。该产品在 VBench-1.0 和 VBench-2.0 评测中位居榜首,性价比极高,价格仅为同行的十分之一。它适用于电影、广告、动漫等多个领域,能够大幅降低创作成本,提升创作效率。
MoCha 致力于生成电影级别的对话角色合成。
MoCha 是一种创新的技术,旨在合成高质量的对话角色,使其在影视制作、游戏和动画中应用广泛。该技术的主要优点是能生成更自然、流畅的角色对话,增强了观众的沉浸感。MoCha 的市场定位为专业的影视制作公司和独立开发者,致力于提升角色交互的真实感。产品采用基于深度学习的模型,价格策略为付费,提供不同层级的服务包。
Blooper 是一款利用 AI 技术简化影视制作前期流程的平台,让剧本分解、故事板生成、场地选址等环节更加高效便捷。
Blooper 是一款面向影视制作领域的 AI 生产力工具,它通过智能化手段将复杂的影视前期制作流程简化,帮助创作者和制作团队高效完成剧本分解、故事板生成、场地选址、情绪板制作以及项目提案等工作。其核心优势在于利用 AI 技术快速处理剧本,自动生成详细的镜头列表、角色列表、道具列表等,大大节省了人工分解剧本的时间和精力。同时,它能够根据剧本内容快速生成符合视频构图规则的故事板,让创作者在拍摄前就能直观地看到视频的视觉效果,提前规划拍摄方案。此外,Blooper 还提供场地选址功能,能够根据项目需求快速推荐合适的拍摄场地,进一步优化制作流程。该平台的出现,旨在帮助影视制作团队提高工作效率,降低制作成本,确保项目顺利推进。
通过扩散模型实现单目视频的相机轨迹重定向。
TrajectoryCrafter 是一种先进的相机轨迹重定向工具,利用扩散模型技术,将单目视频中的相机运动重新设计,提升视频的表现力和视觉吸引力。该技术可广泛应用于影视制作和虚拟现实等领域,具备高效、便捷和创新的特点,旨在为用户提供更多创意自由和控制能力。
Clone是一款具有革命性人工肌肉技术Myofiber的类人机器人,能够自然行走。
Clone是一款由Clone Robotics开发的类人机器人,代表了机器人技术的前沿水平。它采用了革命性的人工肌肉技术Myofiber,能够模拟自然动物骨骼的运动。Myofiber技术在重量、功率密度、速度、力量与重量比以及能效方面达到了前所未有的水平,使机器人具备了自然的行走能力、强大的力量和灵活性。Clone不仅在技术上具有重要意义,还为未来机器人在家庭、工业和服务领域的应用提供了新的可能性。其定位为高端科技产品,目标受众是对前沿科技感兴趣的个人、科研机构和企业。
VideoGrain 是一种零样本方法,用于实现类别级、实例级和部件级的视频编辑。
VideoGrain 是一种基于扩散模型的视频编辑技术,通过调节时空注意力机制实现多粒度视频编辑。该技术解决了传统方法中语义对齐和特征耦合的问题,能够对视频内容进行精细控制。其主要优点包括零样本编辑能力、高效的文本到区域控制以及特征分离能力。该技术适用于需要对视频进行复杂编辑的场景,如影视后期、广告制作等,能够显著提升编辑效率和质量。
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
SkyReels V1 是一个基于 HunyuanVideo 微调的人类中心视频生成模型。它通过高质量影视片段训练,能够生成具有电影级质感的视频内容。该模型在开源领域达到了行业领先水平,尤其在面部表情捕捉和场景理解方面表现出色。其主要优点包括开源领先性、先进的面部动画技术和电影级光影美学。该模型适用于需要高质量视频生成的场景,如影视制作、广告创作等,具有广泛的应用前景。
SkyReels-V1 是首个开源的人类中心视频基础模型,专注于高质量视频生成。
SkyReels-V1 是一个开源的人类中心视频基础模型,基于高质量影视片段微调,专注于生成高质量的视频内容。该模型在开源领域达到了顶尖水平,与商业模型相媲美。其主要优势包括:高质量的面部表情捕捉、电影级的光影效果以及高效的推理框架 SkyReelsInfer,支持多 GPU 并行处理。该模型适用于需要高质量视频生成的场景,如影视制作、广告创作等。
Alice 是一款利用 AI 技术帮助用户高效备考、提升学习效率的智能学习工具。
Alice 是一款基于 OpenAI 技术开发的智能学习平台,旨在通过 AI 驱动的学习工具帮助学生更高效地备考。它能够将用户上传的学习材料转化为个性化的笔记、总结和练习题,并提供即时反馈,帮助学生发现学习中的薄弱环节。Alice 的主要优点在于其强大的 AI 能力,能够根据用户的学习进度和需求生成定制化的内容,从而提高学习效率和考试成绩。产品目前提供免费的 Hustler Plan,以及按月或年付费的订阅计划,适合不同学习需求和预算的学生。
CineMaster 是一个 3D 意识的可控文本到视频生成框架,允许用户在 3D 空间中操纵对象和相机。
CineMaster 是一款专注于高质量电影级视频生成的框架,通过 3D 意识和可控性,让用户能够像专业电影导演一样精确地控制场景中的对象放置、相机运动以及渲染帧的布局。该框架通过两阶段操作实现:第一阶段通过交互式工作流让用户在 3D 空间中直观地构建条件信号;第二阶段将这些信号作为文本到视频扩散模型的指导,生成用户期望的视频内容。CineMaster 的主要优点是其高度的可控性和 3D 意识,能够生成高质量的动态视频内容,适用于影视制作、广告创作等领域。
通过上传照片,利用AI技术匹配电影和电视剧中的相似角色,体验趣味变脸服务。
该产品利用先进的AI技术,通过分析用户的面部特征、表情和姿势,将其与电影、电视剧和游戏中的角色进行匹配。用户可以上传照片,快速找到与自己相似的角色,并体验变脸功能,生成有趣的内容。该产品以趣味性和娱乐性为主,旨在为用户提供一种全新的互动体验,适合喜欢电影、电视剧和社交媒体分享的用户。产品目前免费,定位为轻娱乐工具,适合广泛的用户群体。
通过AI语言导师,让语言学习变得简单,快速提升口语能力。
Lingocat是一款利用AI技术帮助用户学习语言的应用。它通过模拟真实对话场景,让用户在与AI导师的互动中提升语言能力。其主要优点是提供了一个无压力的练习环境,用户可以随时随地进行口语练习。产品定位为语言学习爱好者和需要提升语言能力的人群,目前可在iOS平台下载使用,价格未明确说明,但通常此类应用会有免费试用或付费版本。
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
rStar-Math是一项研究,旨在证明小型语言模型(SLMs)能够在不依赖于更高级模型的情况下,与OpenAI的o1模型相媲美甚至超越其数学推理能力。该研究通过蒙特卡洛树搜索(MCTS)实现“深度思考”,其中数学策略SLM在基于SLM的流程奖励模型的指导下进行测试时搜索。rStar-Math引入了三种创新方法来应对训练两个SLM的挑战,通过4轮自我演化和数百万个合成解决方案,将SLMs的数学推理能力提升到最先进水平。该模型在MATH基准测试中显著提高了性能,并在AIME竞赛中表现优异。
FitDiT 是一种用于高保真虚拟试衣的新型服装感知增强技术。
FitDiT 旨在解决图像基础虚拟试衣中高保真度和鲁棒性不足的问题,通过引入服装纹理提取器和频域学习,以及采用扩张松弛掩码策略,显著提升了虚拟试衣的贴合度和细节表现,其主要优点是能够生成逼真且细节丰富的服装图像,适用于多种场景,具有较高的实用价值和竞争力,目前尚未明确具体价格和市场定位。
© 2025 AIbase 备案号:闽ICP备08105208号-14