浏览量:209
从文本描述生成全息3D全景世界
HoloDreamer是一个文本驱动的3D场景生成框架,能够生成沉浸式且视角一致的全封闭3D场景。它由两个基本模块组成:风格化等矩形全景生成和增强两阶段全景重建。该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化,然后利用3D高斯散射(3D-GS)技术快速重建3D场景,从而实现视角一致和完全封闭的3D场景生成。HoloDreamer的主要优点包括高视觉一致性、和谐性以及重建质量和渲染的鲁棒性。
小说推文视频 创作提效神器
极虎漫剪是一款优秀的漫画剪辑、小说推文生成工具,集成 AI 创作能力和 SD 绘图能力,通过极虎漫剪可以快速、方便、简洁、高效地制作小说推文的视频、图片等形式。它支持故事 AI 分镜、批量 SD 绘图、批量关键帧生成和图文视频一键合成等功能。极虎漫剪是小说推文创作的提效神器,适用于作家、漫画家、内容创作者等领域。
AI 漫画推文小说创作工具
爱推文是一个利用 AI 绘画帮助用户通过一键将小说推文转化成漫画视频解说进行快速变现的工具。通过 AI 识别和生成,将原来 1 天的工作缩短为 10 分钟,提升视频产出效率。所有画面、字幕、配音均为原创,保证纯原创视频内容。
一款让你沉浸在奇幻世界的阅读应用
奇书是一款让用户沉浸在奇幻世界的阅读应用。它提供了丰富的图书资源,包括小说、漫画、杂志等多种类型,用户可以根据自己的兴趣进行阅读。奇书具有简洁直观的界面,支持自定义阅读设置,如字体大小、背景颜色等。它还提供了书签功能,方便用户记录阅读进度。奇书的特色功能包括夜间模式、离线阅读、推荐书单等。奇书定价灵活,用户可以选择包月或包年的会员方式进行订阅,也可以单独购买某些特定的图书。无论是在公交车上、办公室间隙还是睡前,奇书都能给用户带来愉悦的阅读体验。
AI语音演员,自然表现力
Replica Studios AI Voice Actors是一个以人工智能为基础的语音演员库,提供自然表现力的文本转语音服务。您可以通过演员库选择适合您故事的完美声音,并使用Replica Studios的文本转语音工具录制、指导和导出您的项目所需的音频格式。无需信用卡,无需合约,免费试用。立即开始使用Replica Studios AI Voice Actors,为您的故事赋予声音。
智能穿戴设备领域的创新者
Gyges Labs致力于创造AI时代的智能穿戴设备,结合了独特的先进光学技术和协作AI技术。公司利用团队在微纳米光学方面的专业知识,开发了基于视网膜投影原理的DigiWindow技术,实现了世界上最小最轻的近眼显示模块。与Birdbath和波导等光学解决方案相比,DigiWindow不仅将尺寸从厘米减少到毫米,还降低了功耗,并提供了完整的视光学兼容性。此外,基于团队在协作AI方面的累积经验,Gyges Labs开发了基于镜像神经元原理并针对可穿戴设备定制的AI引擎Mirron,以增强未来可穿戴设备的感知和交互能力,为未来的“第二大脑”设备奠定了坚实的基础。
AI驱动的地下城RPG文字冒险游戏
AI Game Master是一款由AI驱动的地下城RPG文字冒险游戏,玩家可以在游戏中扮演英雄角色,选择剧情,通过文本指令进行战斗,并引导故事发展。这款游戏结合了AI技术,提供了一个无限制的想象空间,让玩家的每个文字输入都能塑造叙事。产品背景信息显示,AI Game Master旨在提供一种新颖的游戏体验,通过AI技术增强游戏的互动性和沉浸感。目前产品提供免费下载,玩家可以通过消耗币与AI互动,币可以通过游戏内机制获得。
漫画阅读与支持平台
comilio是一个漫画阅读平台,用户可以在这里阅读各种漫画作品,同时也能对喜欢的漫画家进行支持。该平台以其丰富的漫画资源和便捷的阅读体验受到用户的喜爱。此外,上传的漫画会利用图像识别等技术快速自动翻译成全球多种语言。它不仅提供了一个漫画爱好者交流的社区,还为漫画家提供了展示作品和获得收入的机会。comilio以其用户友好的界面和高质量的内容,在漫画阅读领域占有一席之地。
多智能体任务规划与推理的基准测试
PARTNR是由Meta FAIR发布的一个大规模基准测试,包含100,000个自然语言任务,旨在研究多智能体推理和规划。PARTNR利用大型语言模型(LLMs)生成任务,并通过模拟循环来减少错误。它还支持与真实人类伙伴的AI代理评估,通过人类在环基础设施进行。PARTNR揭示了现有基于LLM的规划器在任务协调、跟踪和从错误中恢复方面的显著局限性,人类能解决93%的任务,而LLMs仅能解决30%。
字体识别游戏,挑战你的字体知识
Font Guesser是一个在线互动游戏,旨在通过趣味的方式测试和提升用户对不同字体的识别能力。用户需要根据展示的字体样本猜测其类型,包括Display、Serif、Sans-Serif、Monospace、Handwriting和Decorative等。这个游戏不仅增加了用户对字体的认识,还能提升设计感和审美能力。产品背景信息显示,该游戏由Nitin设计并制作,旨在以趣味的方式教育用户识别和了解不同的字体。目前该游戏是免费的,适合所有对字体设计感兴趣的用户。
Agent S:一个开放的代理框架,让计算机像人类一样使用计算机。
Agent S是一个开放的代理框架,旨在通过图形用户界面(GUI)实现与计算机的自主交互,通过自动化复杂多步骤任务来转变人机交互。它引入了经验增强的分层规划方法,利用在线网络知识和叙事记忆,从过去的交互中提取高级经验,将复杂任务分解为可管理的子任务,并使用情景记忆进行逐步指导,Agent S不断优化其行动并从经验中学习,实现适应性强且有效的任务规划。Agent S在OSWorld基准测试中的表现超过了基线9.37%的成功率(相对提高了83.6%),并在WindowsAgentArena基准测试中展示了广泛的通用性。
AI驱动的小说阅读平台
WhatNovel是一个利用人工智能技术增强的小说阅读平台,它通过AI技术为用户提供个性化的小说推荐、智能问答、社区讨论等功能,旨在提升用户的阅读体验,帮助他们更深入地了解和参与到小说的世界中。该平台拥有超过1000万的AI增强章节阅读量,覆盖50多个国家,98%的用户愿意推荐给其他小说爱好者。
AI驱动的儿童电子绘本及故事创作平台
Readkidz是一个利用人工智能技术简化和加速儿童多媒体内容创作的平台。它提供了一个一站式解决方案,使得教育者、家长和内容创作者能够在短时间内制作出高质量、吸引人的儿童内容。平台通过AI辅助的故事生成、插图创作和视频制作,使得用户可以轻松地从概念到完成整个创作过程。Readkidz的界面直观、功能可定制,确保创作内容能够适应特定年龄段和教育目标,是将富有想象力和教育意义的故事变为现实的终极工具。
新一代的FydeOS,带来更智能的AI助手和游戏体验。
FydeOS v19 'Desolate Frontier' 是一个面向未来的操作系统,它通过集成的FydeOS AI智能助手、支持Steam的游戏体验、以及优化的Android游戏控制面板等特性,旨在提升用户的工作效率和游戏体验。此版本还引入了更快的分屏功能和改进的'Material You'设计,为用户提供了更加流畅和个性化的用户体验。FydeOS v19 致力于成为一个能够满足所有数字任务需求的突出平台,它的发展标志着FydeOS在操作系统领域的创新和进步。
Meta Quest 3S,混合现实体验新纪元。
Meta Quest 3S是一款混合现实头戴设备,提供沉浸式游戏体验、健身和娱乐功能,支持Facebook、Instagram和WhatsApp等应用且支持“Hey Meta”唤醒词来调用 Meta AI。它具有高分辨率显示、轻巧设计、创新的控制器设计和增强的触觉反馈。Meta Quest 3S旨在为用户带来前所未有的虚拟体验,同时保持舒适的佩戴体验和高性能的图形处理能力。
文本到图像生成工具,创造连贯角色故事。
StoryMaker是一个专注于文本到图像生成的AI模型,能够根据文本描述生成具有连贯性的角色和场景图像。它通过结合先进的图像生成技术和人脸编码技术,为用户提供了一个强大的工具,用于创作故事性强的视觉内容。该模型的主要优点包括高效的图像生成能力、对细节的精确控制以及对用户输入的高度响应。它在创意产业、广告和娱乐领域有着广泛的应用前景。
AI辅助的约会模拟游戏,提升你的约会技巧。
DateReady是一款利用人工智能技术帮助用户提升约会技巧的应用。通过模拟各种真实约会场景,用户可以练习对话技巧,增强自信,并在挑战性场景中提升自己的约会能力。它像是一个口袋里的秘密武器,让你在约会时拥有完美的台词,读懂气氛,将紧张不安转化为自信魅力。
与您一起生活、关怀、成长的数字人类
Altera是一个由计算神经科学家、物理学奥林匹克竞赛者和工程师组成的团队,致力于创造能够与人类一起生活、关怀、成长的数字人类。他们利用先进的人工智能技术,模仿大脑结构,构建具有前额叶皮层、记忆系统、社会情感状态等模型的数字代理。这些数字人类不仅能够与人类进行互动,还能在游戏等虚拟世界中迭代发展,最终实现多智能体模拟、工作力量,甚至物理形态的数字智能。
沟通无界,让每次对话都创造价值。
心辰Lingo语音大模型是一款先进的人工智能语音模型,专注于提供高效、准确的语音识别和处理服务。它能够理解并处理自然语言,使得人机交互更加流畅和自然。该模型背后依托西湖心辰强大的AI技术,致力于在各种场景下提供高质量的语音交互体验。
实时语音交互的人工智能对话系统。
Listening-while-Speaking Language Model (LSLM)是一款旨在提升人机交互自然度的人工智能对话模型。它通过全双工建模(FDM)技术,实现了在说话时同时监听的能力,增强了实时交互性,尤其是在生成内容不满意时能够被打断和实时响应。LSLM采用了基于token的解码器仅TTS进行语音生成,以及流式自监督学习(SSL)编码器进行实时音频输入,通过三种融合策略(早期融合、中期融合和晚期融合)探索最佳交互平衡。
全身运动生成框架,支持多模态控制
ControlMM是一个全身运动生成框架,具有即插即用的多模态控制功能,能够在文本到运动(Text-to-Motion)、语音到手势(Speech-to-Gesture)和音乐到舞蹈(Music-to-Dance)等多个领域中生成稳健的运动。该模型在可控性、序列性和运动合理性方面具有明显优势,为人工智能领域提供了一种新的运动生成解决方案。
共同创作故事,记录生活点滴
Thyme & Tell是一款协作性的故事创作应用,它将共享的经历转化为持久的叙述。适用于家庭、朋友或团队,提供了一种独特的方式捕捉、创造和保存你们的集体故事。它不仅支持图片,还结合了故事,使记忆更加珍贵。应用通过AI辅助写作,帮助用户以独特的视角讲述引人入胜的故事,并可以将数字故事转化为可保存的纪念品,如PDF格式,供世代传承。
电影台词搜索与生成工具
Screenflick是一个提供电影台词搜索和生成服务的网站,用户可以通过它来寻找特定的电影台词或生成新的台词。它不仅能够增加用户对电影的了解和兴趣,还能激发创意思维,为电影爱好者和创作者提供灵感。
使用LangGraph代理帮助用户编写故事
story-writing是一个基于LangGraph Cloud的应用程序,旨在以一种有趣且互动的方式展示LangGraph Cloud的功能。该应用程序允许用户在LangGraph代理的帮助下编写故事,用户可以编辑已经写好的章节,或者继续编写下一章。用户可以有多个相同章节编号的版本,并选择他们最喜欢的版本继续故事。在开始时,用户提供故事摘要、所需的写作风格和对故事重要的任何其他细节。从那时起,他们只需要提供编辑和继续指令,以引导代理朝期望的方向发展。注意:这个应用程序是一个原型,尚未准备好部署,可能会有bug或代理的输出结果不佳。
一个人的 AI 海龟汤游戏
“汤很热” 是一个以 AI 驱动的海龟汤游戏平台,旨在为用户提供一个充满悬疑和推理乐趣的游戏体验。用户可以通过提出问题来推理故事的背后真相,挑战自己的逻辑思维和想象力。部分故事包含恐怖和血腥元素,增加了游戏的刺激感。
AI 驱动的创意工具集,激发无限想象。
Glif AI 应用是一个集成了多种 AI 创意工具的平台,用户可以在这里找到和构建各种 AI 驱动的图像生成器、漫画生成器、角色生成器等。这些工具利用最新的 AI 技术,如神经网络,为用户提供了一种全新的创作方式,使得即使是没有专业设计背景的用户也能轻松创作出高质量的图像和艺术作品。
© 2024 AIbase 备案号:闽ICP备08105208号-14