浏览量:105
通过交互式3D生成技术,实现高质量且可控的3D模型创建。
Interactive3D是一个先进的3D生成模型,它通过交互式设计为用户提供了精确的控制能力。该模型采用两阶段级联结构,利用不同的3D表示方法,允许用户在生成过程的任何中间步骤进行修改和引导。它的重要性在于能够实现用户对3D模型生成过程的精细控制,从而创造出满足特定需求的高质量3D模型。
从单一视频创建实时互动游戏环境
Video2Game是一项技术,可以将单一视频转换成具有实时、互动、真实感和浏览器兼容性的高质量虚拟环境。它通过构建大规模的NeRF模型来实现高质量的表面几何形状,然后将该模型转换为带有对应刚体动力学的网格表示,以支持交互。使用UV映射的神经纹理,既能表达丰富,又与游戏引擎兼容。最终得到的是一个虚拟环境,虚拟角色可以与之互动,响应用户控制,并能从新的相机视角实时提供高分辨率渲染。
用于精细文本控制图像生成的空间对齐文本注入
FineControlNet是一个基于Pytorch的官方实现,用于生成可通过空间对齐的文本控制输入(如2D人体姿势)和实例特定的文本描述来控制图像实例的形状和纹理的图像。它可以使用从简单的线条画作为空间输入,到复杂的人体姿势。FineControlNet确保了实例和环境之间自然的交互和视觉协调,同时获得了Stable Diffusion的质量和泛化能力,但具有更多的控制能力。
基于实体表示的任意物体运动控制
DragAnything是一款利用实体表示实现任意物体运动控制的产品。与拖动像素的传统方式不同,DragAnything可以实现真正的实体级运动控制。它可以实现用户轨迹交互,并具有SAM功能。该产品可以精确控制物体的运动,生成高质量视频,用户只需在交互过程中绘制一条轨迹。DragAnything可实现对前景、背景和相机等不同元素的多样化运动控制。定位于设计领域,适用于需要对视频中物体进行精细控制的场景。产品定价未公开。
扩展ChatGPT,语音控制与朗读
Voice Control for ChatGPT x Mia AI是一个扩展,为ChatGPT提供语音控制和朗读功能。通过录音按钮,您可以录制并发送语音查询给ChatGPT,无需打字。AI的回答会朗读出来,确保流畅的听觉交互。此外,该插件还可以将ChatGPT变成您的个人语音助手,具备Mia AI的功能。
大规模视频生成扩散模型
Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达1分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字世界的能力,如三维一致性和交互,揭示了继续扩大视频生成模型规模来发展高能力模拟器的前景。
雷鸟自主研发的AI语音助手
RayNeo AI是雷鸟自主研发的人工智能语音助手,集成了自然语言处理、语音识别、语音合成等核心技术,可实现自然语言交互、语音控制等功能。该产品已在雷鸟XR系列产品中进行内测,支持行程规划、天气查询、百科知识问答等服务,提升了产品的智能化水平。下一步,RayNeo AI计划推出视觉识别等多模态交互能力,实现更丰富的人机交互体验。
您的个人AI助手,随着每次交谈变得更加智能
THERAi是一个随着每次交互变得更加个性化和智能的个人AI助手。它采用最先进的AI技术不断学习,以提供更加相关和有见地的回复。您对自己的数据拥有完全控制权,设置透明以管理用于学习和个性化的信息。
定制聊天体验,多样化GPTs工具
GPTs Store是一个平台,用户可以在这里探索多样化的GPTs工具,定制自己的聊天体验。用户可以创建自己的GPT,无需编程知识,通过对话界面给出指令和额外的知识,并选择其功能,如网络搜索、图像生成或数据分析。在GPTs Store上,用户可以共享他们的GPT创作,平台还设有经过验证的创作者作品,创作者可以根据GPT的使用情况获得收入。OpenAI在开发GPTs时非常重视隐私和安全,与GPTs的交互不与创作者共享,并且用户可以控制与第三方API共享数据的权限。
在线品牌指南平台
Corebook° 是一个在线品牌指南平台,为世界上最杰出的品牌及其创作者提供创新的品牌管理解决方案。它提供易于使用的界面和简洁的操作,帮助品牌团队轻松建立和维护品牌指南,实现品牌价值的共享和保护。Corebook° 还提供协作原型设计功能,支持多媒体内容的交互式品牌故事讲述,以及自定义 URL 和权限控制等特性。
学习交互式真实世界模拟器
UniSim是一个学习交互式真实世界模拟器的产品。它通过生成建模来模拟人类、机器人和其他类型的交互式代理所进行的行为,并产生逼真的体验。UniSim可以用于游戏和电影中可控内容的创建,以及在模拟中训练的代理直接部署到真实世界中。UniSim利用多样的数据集进行训练,模拟高级指令和低级控制的视觉结果。它可以用于训练高级视觉语言规划器和低级强化学习策略,并在真实世界中展现显著的迁移效果。UniSim还可以用于视频字幕和检测模型等其他类型的智能任务。通过UniSim,用户可以进行长期规划、强化学习和决策优化。
AI助手,提升生产力
Jarvis AI是一款强大的AI助手插件,可以与ChatGPT、GPT 4、Claude、Llama等多个AI模型进行无缝交互。它可以翻译、改善文本质量,处理电子邮件,并直接在文本输入中回答问题。它还具有智能搜索、语音控制、视频摘要、AI绘图等功能。无论你在哪个网站,Jarvis AI都能提供全方位的智能助理服务,让你的在线体验更加高效。
一个用于创建模块化数据可视化应用程序的工具包
Vizro是一个用于快速创建模块化数据可视化dashboard的工具包。它允许用户通过简单的配置就可以构建复杂的dashboard,无需高级编程和设计经验。用户可以定义组件、控制器、页面、布局、交互等,从而用极少的代码就能创建Plotly和Dash驱动的dashboard。Vizro使得低代码和高代码开发完美结合,既保证了快速迭代,又具备高度定制化的能力。
你的AI助手,帮你完成日常任务
Browser Buddy是一个强大的Google Chrome插件,允许你在任何标签页中与ChatGPT进行交互。它可以帮助你与任何网站进行对话,与PDF文件进行聊天,并提供一系列工具帮助你提高工作效率。你可以自定义设置以控制聊天结果,所有聊天记录都存储在本地,插件支持跨标签页持久化聊天,还可以选择网页上的文本进行快速交互。
将 GPT-4 Code Interpreter 铺陈在你的终端
Open Interpreter 是一款开源的本地运行实现,能让语言模型在你的电脑上运行代码(Python、JavaScript、Shell等)。你可以通过终端中的 ChatGPT 风格界面与 Open Interpreter 进行交互,只需在安装后运行 $ interpreter 即可。这为你提供了利用计算机通用功能的自然语言接口:创建和编辑图片、视频、PDF等;控制 Chrome 浏览器进行调研;绘制、清理和分析大型数据集等。值得注意的是,在代码执行前,你会被要求批准代码。
AI Event Idea Generator是一个在线虚拟活动平台
Remo AI Event Idea Generator是一个在线虚拟活动平台,具有强大的功能,可以帮助组织者打造沉浸式的虚拟活动体验。它提供了丰富的交互式环境,如展示厅、会议室、讨论区等,支持直播、分组讨论、网络研讨会等多种形式,非常适合举办产品发布会、年会、培训、研讨会等各类活动。Remo支持无限的参与人数,具有高质量的音视频功能。组织者可以进行全程活动控制,并获得实时数据分析。Remo简单易用,无需下载,通过浏览器就可加入活动,给与参与者极致的虚拟活动体验。
自定义模板提升ChatGPT的效果
LLM Format是一个在线工具,用于创建自定义模板,以提升ChatGPT的提示效果。它提供了一个简单易用的界面,让用户可以创建自己的模板,并将其应用于ChatGPT的输入。通过使用LLM Format,用户可以更好地控制ChatGPT生成的回答内容,从而提高交互的质量和效果。LLM Format还提供示例模板,方便用户快速上手。
天猫精灵,阿里巴巴人工智能实验室研发的智能语音交互系统
天猫精灵是阿里巴巴人工智能实验室自主研发的智能语音交互系统,具有语音识别、自然语言理解、对话管理、语音合成等核心技术能力,可以实现多轮语音交互、设备控制、信息查询、智能服务等功能。天猫精灵可广泛应用于智能家居、车载系统等领域,为用户提供便捷、智能的语音交互服务。
小米人工智能平台,提供语音交互技术
小米小爱开放平台基于小米的硬件生态和海量数据,提供领先的语音交互技术,包括语音识别、自然语言处理等,供开发者使用。开发者可以快速创建语音技能,将内容、服务、创意变为语音交互的体验。平台还提供智能家居语音服务,可以语音控制连接的智能设备。
泰勒AI帮助您的工程师训练模型。
Taylor AI是一个平台,可以使您的工程团队在不需要设置GPU和解密复杂库的情况下训练语言模型。它允许您按照自己的条件训练和部署开源语言模型,让您拥有完全的控制权和数据隐私。使用Taylor AI,您可以摆脱按标记付费的定价方式,自由地部署和与您的AI模型交互。它简化了训练和优化语言模型的过程,让您的团队可以专注于构建和迭代。Taylor AI始终跟上最新的开源模型,确保您可以使用最先进的语言模型进行训练。根据您独特的合规和安全标准安全地部署您的模型。
虚拟电子硬件、机器人编程
3D One AI基于物理刚体运动与三维数据处理技术,融合开源硬件、人工智能、编程等多学科实践,支持通过界面交互或编程控制物体的运动。3D One AI平台还提供虚拟开源硬件技术与人工智能技术,支持进行动态的人工智能行为仿真,以及输出三维动画。该软件支持小学、初中、高中阶段的人工智能教育,匹配国家教育标准与课标要求,助力普及化开课和科技人才培养。
语音交互人工智能助手
魔撰写作是一款基于语音交互和软硬结合的人工智能助手,可以帮助用户完成日常生活中的各种任务,包括语音助手、智能家居控制、语音翻译、语音记事本等功能。小问智能的优势在于准确率高、响应速度快、支持多语言、可定制化等特点。定价方面,提供免费版和付费版两种选择,付费版功能更加丰富,价格合理。小问智能的定位是成为用户日常生活中的智能助手。
人性化对话的创造性AI助手
Zenen AI是一款创造性AI助手,您可以像与朋友聊天一样与它进行有意义的对话。它通过语音控制实现人类般的交互,可以帮助您撰写故事、头脑风暴、制定营销计划,玩游戏或用笑话逗乐您。
现代数据平台,协作笔记本和美观数据应用
Hex是一个现代的数据科学和分析平台,提供协作笔记本、美观的数据应用和企业级安全。它支持SQL、Python和无代码的混合使用,内置AI助手,可生成、编辑、调试和解释代码。Hex还提供丰富的交互式可视化功能,支持各种图表、可格式化表格、透视表和地图。用户可以使用Hex构建仪表盘、报告和交互式工具,并轻松添加输入参数,例如下拉菜单、滑块和按钮。Hex还支持实时协作、版本控制、工作区组织和强大的搜索功能。它可以与主流的数据仓库和数据库进行连接,并提供与dbt、Snowflake、Spark等工具的深度集成。
交互式基于点的生成对抗网络图像操控
Drag Your GAN是一个交互式的点操作生成对抗网络(GAN)的工具。它通过拖动图像上的点来精确控制生成图像的姿态、形状、表情和布局。通过Drag Your GAN,用户可以操纵不同类别的图像,如动物、汽车、人类、风景等。这些操纵是在学习的生成图像流形上进行的,因此即使在挑战性场景下(如幻象遮挡内容和保持对象刚性形变),也能产生逼真的输出。Drag Your GAN优于先前方法在图像操作和点跟踪任务上的表现。
一种通过大型语言模型引导的模拟到现实世界转移策略,用于获取机器人技能。
DrEureka是一个利用大型语言模型(LLMs)自动化和加速模拟到现实(sim-to-real)设计的方法。它通过物理模拟自动构建合适的奖励函数和领域随机化分布,以支持现实世界中的转移。DrEureka在四足机器人运动和灵巧操作任务上展示了与人工设计相媲美的sim-to-real配置,并能够解决如四足机器人在瑜伽球上平衡和行走等新颖任务,无需人工迭代设计。
© 2024 AIbase 备案号:闽ICP备2023012347号-1