需求人群:
"自动驾驶研究、仿真、数据增强"
使用场景示例:
基于视频输入生成不同的可能驾驶场景
结合文本提示生成不同天气条件下的驾驶场景
输入行动序列控制自己车辆的运动轨迹
产品特色:
基于多模态输入生成视频
支持精细控制自己车辆行为
支持精细控制场景特征
可生成长时间高质量驾驶场景
浏览量:28
最新流量情况
月访问量
60.39k
平均访问时长
00:00:36
每次访问页数
1.94
跳出率
43.55%
流量来源
直接访问
37.53%
自然搜索
48.47%
邮件
0.10%
外链引荐
6.97%
社交媒体
6.15%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
西班牙
2.77%
英国
17.21%
印度
3.71%
哈萨克斯坦
3.08%
美国
38.23%
安博思公司开发的40亿参数通用式生成世界模型
GAIA-1是一种具有90亿参数的通用式生成世界模型,专为自动驾驶而设计。它可以通过视频、文本和动作输入生成逼真的驾驶场景视频,并可以精细控制自己车辆的行为以及场景中的特征。GAIA-1利用多模态学习方法,可以生成丰富多样的驾驶场景,增强自动驾驶系统的学习和解释能力。它的关键功能包括:基于视频、文本和动作的生成能力、可控性高、支持长时间生成、可扩展等。GAIA-1可用于自动驾驶研究、仿真、数据增强等多种应用场景。它代表了生成式AI在自动驾驶领域的先进探索,为创新提供了无限可能。
一站式OCR代理,快速从图像中生成洞见。
TurboLens是一个集OCR、计算机视觉和生成式AI于一体的全功能平台,它能够自动化地从非结构化图像中快速生成洞见,简化工作流程。产品背景信息显示,TurboLens旨在通过其创新的OCR技术和AI驱动的翻译及分析套件,从印刷和手写文档中提取定制化的洞见。此外,TurboLens还提供了数学公式和表格识别功能,将图像转换为可操作的数据,并将数学公式翻译成LaTeX格式,表格转换为Excel格式。产品价格方面,TurboLens提供免费和付费两种计划,满足不同用户的需求。
利用NVIDIA AI构建视频搜索和摘要代理
NVIDIA AI Blueprint for Video Search and Summarization是一个基于NVIDIA NIM微服务和生成式AI模型的参考工作流程,用于构建能够理解自然语言提示并执行视觉问题回答的视觉AI代理。这些代理可以部署在工厂、仓库、零售店、机场、交通路口等多种场景中,帮助运营团队从自然交互中生成的丰富洞察中做出更好的决策。
使用生成式AI快速回顾你喜爱的剧集
Prime Video的X-Ray Recaps功能利用生成式人工智能技术,为用户提供电视剧集的简短、易于消化的总结。这项功能可以创建整季、单集甚至片段的个性化摘要,精确到观众观看的确切分钟。X-Ray Recaps在用户需要时提供关键情节、角色驱动的情节点和其他细节的文本片段,增强了流媒体体验,让用户无需担心剧透或重看已看过的内容。
企业级生成式AI客服代理
Decagon是一个企业级的客户支持AI平台,提供生成式AI代理,以提供令人惊叹的顾客体验。它被大型企业和高增长初创公司所信赖。Decagon的AI支持代理能够实现真正的自动解决,提供100%的生成式响应和行动,无需复杂的决策树或预设响应。它还提供无缝集成,能够与现有的工具和数据源进行零提升集成,最大化AI的潜力。此外,Decagon还提供AI驱动的洞察力,帮助企业识别主题、发现异常,并解锁对有价值对话的分析。Decagon在2024年完成了6500万美元的B轮融资,由Bain和Elad Gil领投,这显示了其在AI客服领域的强大背景和市场定位。
自动化的生成式AI评估平台
AutoArena是一个自动化的生成式AI评估平台,专注于评估大型语言模型(LLMs)、检索增强生成(RAG)系统和生成式AI应用。它通过自动化的头对头判断来提供可信的评估,帮助用户快速、准确、经济地找到系统的最佳版本。该平台支持使用来自不同供应商的判断模型,如OpenAI、Anthropic等,也可以使用本地运行的开源权重判断模型。AutoArena还提供了Elo评分和置信区间计算,帮助用户将多次头对头投票转化为排行榜排名。此外,AutoArena支持自定义判断模型的微调,以实现更准确、特定领域的评估,并可以集成到持续集成(CI)流程中,以自动化评估生成式AI系统。
特斯拉自动驾驶技术与机器人的未来愿景
We, Robot 是特斯拉公司展示其在自动驾驶技术和机器人技术领域愿景的页面。它强调了特斯拉对于创建可持续未来、提高交通效率、可负担性和安全性的承诺。该页面介绍了特斯拉的全自动驾驶技术(监督)以及未来自动驾驶汽车和机器人的潜在应用,如Robotaxi、Robovan和Tesla Bot。这些技术旨在通过自动化提高日常生活的便利性,同时减少交通事故,降低交通成本。
高精度单目深度估计模型
Depth Pro是一个用于单目深度估计的研究项目,它能够快速生成高精度的深度图。该模型利用多尺度视觉变换器进行密集预测,并结合真实与合成数据集进行训练,以实现高准确度和细节捕捉。它在标准GPU上生成2.25百万像素深度图仅需0.3秒,具有速度快、精度高的特点,对于机器视觉和增强现实等领域具有重要意义。
一个全面的生成式AI代理开发和实现资源库
GenAI_Agents是一个开源的、面向生成式AI代理开发和实现的资源库。它提供了从基础到高级的教程和实现,旨在帮助开发者学习、构建和分享生成式AI代理。这个资源库不仅适合初学者,也适合经验丰富的从业者,通过提供丰富的示例和文档,促进学习和创新。
AI与产品管理领域的知识社区
觅识AI社区是一个专注于人工智能与产品管理领域的知识社区,提供AI产品管理的相关知识体系和研发产品用例。社区成员有机会成为'超级个体和一人公司'。可通过邮件或社交媒体与主理人联系,加入AI PM社区。
高保真动态城市场景重建技术
OmniRe 是一种用于高效重建高保真动态城市场景的全面方法,它通过设备日志来实现。该技术通过构建基于高斯表示的动态神经场景图,以及构建多个局部规范空间来模拟包括车辆、行人和骑行者在内的各种动态行为者,从而实现了对场景中不同对象的全面重建。OmniRe 允许我们全面重建场景中存在的不同对象,并随后实现所有参与者实时参与的重建场景的模拟。在 Waymo 数据集上的广泛评估表明,OmniRe 在定量和定性方面都大幅超越了先前的最先进方法。
企业自定义AI工作流程的蓝图
NVIDIA NIM™ Agent Blueprints是一系列预训练的、可定制的AI工作流程,旨在为数百万企业开发者提供构建和部署生成式AI应用程序的全套软件工具。这些蓝图支持开发者使用一个或多个AI代理创建AI应用程序,包括客户服务头像、检索增强生成和药物发现虚拟筛选等典型用例。通过NIM Agent Blueprints,企业可以使用自己的业务数据修改蓝图,并在加速数据中心和云上运行生成式AI应用程序,实现数据驱动的AI飞轮效应。
高效低成本的小型语言模型
Phi-3是微软Azure推出的一系列小型语言模型(SLMs),具有突破性的性能,同时成本和延迟都很低。这些模型专为生成式AI解决方案设计,体积更小,计算需求更低。Phi-3模型遵循微软AI原则开发,包括责任、透明度、公平性、可靠性和安全性、隐私和安全性以及包容性,确保了安全性。此外,Phi-3还提供了本地部署、准确相关回答、低延迟场景部署、成本受限任务处理和定制化精度等功能。
专业的数据解决方案提供商
博登智能自主研发的数据标注处理平台——BASE(Boden Annotation Service Enhancement),具有超强适用性,可完成从数据采集、清洗、标注到验证的全套服务。BASE平台覆盖了包括语音、文本、图像、视频、点云等多种模态类型的数据处理能力,通过AI辅助标注的形式,相较于传统的标注方式,帮助企业节省了高达30%-40%的成本,并提升50%以上的效率,已经获得了市场的广泛认可。 数据处理平台——BASE平台能够支持开展包括通用图像标注,3D/4D点云标注,图片点云融合标注,NLP文本标注,医疗影像标注,视频描述标注,音素标注,音频标注等标注业务。
从文本描述生成高质量的3D室内场景。
SceneTeller是一个创新的3D场景生成平台,它利用最新的生成式人工智能技术,允许用户通过自然语言描述来设计室内3D场景。这项技术大大降低了3D设计的技术门槛,使得非专业用户也能轻松创建个性化的3D空间。产品的主要优点包括易用性、高效率和创意自由度。
新一代AI工程师在GitHub上构建
GitHub Models是GitHub推出的新一代AI模型服务,旨在帮助开发者成为AI工程师。它将行业领先的大型和小型语言模型直接集成到GitHub平台,让超过1亿用户能够直接在GitHub上访问和使用这些模型。GitHub Models提供了一个交互式的模型游乐场,用户可以在这里测试不同的提示和模型参数,无需支付费用。此外,GitHub Models与Codespaces和VS Code集成,允许开发者在开发环境中无缝使用这些模型,并通过Azure AI实现生产部署,提供企业级安全和数据隐私保护。
图像材质属性编辑技术
Alchemist是一种利用预训练的文本到图像模型和合成数据,允许用户在图像中编辑物体的材质属性的技术。它通过微调合成数据集,实现了对物体的特定材质属性(如粗糙度、金属感、基础颜色饱和度和透明度)的参数化编辑控制。这项技术的主要优点包括在保持物体几何形状和图像光照不变的同时,能够改变物体的属性,甚至在物体透明化时,能够真实地填充背后的背景、隐藏的内部结构和折射光效果。
让任何人的声音听起来调皮/有趣
bleep_that_sht 是一个使用 Python 编写的应用程序,它利用 Whisper 转录模型来转录音频,然后根据用户选择的关键词,使用相应的时间戳来替换为哔声。所有处理都在本地完成,无需上传数据,保护用户隐私。
欧洲最大的私人人工智能实验室
Silo AI 是欧洲最大的私人人工智能实验室,与行业领导者合作开发智能设备、自动驾驶车辆、工业4.0和智能城市。其产品和技术致力于将最先进的人工智能带入生产,为客户带来利益。
自动驾驶与视觉语言模型的融合
DriveVLM是一个自动驾驶系统,它利用视觉语言模型(VLMs)来增强场景理解和规划能力。该系统通过独特的推理模块组合,包括场景描述、场景分析和分层规划,以提高对复杂和长尾场景的理解。此外,为了解决VLMs在空间推理和计算需求上的局限性,提出了DriveVLM-Dual,这是一个混合系统,结合了DriveVLM的优势和传统自动驾驶流程。在nuScenes数据集和SUP-AD数据集上的实验表明,DriveVLM和DriveVLM-Dual在处理复杂和不可预测的驾驶条件方面非常有效。最终,DriveVLM-Dual在生产车辆上进行了部署,验证了其在现实世界自动驾驶环境中的有效性。
系统性调研生成式AI的提示技术
The Prompt Report 是一份系统性调研报告,专注于生成式人工智能(GenAI)的提示技术。它通过结合人类和机器的努力,从多个数据库中处理了4797条记录,提取出1565篇相关论文。报告提供了58种基于文本的技术,并补充了多模态和多语言技术的广泛集合。其目标是提供一个易于理解和实施的提示技术目录,并回顾了作为提示扩展的代理,包括评估输出和设计有助于安全性和安全性的提示的方法。此外,报告还应用提示技术在两个案例研究中进行了实践。
用于训练大型语言模型的开源合成数据生成管道。
Nemotron-4 340B是NVIDIA发布的一系列开放模型,专为生成合成数据以训练大型语言模型(LLMs)而设计。这些模型经过优化,可以与NVIDIA NeMo和NVIDIA TensorRT-LLM配合使用,以提高训练和推理的效率。Nemotron-4 340B包括基础、指令和奖励模型,形成一个生成合成数据的管道,用于训练和完善LLMs。这些模型在Hugging Face上提供下载,并很快将在ai.nvidia.com上提供,作为NVIDIA NIM微服务的一部分。
NVIDIA ACE是一套用于创建数字人类、AI非玩家角色和交互式头像的生成式AI技术套件。
NVIDIA ACE提供了一套先进的生成式AI模型和微服务,易于部署且性能优越。这些AI模型基于商业安全、负责任许可的数据进行训练,并通过微调和防护措施确保无论用户输入如何,都能提供准确、恰当、切题的结果。ACE支持灵活的部署选项,可以在云端或NVIDIA RTX AI PC上部署和运行。此外,ACE还提供了数字人类工作流程,允许开发者将ACE NIMs集成到他们的产品、工具、服务或游戏中,用于特定领域的AI工作流程,如NPC和客户服务助手。NVIDIA还与Inworld AI合作,展示了将NVIDIA ACE集成到一个端到端NPC平台中的示例,该平台在Unreal Engine 5中提供了尖端的视觉效果。
加速个性化LLM的来临。
Prem是一个加速个性化LLM(小型语言模型)发展的人工智能平台。它提供了一个直观易用的开发平台,用于构建生成式AI解决方案。Prem还提供了定制化的模型微调和训练服务,以满足独特的业务需求。通过Prem,用户可以获得对AI的最大潜力的掌控和所有权,而无需深入的专业知识。
ProJourney AI是一个生成式AI工具,为设计师和创作者提供了无需通过Discord的Midjourney生成器的访问权限,轻松通过文本提示生成高质量图像。
ProJourney AI是一个生成式AI工具,为设计师和创作者提供了访问Midjourney生成器的能力。它可以通过简单的文本提示生成高质量的图像,并且不需要将这些图像公开共享在Discord上。该工具的主要优点是提供了私密的图像生成功能,并且用户可以自由控制生成图像的质量和风格。ProJourney AI适用于各种设计任务,包括平面设计、插画、用户界面设计等。
一个开源的、增强检索的生成式聊天机器人。
Verba 是一个开源应用程序,旨在提供端到端、流畅且用户友好的检索增强生成(RAG)接口。它结合了最先进的RAG技术和Weaviate的上下文感知数据库,支持本地或通过云部署,可以轻松探索数据集并提取洞见。
使用生成式人工智能改变搜索体验
GenSearch是一款使用生成式人工智能技术的搜索引擎,通过强大的功能和用户友好的设计,提供精确的搜索结果,增强用户参与度和满意度。它不需要编写任何代码即可实现搜索引擎的部署和交付。GenSearch正在不断改进,计划推出API接口、数据驱动洞察和对话式搜索等功能。
隐私第一的企业生成式AI平台
Omnifact是专为工作场所打造的隐私第一的生成式AI平台。充分利用生成式AI的潜力,同时保护您的数据主权。Omnifact提供安全的企业级生成式AI平台,旨在提升生产力,简化知识管理,推动创新,并优先考虑数据安全和隐私。
© 2024 AIbase 备案号:闽ICP备08105208号-14