浏览量:6
最新流量情况
月访问量
1901
平均访问时长
00:01:23
每次访问页数
2.56
跳出率
33.17%
流量来源
直接访问
46.87%
自然搜索
38.34%
邮件
0.06%
外链引荐
6.50%
社交媒体
7.58%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
印度
13.09%
美国
86.91%
企业级分析辅助工具
ChatAible是一个利用生成式人工智能技术的企业级分析辅助工具,通过自动提问数据并生成关键洞察,以易于理解的方式呈现给商业领导。它使用Aible的解释性人工智能验证和补充生成式AI的总结,帮助企业用户快速发现隐藏的洞察。ChatAible的功能包括自动提问数据、生成关键洞察、验证AI总结、生成仪表盘等。
SUSE AI是为GenAI工作负载设计的安全可靠的企业级部署和运行平台。
SUSE AI是一个为企业级部署和运行任何生成性人工智能(GenAI)工作负载而设计的安全可靠的平台。它提供了零信任安全和可观测性,作为一个集成解决方案,SUSE AI是一个灵活且模块化的平台,提供了可扩展性。SUSE AI让您控制自己的AI解决方案,赋予选择和主权。SUSE AI的价值基于三个基础支柱:选择、安全和信任。这个结构让企业可以选择最适合它们的AI模型和使用方式。SUSE AI提供了工具,帮助企业满足合规要求,简化了复杂的监管环境。SUSE AI不仅是满足当前需求,更是为未来的AI投资提供保障。它是一个开放的企业AI基础设施平台,让您可以选择轻松集成新兴技术和模型。
AI代理,用于产品规划和推荐
SwarmStack是一个利用人工智能技术为产品规划和推荐提供支持的平台。它通过分析市场趋势和用户行为,帮助企业优化产品线和提升销售效率。产品背景信息显示,SwarmStack由Epsilla公司开发,旨在通过智能算法辅助企业决策,提高产品推荐的准确性和个性化。SwarmStack的价格和定位信息未在页面中明确提供,但考虑到其AI技术和商业应用,可能面向中大型企业,提供定制化服务。
自动化研究与开发工具,提升研发效率与质量。
RD-Agent是微软亚洲研究院推出的一款自动化研究与开发工具,依托大语言模型的强大能力,开创了以人工智能驱动R&D流程自动化的新模式。它通过整合数据驱动的R&D系统,可以借助人工智能能力驱动创新与开发的自动化,不仅提高了研发效率,还利用智能化的决策和反馈机制,为未来的跨领域创新与知识迁移提供了无限可能。
数据驱动的营销叙事工具
DataGems是一个利用人工智能技术将分散的营销数据转化为引人入胜的叙事的平台。它通过直观的自动化营销分析平台,帮助企业发现营销数据中的宝贵见解,从而驱动增长和参与策略。产品背景信息包括与多个数据平台集成,如Instagram、Mixpanel、Appstore等,以及提供实时数据更新和AI数据代理来追踪营销数据的变化。价格方面,DataGems提供从免费到定制化的多种订阅方案,以满足不同规模企业的需求。
构建基于检索增强生成(RAG)和代理的生成式AI应用的先进语言模型
Amazon Titan Text Premier 是 Amazon Titan 系列模型中的新成员,专为文本基础的企业级应用设计,支持定制化微调以适应特定领域、组织、品牌风格和用例。该模型在 Amazon Bedrock 中提供,具备32K令牌的最大上下文长度,特别适合英文任务,并整合了负责任的人工智能实践。
一个新的高效开源大型语言模型标准
DBRX是一个由Databricks的Mosaic研究团队构建的通用大型语言模型(LLM),在标准基准测试中表现优于所有现有开源模型。它采用Mixture-of-Experts (MoE)架构,使用362亿个参数,拥有出色的语言理解、编程、数学和逻辑推理能力。DBRX旨在推动高质量开源LLM的发展,并且便于企业根据自身数据对模型进行定制。Databricks为企业用户提供了交互式使用DBRX、利用其长上下文能力构建检索增强系统,并基于自身数据构建定制DBRX模型的能力。
MMAudio根据视频和/或文本输入生成同步音频。
MMAudio是一种多模态联合训练技术,旨在高质量的视频到音频合成。该技术能够根据视频和文本输入生成同步音频,适用于各种应用场景,如影视制作、游戏开发等。其重要性在于提升了音频生成的效率和质量,适合需要音频合成的创作者和开发者使用。
3D自主角色的沉浸式交互框架
SOLAMI是一个端到端的社交视觉-语言-动作(VLA)建模框架,用于与3D自主角色进行沉浸式交互。该框架通过综合三个主要方面构建3D自主角色:社交VLA架构、交互式多模态数据和沉浸式VR界面。SOLAMI的主要优点包括更精确和自然的字符响应(包括语音和动作),与用户期望一致,并且延迟更低。该技术的重要性在于它为3D自主角色提供了类似人类的社交智能,使其能够感知、理解和与人类进行交互,这是人工智能领域中的一个开放且基础的问题。
基于条件扩散模型的人类-物体交互合成技术
Controllable Human-Object Interaction Synthesis (CHOIS) 是一种先进的技术,它能够根据语言描述、初始物体和人类状态以及稀疏物体路径点来同时生成物体运动和人类运动。这项技术对于模拟真实的人类行为至关重要,尤其在需要精确手-物体接触和由地面支撑的适当接触的场景中。CHOIS通过引入物体几何损失作为额外的监督信息,以及在训练扩散模型的采样过程中设计指导项来强制执行接触约束,从而提高了生成物体运动与输入物体路径点之间的匹配度,并确保了交互的真实性。
Anduril与OpenAI合作,推进美国人工智能领导力并保护美国及盟军。
Anduril Industries是一家国防技术公司,与OpenAI合作,共同开发并负责任地部署先进的人工智能解决方案,用于国家安全任务。通过结合OpenAI的先进模型和Anduril的高性能国防系统及Lattice软件平台,合作旨在提高保护美国及盟军军事人员免受无人机和其他空中设备攻击的国防系统。这一合作强调了美国在人工智能领域的领导地位
创建并分享你热爱的一切事物的列表。
Hypelist是一个在线平台,允许用户创建和分享关于他们所热爱的一切事物的列表,包括书籍、电影、音乐、旅行地点等。这个平台利用人工智能技术,根据用户的喜好提供个性化推荐,帮助用户发现更多他们可能喜欢的内容。Hypelist的主要优点在于其个性化推荐系统和用户友好的界面,它不仅帮助用户组织和分享他们的兴趣爱好,还能通过智能推荐发现新的兴趣点。产品背景信息显示,Hypelist旨在帮助用户更好地组织和发现他们所热爱的事物,并通过社交分享功能与他人交流。目前,Hypelist提供免费版本,用户可以升级到高级版本以解锁更多AI功能和高级定制选项。
大规模基础世界模型,生成多样的3D可操作环境
Genie 2是由Google DeepMind开发的一款大规模基础世界模型,能够基于单一提示图像生成无尽的、可操作的、可玩的3D环境,用于训练和评估具身智能体。Genie 2代表了深度学习和人工智能领域的一大进步,它通过模拟虚拟世界及其行动后果,展示了在大规模生成模型中的多种紧急能力,如物体交互、复杂角色动画、物理模拟等。Genie 2的研究推动了新的创意工作流程,用于原型化交互体验,并为未来更通用的AI系统和智能体的研究提供了新的可能性。
Amazon Nova是亚马逊新一代的基础模型,提供前沿智能和行业领先的性价比。
Amazon Nova是亚马逊推出的新一代基础模型,能够处理文本、图像和视频提示,使客户能够使用Amazon Nova驱动的生成性AI应用程序理解视频、图表和文档,或生成视频和其他多媒体内容。Amazon Nova模型在亚马逊内部约有1000个生成性AI应用正在运行,旨在帮助内部和外部构建者应对挑战,并在延迟、成本效益、定制化、信息接地和代理能力方面取得有意义的进展。
自动化DAW副驾驶,告别重复性任务。
Forte!是一个自动化数字音频工作站(DAW)辅助工具,旨在帮助音乐制作人和音频工程师自动化处理重复性任务,如文件导入、静音剥离、音轨路由等。它通过使用人工智能技术,特别是自动乐器识别技术,能够快速准确地识别音频中的每种乐器,从而提高工作效率。Forte!支持无限文件导入,自动静音剥离,自动路由,立体声到单声道转换等功能,是音乐制作领域的一大创新。产品背景信息显示,Forte!目前支持所有Pro Tools版本,并即将支持Logic Pro。价格方面,Forte!提供15天免费试用,无需信用卡信息,之后用户可以选择订阅或购买终身许可证。
基于流匹配的音频驱动说话人像视频生成方法
FLOAT是一种音频驱动的人像视频生成方法,它基于流匹配生成模型,将生成建模从基于像素的潜在空间转移到学习到的运动潜在空间,实现了时间上一致的运动设计。该技术引入了基于变换器的向量场预测器,并具有简单而有效的逐帧条件机制。此外,FLOAT支持语音驱动的情感增强,能够自然地融入富有表现力的运动。广泛的实验表明,FLOAT在视觉质量、运动保真度和效率方面均优于现有的音频驱动说话人像方法。
腾讯开源的大型视频生成模型训练框架
HunyuanVideo是腾讯开源的一个系统性框架,用于训练大型视频生成模型。该框架通过采用数据策划、图像-视频联合模型训练和高效的基础设施等关键技术,成功训练了一个超过130亿参数的视频生成模型,是所有开源模型中最大的。HunyuanVideo在视觉质量、运动多样性、文本-视频对齐和生成稳定性方面表现出色,超越了包括Runway Gen-3、Luma 1.6在内的多个行业领先模型。通过开源代码和模型权重,HunyuanVideo旨在缩小闭源和开源视频生成模型之间的差距,推动视频生成生态系统的活跃发展。
将你的食材瞬间变成食谱
EasyChef是一款利用人工智能技术,根据用户家中已有的食材推荐定制化食谱的应用程序。它通过分析用户输入的食材,智能推荐符合个人口味和烹饪条件的食谱,帮助用户减少食物浪费,节省时间和金钱。EasyChef以其用户友好的界面和个性化服务,在全球范围内受到560多个家庭厨师的欢迎。该应用提供全球各式美食选项,从墨西哥菜到印度菜,满足不同用户的国际美食需求。同时,EasyChef还提供定制饮食食谱,包括无麸质和原始人饮食等,以及根据用户厨房设备(如微波炉、烤箱)定制的餐计划。EasyChef的订阅费用为每月2.99欧元或年度订阅29.99欧元,为用户提供经济实惠的持续服务。
全球合作训练的10B参数语言模型聊天工具
INTELLECT-1 Chat是一个由全球合作训练的10B参数语言模型驱动的聊天工具。它代表了人工智能领域中大规模语言模型的最新进展,通过分散式训练,提高了模型的多样性和适应性。这种技术的主要优点包括能够理解和生成自然语言,提供流畅的对话体验,并且能够处理大量的语言数据。产品背景信息显示,这是一个首次展示分散式训练可能性的演示,易于使用且富有趣味性。价格方面,页面提供了登录以保存和重访聊天的功能,暗示了可能的付费或会员服务模式。
高性能英文语言模型,适用于多样化任务
OLMo-2-1124-13B-DPO是经过监督微调和DPO训练的13B参数大型语言模型,主要针对英文,旨在提供在聊天、数学、GSM8K和IFEval等多种任务上的卓越性能。该模型是OLMo系列的一部分,旨在推动语言模型的科学研究。模型训练基于Dolma数据集,并公开代码、检查点、日志和训练细节。
从单张图片重建逼真的3D人体模型
PSHuman是一个创新的框架,它利用多视图扩散模型和显式重构技术,从单张图片中重建出逼真的3D人体模型。这项技术的重要性在于它能够处理复杂的自遮挡问题,并且在生成的面部细节上避免了几何失真。PSHuman通过跨尺度扩散模型联合建模全局全身形状和局部面部特征,实现了细节丰富且保持身份特征的新视角生成。此外,PSHuman还通过SMPL-X等参数化模型提供的身体先验,增强了不同人体姿态下的跨视图身体形状一致性。PSHuman的主要优点包括几何细节丰富、纹理保真度高以及泛化能力强。
基于大型语言模型的主动式代理,预测用户需求并主动提供帮助。
ProactiveAgent是一个基于大型语言模型(LLM)的主动式代理项目,旨在构建一个能够预测用户需求并主动提供帮助的智能代理。该项目通过数据收集和生成管道、自动评估器和训练代理来实现这一目标。ProactiveAgent的主要优点包括环境感知、协助标注、动态数据生成和构建管道,其奖励模型在测试集上达到了0.918的F1分数,显示出良好的性能。该产品背景信息显示,它适用于编程、写作和日常生活场景,并且遵循Apache License 2.0协议。
个性化面部年龄变换技术
MyTimeMachine是一个基于人工智能技术的面部年龄变换模型,它能够通过约50张个人自拍照片个性化地进行年龄回退(减龄)和年龄前进(增龄),在保持高保真度和身份特征的同时,生成与目标年龄相似的面部图像。这项技术在电影和电视特效等虚拟年龄应用领域具有重要价值,能够提供高质量的、身份保持一致的、时间上连贯的年龄效果。
科学文献综合检索增强型语言模型
Ai2 OpenScholar是由艾伦人工智能研究所与华盛顿大学合作开发的检索增强型语言模型,旨在帮助科学家通过检索相关文献并基于这些文献生成回答来有效导航和综合科学文献。该模型在多个科学领域中表现出色,特别是在引用准确性和事实性方面。它代表了人工智能在科学研究中应用的重要进步,能够加速科学发现并提高研究效率。
多功能大规模扩散模型,支持双向图像合成与理解。
OneDiffusion是一个多功能、大规模的扩散模型,它能够无缝支持双向图像合成和理解,覆盖多种任务。该模型预计将在12月初发布代码和检查点。OneDiffusion的重要性在于其能够处理图像合成和理解任务,这在人工智能领域是一个重要的进步,尤其是在图像生成和识别方面。产品背景信息显示,这是一个由多位研究人员共同开发的项目,其研究成果已在arXiv上发表。
文本图像到视频生成模型
Allegro-TI2V是一个文本图像到视频生成模型,它能够根据用户提供的提示和图像生成视频内容。该模型以其开源性、多样化的内容创作能力、高质量的输出、小巧高效的模型参数以及支持多种精度和GPU内存优化而受到关注。它代表了当前人工智能技术在视频生成领域的前沿进展,具有重要的技术价值和商业应用潜力。Allegro-TI2V模型在Hugging Face平台上提供,遵循Apache 2.0开源协议,用户可以免费下载和使用。
智能生成爆款视频,提升内容吸引力
AI爆款视频是一款利用人工智能技术,帮助用户添加任意素材,智能生成具有吸引力的视频内容的产品。它通过分析流行趋势和用户偏好,自动生成视频,提高视频的传播力和观看率。产品背景信息显示,随着短视频平台的兴起,视频内容的制作和传播变得越来越重要,AI爆款视频正是为了满足这一市场需求而诞生的。产品的主要优点包括智能化生成、高效率和低成本,适合各类视频内容创作者和营销人员。目前产品提供免费试用,具体价格根据用户需求定制。
最先进的全开放语言模型
OLMo 2是由Ai2推出的最新全开放语言模型,包括7B和13B两种规模的模型,训练数据高达5T tokens。这些模型在性能上与同等规模的全开放模型相当或更优,并且在英语学术基准测试中与开放权重模型如Llama 3.1竞争。OLMo 2的开发注重模型训练的稳定性、阶段性训练干预、最先进的后训练方法和可操作的评估框架。这些技术的应用使得OLMo 2在多个任务上表现出色,特别是在知识回忆、常识、一般和数学推理方面。
© 2024 AIbase 备案号:闽ICP备08105208号-14