浏览量:18
最新流量情况
月访问量
10.62k
平均访问时长
00:04:38
每次访问页数
5.14
跳出率
20.72%
流量来源
直接访问
40.13%
自然搜索
30.99%
邮件
0.05%
外链引荐
15.37%
社交媒体
12.68%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
加拿大
8.15%
英国
7.10%
印度
1.78%
美国
72.69%
越南
9.02%
手机和电脑上传收据,省时97%,5秒内轻松通过短信发送收据
Receipt-AI是一款通过人工智能和短信功能实现收据管理的产品。用户可以通过手机和电脑拍照上传收据,然后利用人工智能技术自动提取关键信息,并将收据上传到Xero或QuickBooks等会计软件中。Receipt-AI还支持通过短信轻松发送收据,大大提高工作效率。该产品的定价请参考官方网站。
大型语言模型,用于文本生成和分类
OLMo-2-1124-7B-RM是由Hugging Face和Allen AI共同开发的一个大型语言模型,专注于文本生成和分类任务。该模型基于7B参数的规模构建,旨在处理多样化的语言任务,包括聊天、数学问题解答、文本分类等。它是基于Tülu 3数据集和偏好数据集训练的奖励模型,用于初始化RLVR训练中的价值模型。OLMo系列模型的发布,旨在推动语言模型的科学研究,通过开放代码、检查点、日志和相关的训练细节,促进了模型的透明度和可访问性。
MMAudio根据视频和/或文本输入生成同步音频。
MMAudio是一种多模态联合训练技术,旨在高质量的视频到音频合成。该技术能够根据视频和文本输入生成同步音频,适用于各种应用场景,如影视制作、游戏开发等。其重要性在于提升了音频生成的效率和质量,适合需要音频合成的创作者和开发者使用。
自动化发票、收据和文件管理平台
Billover是一个利用人工智能和OCR技术自动化发票、收据和文件管理的平台。它通过简化发票和费用管理流程,节省时间、减少错误并提高工作效率。Billover支持多种文件格式上传,包括PDF、PNG、JPG等,并且能够自动识别和提取关键信息,从而简化费用管理和提高生产力。产品背景信息显示,Billover旨在通过其AI驱动的OCR技术,为个人和企业提供高效的发票和收据管理解决方案。
3D自主角色的沉浸式交互框架
SOLAMI是一个端到端的社交视觉-语言-动作(VLA)建模框架,用于与3D自主角色进行沉浸式交互。该框架通过综合三个主要方面构建3D自主角色:社交VLA架构、交互式多模态数据和沉浸式VR界面。SOLAMI的主要优点包括更精确和自然的字符响应(包括语音和动作),与用户期望一致,并且延迟更低。该技术的重要性在于它为3D自主角色提供了类似人类的社交智能,使其能够感知、理解和与人类进行交互,这是人工智能领域中的一个开放且基础的问题。
基于条件扩散模型的人类-物体交互合成技术
Controllable Human-Object Interaction Synthesis (CHOIS) 是一种先进的技术,它能够根据语言描述、初始物体和人类状态以及稀疏物体路径点来同时生成物体运动和人类运动。这项技术对于模拟真实的人类行为至关重要,尤其在需要精确手-物体接触和由地面支撑的适当接触的场景中。CHOIS通过引入物体几何损失作为额外的监督信息,以及在训练扩散模型的采样过程中设计指导项来强制执行接触约束,从而提高了生成物体运动与输入物体路径点之间的匹配度,并确保了交互的真实性。
Anduril与OpenAI合作,推进美国人工智能领导力并保护美国及盟军。
Anduril Industries是一家国防技术公司,与OpenAI合作,共同开发并负责任地部署先进的人工智能解决方案,用于国家安全任务。通过结合OpenAI的先进模型和Anduril的高性能国防系统及Lattice软件平台,合作旨在提高保护美国及盟军军事人员免受无人机和其他空中设备攻击的国防系统。这一合作强调了美国在人工智能领域的领导地位
创建并分享你热爱的一切事物的列表。
Hypelist是一个在线平台,允许用户创建和分享关于他们所热爱的一切事物的列表,包括书籍、电影、音乐、旅行地点等。这个平台利用人工智能技术,根据用户的喜好提供个性化推荐,帮助用户发现更多他们可能喜欢的内容。Hypelist的主要优点在于其个性化推荐系统和用户友好的界面,它不仅帮助用户组织和分享他们的兴趣爱好,还能通过智能推荐发现新的兴趣点。产品背景信息显示,Hypelist旨在帮助用户更好地组织和发现他们所热爱的事物,并通过社交分享功能与他人交流。目前,Hypelist提供免费版本,用户可以升级到高级版本以解锁更多AI功能和高级定制选项。
大规模基础世界模型,生成多样的3D可操作环境
Genie 2是由Google DeepMind开发的一款大规模基础世界模型,能够基于单一提示图像生成无尽的、可操作的、可玩的3D环境,用于训练和评估具身智能体。Genie 2代表了深度学习和人工智能领域的一大进步,它通过模拟虚拟世界及其行动后果,展示了在大规模生成模型中的多种紧急能力,如物体交互、复杂角色动画、物理模拟等。Genie 2的研究推动了新的创意工作流程,用于原型化交互体验,并为未来更通用的AI系统和智能体的研究提供了新的可能性。
Amazon Nova是亚马逊新一代的基础模型,提供前沿智能和行业领先的性价比。
Amazon Nova是亚马逊推出的新一代基础模型,能够处理文本、图像和视频提示,使客户能够使用Amazon Nova驱动的生成性AI应用程序理解视频、图表和文档,或生成视频和其他多媒体内容。Amazon Nova模型在亚马逊内部约有1000个生成性AI应用正在运行,旨在帮助内部和外部构建者应对挑战,并在延迟、成本效益、定制化、信息接地和代理能力方面取得有意义的进展。
自动化DAW副驾驶,告别重复性任务。
Forte!是一个自动化数字音频工作站(DAW)辅助工具,旨在帮助音乐制作人和音频工程师自动化处理重复性任务,如文件导入、静音剥离、音轨路由等。它通过使用人工智能技术,特别是自动乐器识别技术,能够快速准确地识别音频中的每种乐器,从而提高工作效率。Forte!支持无限文件导入,自动静音剥离,自动路由,立体声到单声道转换等功能,是音乐制作领域的一大创新。产品背景信息显示,Forte!目前支持所有Pro Tools版本,并即将支持Logic Pro。价格方面,Forte!提供15天免费试用,无需信用卡信息,之后用户可以选择订阅或购买终身许可证。
基于流匹配的音频驱动说话人像视频生成方法
FLOAT是一种音频驱动的人像视频生成方法,它基于流匹配生成模型,将生成建模从基于像素的潜在空间转移到学习到的运动潜在空间,实现了时间上一致的运动设计。该技术引入了基于变换器的向量场预测器,并具有简单而有效的逐帧条件机制。此外,FLOAT支持语音驱动的情感增强,能够自然地融入富有表现力的运动。广泛的实验表明,FLOAT在视觉质量、运动保真度和效率方面均优于现有的音频驱动说话人像方法。
腾讯开源的大型视频生成模型训练框架
HunyuanVideo是腾讯开源的一个系统性框架,用于训练大型视频生成模型。该框架通过采用数据策划、图像-视频联合模型训练和高效的基础设施等关键技术,成功训练了一个超过130亿参数的视频生成模型,是所有开源模型中最大的。HunyuanVideo在视觉质量、运动多样性、文本-视频对齐和生成稳定性方面表现出色,超越了包括Runway Gen-3、Luma 1.6在内的多个行业领先模型。通过开源代码和模型权重,HunyuanVideo旨在缩小闭源和开源视频生成模型之间的差距,推动视频生成生态系统的活跃发展。
将你的食材瞬间变成食谱
EasyChef是一款利用人工智能技术,根据用户家中已有的食材推荐定制化食谱的应用程序。它通过分析用户输入的食材,智能推荐符合个人口味和烹饪条件的食谱,帮助用户减少食物浪费,节省时间和金钱。EasyChef以其用户友好的界面和个性化服务,在全球范围内受到560多个家庭厨师的欢迎。该应用提供全球各式美食选项,从墨西哥菜到印度菜,满足不同用户的国际美食需求。同时,EasyChef还提供定制饮食食谱,包括无麸质和原始人饮食等,以及根据用户厨房设备(如微波炉、烤箱)定制的餐计划。EasyChef的订阅费用为每月2.99欧元或年度订阅29.99欧元,为用户提供经济实惠的持续服务。
全球合作训练的10B参数语言模型聊天工具
INTELLECT-1 Chat是一个由全球合作训练的10B参数语言模型驱动的聊天工具。它代表了人工智能领域中大规模语言模型的最新进展,通过分散式训练,提高了模型的多样性和适应性。这种技术的主要优点包括能够理解和生成自然语言,提供流畅的对话体验,并且能够处理大量的语言数据。产品背景信息显示,这是一个首次展示分散式训练可能性的演示,易于使用且富有趣味性。价格方面,页面提供了登录以保存和重访聊天的功能,暗示了可能的付费或会员服务模式。
高性能英文语言模型,适用于多样化任务
OLMo-2-1124-13B-DPO是经过监督微调和DPO训练的13B参数大型语言模型,主要针对英文,旨在提供在聊天、数学、GSM8K和IFEval等多种任务上的卓越性能。该模型是OLMo系列的一部分,旨在推动语言模型的科学研究。模型训练基于Dolma数据集,并公开代码、检查点、日志和训练细节。
从单张图片重建逼真的3D人体模型
PSHuman是一个创新的框架,它利用多视图扩散模型和显式重构技术,从单张图片中重建出逼真的3D人体模型。这项技术的重要性在于它能够处理复杂的自遮挡问题,并且在生成的面部细节上避免了几何失真。PSHuman通过跨尺度扩散模型联合建模全局全身形状和局部面部特征,实现了细节丰富且保持身份特征的新视角生成。此外,PSHuman还通过SMPL-X等参数化模型提供的身体先验,增强了不同人体姿态下的跨视图身体形状一致性。PSHuman的主要优点包括几何细节丰富、纹理保真度高以及泛化能力强。
基于大型语言模型的主动式代理,预测用户需求并主动提供帮助。
ProactiveAgent是一个基于大型语言模型(LLM)的主动式代理项目,旨在构建一个能够预测用户需求并主动提供帮助的智能代理。该项目通过数据收集和生成管道、自动评估器和训练代理来实现这一目标。ProactiveAgent的主要优点包括环境感知、协助标注、动态数据生成和构建管道,其奖励模型在测试集上达到了0.918的F1分数,显示出良好的性能。该产品背景信息显示,它适用于编程、写作和日常生活场景,并且遵循Apache License 2.0协议。
个性化面部年龄变换技术
MyTimeMachine是一个基于人工智能技术的面部年龄变换模型,它能够通过约50张个人自拍照片个性化地进行年龄回退(减龄)和年龄前进(增龄),在保持高保真度和身份特征的同时,生成与目标年龄相似的面部图像。这项技术在电影和电视特效等虚拟年龄应用领域具有重要价值,能够提供高质量的、身份保持一致的、时间上连贯的年龄效果。
SUSE AI是为GenAI工作负载设计的安全可靠的企业级部署和运行平台。
SUSE AI是一个为企业级部署和运行任何生成性人工智能(GenAI)工作负载而设计的安全可靠的平台。它提供了零信任安全和可观测性,作为一个集成解决方案,SUSE AI是一个灵活且模块化的平台,提供了可扩展性。SUSE AI让您控制自己的AI解决方案,赋予选择和主权。SUSE AI的价值基于三个基础支柱:选择、安全和信任。这个结构让企业可以选择最适合它们的AI模型和使用方式。SUSE AI提供了工具,帮助企业满足合规要求,简化了复杂的监管环境。SUSE AI不仅是满足当前需求,更是为未来的AI投资提供保障。它是一个开放的企业AI基础设施平台,让您可以选择轻松集成新兴技术和模型。
科学文献综合检索增强型语言模型
Ai2 OpenScholar是由艾伦人工智能研究所与华盛顿大学合作开发的检索增强型语言模型,旨在帮助科学家通过检索相关文献并基于这些文献生成回答来有效导航和综合科学文献。该模型在多个科学领域中表现出色,特别是在引用准确性和事实性方面。它代表了人工智能在科学研究中应用的重要进步,能够加速科学发现并提高研究效率。
多功能大规模扩散模型,支持双向图像合成与理解。
OneDiffusion是一个多功能、大规模的扩散模型,它能够无缝支持双向图像合成和理解,覆盖多种任务。该模型预计将在12月初发布代码和检查点。OneDiffusion的重要性在于其能够处理图像合成和理解任务,这在人工智能领域是一个重要的进步,尤其是在图像生成和识别方面。产品背景信息显示,这是一个由多位研究人员共同开发的项目,其研究成果已在arXiv上发表。
文本图像到视频生成模型
Allegro-TI2V是一个文本图像到视频生成模型,它能够根据用户提供的提示和图像生成视频内容。该模型以其开源性、多样化的内容创作能力、高质量的输出、小巧高效的模型参数以及支持多种精度和GPU内存优化而受到关注。它代表了当前人工智能技术在视频生成领域的前沿进展,具有重要的技术价值和商业应用潜力。Allegro-TI2V模型在Hugging Face平台上提供,遵循Apache 2.0开源协议,用户可以免费下载和使用。
智能生成爆款视频,提升内容吸引力
AI爆款视频是一款利用人工智能技术,帮助用户添加任意素材,智能生成具有吸引力的视频内容的产品。它通过分析流行趋势和用户偏好,自动生成视频,提高视频的传播力和观看率。产品背景信息显示,随着短视频平台的兴起,视频内容的制作和传播变得越来越重要,AI爆款视频正是为了满足这一市场需求而诞生的。产品的主要优点包括智能化生成、高效率和低成本,适合各类视频内容创作者和营销人员。目前产品提供免费试用,具体价格根据用户需求定制。
最先进的全开放语言模型
OLMo 2是由Ai2推出的最新全开放语言模型,包括7B和13B两种规模的模型,训练数据高达5T tokens。这些模型在性能上与同等规模的全开放模型相当或更优,并且在英语学术基准测试中与开放权重模型如Llama 3.1竞争。OLMo 2的开发注重模型训练的稳定性、阶段性训练干预、最先进的后训练方法和可操作的评估框架。这些技术的应用使得OLMo 2在多个任务上表现出色,特别是在知识回忆、常识、一般和数学推理方面。
视频生成模型Sora的存档库
SoraVids是一个基于Hugging Face平台的视频生成模型Sora的存档库。它包含了87个视频和83个对应的提示,这些视频和提示在OpenAI撤销API密钥前被公开展示。这些视频均为MIME类型video/mp4,帧率为30 FPS。SoraVids的背景是OpenAI的视频生成技术,它允许用户通过文本提示生成视频内容。这个存档库的重要性在于它保存了在API密钥被撤销前生成的视频,为研究和教育提供了宝贵的资源。
智能律师办案平台
律呗是一个专为法律专业人士设计的智能办案平台,它通过结合人工智能、大数据、云计算和互联网技术,提供法律检索、案例分析、文书生成等服务。该平台能够快速提升案件分析能力,帮助律师高效处理法律事务,是法律行业数字化转型的重要工具。律呗以其直观的法律检索、快速案情分析报告制作、拍照录音提取文字等功能,满足了律师在案件处理中的多样化需求。
上海人工智能实验室开发的强推理AI模型
InternThinker是上海人工智能实验室(上海AI实验室)研发的一款强推理AI模型,致力于通过“通专融合”路径探索开放、可控、可信的通用人工智能(AGI)。该模型具备长思维能力,并能在推理过程中进行自我反思和纠正,从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。InternThinker的创新之处在于其元动作思考能力,能够自主生成高智力密度数据,并通过大规模沙盒环境获取反馈,实现高质量思维链的独立构建,大幅提升模型的复杂任务处理性能。
© 2024 AIbase 备案号:闽ICP备08105208号-14