浏览量:176
最新流量情况
月访问量
19075.32k
平均访问时长
00:05:32
每次访问页数
5.52
跳出率
45.07%
流量来源
直接访问
48.31%
自然搜索
36.36%
邮件
0.03%
外链引荐
12.17%
社交媒体
3.11%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
13.13%
印度
7.59%
日本
3.67%
俄罗斯
6.13%
美国
18.18%
文本转音乐和音频
MAGNeT是一个提供各种人工智能模型和数据集的社区平台。用户可以在平台上找到各种先进的自然语言处理和机器学习模型,以及相关的数据集。该平台还提供了一系列解决方案,包括文本到语音转换、图像处理等。MAGNeT定位于为开发人员、研究人员和企业提供高质量的人工智能模型和数据集。
一万亿Token和34亿张图像的多模态数据集
MINT-1T是由Salesforce AI开源的多模态数据集,包含一万亿个文本标记和34亿张图像,规模是现有开源数据集的10倍。它不仅包含HTML文档,还包括PDF文档和ArXiv论文,丰富了数据集的多样性。MINT-1T的数据集构建涉及多种来源的数据收集、处理和过滤步骤,确保了数据的高质量和多样性。
大规模图像编辑数据集
UltraEdit是一个大规模的图像编辑数据集,包含约400万份编辑样本,自动生成,基于指令的图像编辑。它通过利用大型语言模型(LLMs)的创造力和人类评估员的上下文编辑示例,提供了一个系统化的方法来生产大规模和高质量的图像编辑样本。UltraEdit的主要优点包括:1) 它通过利用大型语言模型的创造力和人类评估员的上下文编辑示例,提供了更广泛的编辑指令;2) 其数据源基于真实图像,包括照片和艺术作品,提供了更大的多样性和减少了偏见;3) 它还支持基于区域的编辑,通过高质量、自动生成的区域注释得到增强。
基于 GPT-4 的代码审查模型
CriticGPT 是基于 GPT-4 模型开发的工具,旨在帮助人类审查 ChatGPT 的代码输出。通过识别错误并提供评论,提高训练师审查的准确性和效率。该工具能有效捕捉潜在问题,为 AI 模型的改进提供有力支持。
一种用于生成超详细图像描述的模型,用于训练视觉语言模型。
ImageInWords (IIW) 是一个由人类参与的循环注释框架,用于策划超详细的图像描述,并生成一个新的数据集。该数据集通过评估自动化和人类并行(SxS)指标来实现最先进的结果。IIW 数据集在生成描述时,比以往的数据集和GPT-4V输出在多个维度上有了显著提升,包括可读性、全面性、特异性、幻觉和人类相似度。此外,使用IIW数据微调的模型在文本到图像生成和视觉语言推理方面表现出色,能够生成更接近原始图像的描述。
用于自动驾驶的大规模视频生成模型
GenAD是由上海人工智能实验室联合香港科技大学、德国图宾根大学和香港大学共同推出的首个大规模自动驾驶视频生成模型。它通过预测和模拟真实世界场景,为自动驾驶技术的研究和应用提供支撑。GenAD在理解复杂动态环境、适应开放世界场景、精准预测等方面具有较强能力,能够通过语言和行车轨迹进行控制,并展现出应用于自动驾驶规划任务的潜力,有助于提高行车安全性和效率。
用于人形机器人学习的通用基础模型
NVIDIA Project GR00T是一种通用基础模型,可在仿真和真实世界中改变人形机器人的学习方式。通过在NVIDIA GPU加速模拟中进行训练,GR00T使得人形机器人能够从少量的人类演示中通过模仿学习和NVIDIA Isaac Lab进行强化学习,并可从视频数据生成机器人动作。GR00T模型接受多模态指令和过去的交互作为输入,并输出机器人需要执行的动作。
Apollo是一个多语言医学领域的模型、数据集、基准和代码库
Apollo项目由FreedomIntelligence组织维护,旨在通过提供多语言医学领域的大型语言模型(LLMs)来民主化医疗AI,覆盖6亿人。该项目包括模型、数据集、基准测试和相关代码。
数学文本智能标记数据集
AutoMathText是一个广泛且精心策划的数据集,包含约200GB的数学文本。数据集中的每条内容都被最先进的开源语言模型Qwen进行自主选择和评分,确保高标准的相关性和质量。该数据集特别适合促进数学和人工智能交叉领域的高级研究,作为学习和教授复杂数学概念的教育工具,以及为开发和训练专门处理和理解数学内容的AI模型提供基础。
LiteLlama-460M-1T: 减小规模的 Llama
LiteLlama-460M-1T 是一个开源的人工智能模型,使用 1T 个令牌进行训练,具有 460M 个参数。它是 Meta AI 的 LLaMa 2 的一个缩减版本,用于提供更小的模型规模。
3D人物生成模型
En3D是一个提供先进自然语言处理模型的平台。他们提供了各种各样的模型和数据集,以帮助开发者构建和部署自然语言处理应用。En3D平台的优势在于提供了大量预训练模型和方便的部署工具,使得开发者能够快速、高效地构建自然语言处理应用。
谷歌最强大的AI模型
Gemini是谷歌最强大和通用的AI模型,旨在成为多模态的,并针对三种不同大小进行了优化:Ultra,Pro和Nano。Gemini模型具有卓越的性能和下一代功能,可为各种应用提供强大的AI支持。 它提供可扩展的,高效的解决方案,并注重责任和安全性。 Gemini模型已经在市场上可用。
模型和数据集的集合
Distil-Whisper是一个提供模型和数据集的平台,用户可以在该平台上访问各种预训练模型和数据集,并进行相关的应用和研究。该平台提供了丰富的模型和数据集资源,帮助用户快速开展自然语言处理和机器学习相关工作。
一站式 AI 开发平台
OpenXLab浦源面向人工智能领域开发者和使用者,提供一站式 AI 开发平台。包括应用开发,模型免费托管,数据集下载等服务。应用中心提供应用构建平台,模型中心提供社区化模型托管平台,数据集中心提供海量优质人工智能数据集。
AI数据引擎,涵盖标注、工作流、数据集和人工智能
V7是一个AI数据引擎,提供企业级训练数据的完整基础设施,涵盖标注、工作流、数据集和人工在循环中。它能够帮助用户快速高效地标注、处理和管理训练数据,提高AI模型的准确性和性能。V7支持自动化标注、视频标注、文档处理等功能,适用于各种行业和应用场景。
人工智能,简化。
Adfinite AI是一款人工智能产品,提供最先进的模型,无需订阅。没有长期合约或订阅费用,只需按使用量付费。新用户可以免费获得5个积分进行测试,无需信用卡或充值。每条消息收费10美分。目前有特别推出的促销活动,充值20美元或更多即可额外获得5美元的积分。如果遇到问题或有功能请求,请联系我们。
2D视频转3D模型
Neuralangelo是NVIDIA研究推出的一款利用神经网络进行3D重建的人工智能模型,可以将2D视频片段转换为详细的3D结构,生成逼真的虚拟建筑、雕塑等物体。它能够准确地提取复杂材料的纹理,包括屋顶瓦片、玻璃窗格和光滑的大理石。创意专业人员可以将这些3D对象导入设计应用程序,进一步进行编辑,用于艺术、视频游戏开发、机器人技术和工业数字双胞胎等领域。Neuralangelo的3D重建能力将对创作者产生巨大的帮助,帮助他们在数字世界中重新创建真实世界。该工具最终将使开发人员能够将详细的对象(无论是小雕塑还是巨大的建筑物)导入到虚拟环境中,用于视频游戏或工业数字双胞胎等应用。
大规模人工智能开放网络
LAION是一个非营利组织,致力于提供机器学习资源给公众使用,包括数据集、工具和模型。我们鼓励开放公共教育,并通过重复使用现有数据集和模型来更环保地使用资源。我们提供多个数据集、模型和项目,以支持广泛的人工智能研究。
LTXV视频技术文档
LTXV Documentation 提供了关于LTX视频技术的详细文档和资源链接,包括快速入门指南、集成和访问方式、技术文档以及社区支持。这项技术的重要性在于它能够支持视频内容的创建和管理,特别是通过集成和模型访问,为用户提供了一个强大的视频处理和分析平台。LTXV技术背景信息显示,它由Lightricks公司开发,该公司在视频技术领域有着深厚的技术积累和影响力。产品定位为专业视频技术文档,适合需要深入了解视频技术细节的开发者和研究人员使用。
基于DiT的视频生成模型,实时生成高质量视频。
LTX-Video是由Lightricks开发的首个基于DiT的视频生成模型,能够实时生成高质量的视频内容。该模型以24 FPS的速度生成768x512分辨率的视频,速度超过观看速度。模型经过大规模多样化视频数据集的训练,能够生成高分辨率且内容真实多样的视频。LTX-Video支持文本到视频(text-to-video)以及图像+文本到视频(image+text-to-video)的应用场景。
先进的文本到图像模型工具套件
FLUX.1 Tools是Black Forest Labs推出的一套模型工具,旨在为基于文本的图像生成模型FLUX.1增加控制和可操作性,使得对真实和生成的图像进行修改和再创造成为可能。该工具套件包含四个不同的特性,以开放访问模型的形式在FLUX.1 [dev]模型系列中提供,并作为BFL API的补充,支持FLUX.1 [pro]。FLUX.1 Tools的主要优点包括先进的图像修复和扩展能力、结构化引导、图像变化和重构等,这些功能对于图像编辑和创作领域具有重要意义。
AI-based decoder for quantum computing error correction
AlphaQubit是由Google DeepMind和Quantum AI团队共同开发的人工智能系统,它能够以最先进的准确性识别量子计算机中的错误。这项技术结合了机器学习和量子纠错的专业知识,旨在推动可靠量子计算机的构建,这对于解决复杂问题、实现科学突破和探索新领域具有重要意义。AlphaQubit的主要优点包括高准确性和对大规模量子计算的适用性。
视觉语言模型,能够进行逐步推理
LLaVA-o1是北京大学元组团队开发的一个视觉语言模型,它能够进行自发的、系统的推理,类似于GPT-o1。该模型在六个具有挑战性的多模态基准测试中超越了其他模型,包括Gemini-1.5-pro、GPT-4o-mini和Llama-3.2-90B-Vision-Instruct。LLaVA-o1通过逐步推理解决问题,展示了其在视觉语言模型中的独特优势。
Sandra AI,专为汽车分销设计的智能语音代理。
Sandra AI是一个智能语音代理,专为汽车分销行业设计,提供全天候的电话接听服务,帮助经销商不错过任何来电,提高客户满意度和业务机会。Sandra AI具有深厚的行业知识,能够像真正的专家一样与客户交流,并且能够无缝集成到经销商的软件中,实现快速、平滑的部署。产品背景信息显示,Sandra AI致力于通过人工智能技术优化客户服务,让经销商能够专注于核心业务,同时提升团队的工作效率。
构建最节能的人工智能硬件
Rain AI专注于开发高能效的人工智能硬件。在当前能源消耗日益增长的背景下,Rain AI的产品通过优化硬件设计,减少能源消耗,同时保持高性能,这对于数据中心和需要大量计算资源的企业来说至关重要。产品的主要优点包括高能效、高性能和环保。Rain AI的产品背景信息显示,公司致力于推动人工智能技术的可持续发展,通过技术创新减少对环境的影响。产品的价格和定位尚未明确,但可以推测其目标市场为需要高性能计算且对能源效率有高要求的企业。
Qwen Turbo 1M Demo是一个由Qwen提供的Hugging Face空间。
Qwen Turbo 1M Demo是一个基于Hugging Face平台的人工智能模型演示。这个模型代表了自然语言处理技术的最新进展,特别是在中文文本理解和生成方面。它的重要性在于能够提供高效、准确的语言模型,以支持各种语言相关的应用,如机器翻译、文本摘要、问答系统等。Qwen Turbo 1M Demo以其较小的模型尺寸和快速的处理速度而受到青睐,适合需要快速部署和高效运行的场合。目前,该模型是免费试用的,具体价格和定位可能需要进一步的商业洽谈。
快速将设计转换为代码的低代码平台
Locofy.ai是一个利用人工智能技术,将设计文件(如Figma和Adobe XD)快速转换为前端代码的低代码平台。它通过大型设计模型(Large Design Models)技术,训练于数百万的设计和产品,结合多模态和启发式模型,实现设计到代码的高效转换。这一技术的重要性在于它极大地提高了前端开发的效率,减少了重复劳动,让开发者能够专注于更复杂的创造性工作。Locofy.ai支持多种框架和库,如React、React Native、HTML/CSS、Next.js、Angular、Gatsby、Vue等,并且提供了插件直接从设计工具开始工作。它的价格策略包括付费计划,并提供LDM以激励用户。
数据驱动的框架,增强大型语言模型的工作流编排能力
WorkflowLLM是一个以数据为中心的框架,旨在增强大型语言模型(LLMs)在工作流编排方面的能力。核心是WorkflowBench,这是一个大规模的监督式微调数据集,包含来自83个应用、28个类别的1503个API的106763个样本。WorkflowLLM通过微调Llama-3.1-8B模型,创建了专门针对工作流编排任务优化的WorkflowLlama模型。实验结果表明,WorkflowLlama在编排复杂工作流方面表现出色,并且能够很好地泛化到未见过的API。
© 2024 AIbase 备案号:闽ICP备08105208号-14