浏览量:77
最新流量情况
月访问量
16.20k
平均访问时长
00:00:04
每次访问页数
1.26
跳出率
52.60%
流量来源
直接访问
35.54%
自然搜索
47.26%
邮件
0.10%
外链引荐
11.78%
社交媒体
4.70%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
德国
8.20%
印度
8.71%
韩国
8.60%
俄罗斯
10.99%
美国
23.20%
基于2D扩散的文本到3D生成
DreamFusion是一款基于预训练的2D文本到图像扩散模型,用于生成高保真度的、可调光的3D对象。它通过使用梯度下降优化随机初始化的3D模型(Neural Radiance Field)来生成3D对象,并且可以从任意角度观察、任意照明重新照亮或与任何3D环境合成。DreamFusion不需要3D训练数据,也不需要对图像扩散模型进行修改,展示了预训练图像扩散模型作为先验的有效性。
打造连接全球创作者的AI社区平台
米塔是一个打造连接全球创作者的AI社区平台。它提供米文、米画等创作工具,用户只需输入文字提示,就可以通过AI技术生成小说大纲、文章、画作等创意内容。米塔具有写作辅助、图像生成、智能对话等功能,可以帮助用户提升创作效率,发掘更多创意灵感。米塔基于大规模预训练语言模型,通过模型微调和数据增强,实现了文本、图像的高质量生成。米塔致力于为创作者提供便捷的AI创作工具,构建包容开放的社区,让更多的用户体验到AI给创作带来的无限可能。
文本到3D分数蒸馏的方差缩减解决方案
SteinDreamer供文本到3D分数蒸馏的解决方案。他们提出了一种名为Stein Score Distillation (SSD)的方差缩减解决方案,通过控制变量构建和Stein身份,实现了对蒸馏方差的有效降低。他们的实验结果表明,SSD能够有效降低蒸馏方差,并且在对象和场景级别的生成中持续提高视觉质量。此外,他们还展示了SteinDreamer相对于现有方法具有更快的收敛速度。
众包分布式图像和文本生成平台
AI Horde是一个众包分布式图像和文本生成平台。它由一群协作的工作者组成,提供高效的图像和文本生成服务。AI Horde提供稳定的性能、广泛的功能和多样的使用场景。无论是个人用户还是企业用户,都可以通过AI Horde获得高质量的图像和文本生成服务。AI Horde的定价合理,定位于满足用户的创作、设计、娱乐等需求。
Genaimo是一款能够快速生成动画的产品,支持多种格式导出,适用于多种3D工具。
Genaimo是一款基于人工智能技术的动画生成工具,用户可以通过简单的描述生成动画。该产品的主要优点是能够快速将用户的创意转化为实际的动画效果,大大提高了动画创作的效率。它适用于需要快速生成动画的设计师、开发者和创意人员。目前尚不清楚其具体价格和市场定位,但其技术的创新性和实用性使其在动画设计领域具有重要的地位。
ComfyUI 的 Hunyuan3D-2 模型封装工具,用于 3D 生成与纹理处理。
ComfyUI-Hunyuan3DWrapper 是一个基于 ComfyUI 的插件,封装了 Hunyuan3D-2 模型,用于高效的 3D 图像生成和纹理处理。该工具通过简化 Hunyuan3D-2 模型的使用流程,使得用户能够在 ComfyUI 环境下快速实现高质量的 3D 模型生成和纹理渲染。它支持自定义配置和扩展,适用于需要高效 3D 内容创作的用户。
Hunyuan3D 2.0 是腾讯推出的高分辨率 3D 资产生成系统,基于大规模扩散模型。
Hunyuan3D 2.0 是腾讯推出的一种先进大规模 3D 合成系统,专注于生成高分辨率纹理化的 3D 资产。该系统包括两个基础组件:大规模形状生成模型 Hunyuan3D-DiT 和大规模纹理合成模型 Hunyuan3D-Paint。它通过解耦形状和纹理生成的难题,为用户提供了灵活的 3D 资产创作平台。该系统在几何细节、条件对齐、纹理质量等方面超越了现有的开源和闭源模型,具有极高的实用性和创新性。目前,该模型的推理代码和预训练模型已开源,用户可以通过官网或 Hugging Face 空间快速体验。
这是一个先进的多模态大型语言模型系列,展示了卓越的整体性能。
InternVL2.5-MPO是一个基于InternVL2.5和混合偏好优化(MPO)的多模态大型语言模型系列。它在多模态任务中表现出色,通过整合新近增量预训练的InternViT与多种预训练的大型语言模型(LLMs),如InternLM 2.5和Qwen 2.5,使用随机初始化的MLP投影器。该模型系列在多模态推理偏好数据集MMPR上进行了训练,包含约300万个样本,通过有效的数据构建流程和混合偏好优化技术,提升了模型的推理能力和回答质量。
利用AI生成ThreeJS项目资产
ThreeJS.ai是一个专注于利用人工智能技术生成ThreeJS项目资产的平台。它通过简化3D模型和动画的创建过程,使得开发者和设计师能够更快速、更高效地构建复杂的3D场景和视觉效果。这个平台的重要性在于它降低了3D内容创作的门槛,使得非专业人士也能轻松上手,并为专业人士节省了大量时间。产品背景信息显示,ThreeJS.ai由Graam Inc.提供,并且提供了500次免费生成的机会。
Immediate Mode 3D Plotting
ImPlot3D是一个基于Dear ImGui的3D绘图扩展库,提供了易用、高性能的3D绘图功能。它受到ImPlot的启发,为熟悉ImPlot的开发者提供了一个熟悉且直观的API。ImPlot3D支持多种3D绘图类型,如线图、散点图、曲面图等,并允许用户交互式地旋转、平移和缩放3D图形。该技术的重要性在于它为需要3D数据可视化的应用提供了一个理想的解决方案,尤其是在实时性和性能要求较高的场景下。
视觉增强的检索与生成系统
VARAG是一个支持多种检索技术的系统,优化了文本、图像和多模态文档检索的不同用例。它通过将文档页面作为图像嵌入,简化了传统的检索流程,并使用先进的视觉语言模型进行编码,提高了检索的准确性和效率。VARAG的主要优点在于它能够处理复杂的视觉和文本内容,为文档检索提供强大的支持。
电影台词搜索与生成工具
Screenflick是一个提供电影台词搜索和生成服务的网站,用户可以通过它来寻找特定的电影台词或生成新的台词。它不仅能够增加用户对电影的了解和兴趣,还能激发创意思维,为电影爱好者和创作者提供灵感。
探索3D虚拟世界,体验梦想家宇宙。
Aiuni是一个提供3D虚拟世界体验的平台,用户可以在这里创建和探索个性化的3D模型,享受沉浸式的宇宙探索之旅。Aiuni以其创新的3D技术、丰富的互动性和高度的个性化定制,为用户提供了一个全新的虚拟体验空间。
微软轻量级、先进的多模态模型,专注于文本和视觉的高质量推理密集数据。
Phi-3 Vision是一个轻量级、最先进的开放多模态模型,基于包括合成数据和经过筛选的公开可用网站在内的数据集构建,专注于文本和视觉的非常高质量的推理密集数据。该模型属于Phi-3模型家族,多模态版本支持128K上下文长度(以token计),经过严格的增强过程,结合了监督微调和直接偏好优化,以确保精确的指令遵循和强大的安全措施。
一种将 2D 文字转换为全景 3D 场景的生成管道,为野外环境的全景场景的创建提供了数分钟的便利。
该管道利用 2D 扩散模型的生成能力和提示自修复来创建全景图像,作为初始的 “平面”(2D)场景表示。随后,通过雕刻技术将该图像提升为 3D 高斯函数,以实现实时探索。为了产生一致的 3D 几何结构,该管道通过将单目视角的深度构造为全局优化的点云来构建空间一致的结构。该点云作为 3D 高斯函数的初始状态,以帮助解决由单目输入导致的隐蔽问题。通过对合成和输入相机视图施加语义和几何约束,该管道引导高斯函数的优化,以重建未见区域。总的来说,该方法为 360 度视野提供了全局一致的 3D 场景,为现有技术提供了增强的免费体验。
AI 画像专用的投稿和生成网站
chichi-pui(ちちぷい)是一家 AI 画像专用的投稿和生成网站,用户可以在此分享和生成 AI 插画、AI 照片等作品。该网站拥有丰富的 AI 画像投稿和生成内容,适合对 AI 艺术感兴趣的用户使用。用户可在网站上参与不同的活动和投稿企划,与其他用户分享作品并获取灵感。
免费创建和查看高斯3D模糊图像的工具
Polycam的高斯模糊创建工具可以让你免费将图像转换为沉浸式的3D模糊图像,你可以预览、分享和导出这些模糊图像。该工具支持20-200张PNG或JPG格式图像输入,输入图像需遵循影像测量最佳实践,保证图像清晰、均匀曝光和无运动模糊效果。生成的3D模糊可在Unity和Unreal等引擎中使用,插件不断更新以支持更多软件。该工具还提供Gallery功能用于浏览和分享社区创作。
ComfyUI节点插件,支持3D处理
ComfyUI-3D-Pack是一个强大的3D处理节点插件包,它为ComfyUI提供了处理3D输入(网格、UV纹理等)的能力,使用了最前沿的算法,如3D高斯采样、神经辐射场等。这个项目可以让用户只用单张图片就可以快速生成3D高斯模型,并可以将高斯模型转换成网格,实现3D重建。它还支持多视图图像作为输入,允许在给定的3D网格上映射多视图渲染的纹理贴图。该插件包处于开发中,尚未正式发布到ComfyUI插件库,但已经支持诸如大型多视图高斯模型、三平面高斯变换器、3D高斯采样、深度网格三角剖分、3D文件加载保存等功能。它的目标是成为ComfyUI处理3D内容的强大工具。
AI驱动的图标自动生成工具
AI Icon Generator是一个利用人工智能技术自动生成图标的在线工具。它可以根据文本描述迅速地生成各种风格的独特个性化图标,无需用户具备设计技能。该工具通过自动化设计流程,使任何人都可以轻松创建出理想的图标。
生成条件文本或图像的 3D 对象
Shap-E 是一个生成条件 3D 隐函数的官方代码和模型发布库。它可以根据文本或图像生成 3D 对象。该产品采用了最新的生成模型,可以根据给定的提示生成与之相关的三维模型。
一个千万级3D形状模型
Make-A-Shape是一个新的3D生成模型,旨在以高效的方式训练大规模数据,能够利用1000万个公开可用的形状。我们创新性地引入了小波树表示法,通过制定子带系数滤波方案来紧凑地编码形状,然后通过设计子带系数打包方案将表示布置在低分辨率网格中,使其可生成扩散模型。此外,我们还提出了子带自适应训练策略,使我们的模型能够有效地学习生成粗细小波系数。最后,我们将我们的框架扩展为受额外输入条件控制,以使其能够从各种模态生成形状,例如单/多视图图像、点云和低分辨率体素。在大量实验中,我们展示了无条件生成、形状完成和条件生成等各种应用。我们的方法不仅在提供高质量结果方面超越了现有技术水平,而且在几秒内高效生成形状,通常在大多数条件下仅需2秒钟。
一个用于人体动画生成的ComfyUI节点实现
ComfyUI-Moore-AnimateAnyone是一个基于Moore-AnimateAnyone模型实现的ComfyUI自定义节点,可以通过简单的文本描述生成相应的人体动画。该节点易于安装和使用,支持多种人体姿态和动作的生成,可用于提升设计作品的质量。其输出动画细腻自然,为创作者提供了强大的工具。
AI生成HTML5展示横幅广告
BannerGate是一款HTML5展示横幅生成AI,可帮助满足所有展示广告需求。它提供代码自由、易于使用、定制化、HTML5兼容等功能。用户可以通过平台轻松创建AI生成的动态HTML5展示横幅,选择不同模板、添加品牌标识和产品,并进行定制。
Neuroid是一个基于AI的3D建模和动画生成工具
Neuroid是一个基于人工智能的3D建模和动画生成工具,允许用户通过简单快捷的操作把创意转化为复杂的3D模型和动画,从而提高创作效率。该产品利用了生成对抗网络的强大能力,实现了3D运动设计领域的革新。Neuroid可以分析大量的数据集,学习各种运动模式,解锁设计师在运动设计过程中前所未有的创造力和效率。
MidReal是一个基于AI的文本冒险游戏
MidReal是一个基于先进人工智能技术的文本冒险游戏平台。它拥有强大的长篇叙事能力和近乎无限的记忆能力,可以根据玩家的选择来生成一个连贯、沉浸式的故事剧情。玩家可以选择不同的世界观和场景,roleplay成自己喜欢的角色,创造独特的冒险经历。
Canvas是一款Mac原生画图软件
Canvas是一款针对Mac平台开发的开源软件,集成了OpenAI的DALL-E生成功能,可以实现图像生成、编辑和变型。该软件具有操作简单、支持多种方式生成图像等优点。软件功能包括文字描述生成图片、上传图片进行生成编辑、变更图像样式等。适用于设计师、艺术创作者等用户,可以提高工作创作效率,降低创作成本。软件开源免费。
高效构建3D语言场
LangSplat通过将CLIP语言嵌入映射到一组3D高斯分布来构建3D语言场,实现了对3D场景进行开放词汇量查询。它避免了NeRF中的昂贵渲染过程,大大提高了效率。学习到的语言特征精确捕捉对象边界,提供了精确的3D语言场,没有需要后处理。LangSplat相比LERF提高了199倍的速度。
© 2025 AIbase 备案号:闽ICP备08105208号-14