浏览量:68
最新流量情况
月访问量
467127.54k
平均访问时长
00:07:27
每次访问页数
6.62
跳出率
37.89%
流量来源
直接访问
51.41%
自然搜索
29.45%
邮件
0.92%
外链引荐
11.72%
社交媒体
6.47%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
16.52%
中国
14.70%
印度
9.14%
日本
3.64%
德国
3.30%
音频处理和生成的深度学习库
AudioCraft 是一个用于音频处理和生成的 PyTorch 库。它包含了两个最先进的人工智能生成模型:AudioGen 和 MusicGen,可以生成高质量的音频。AudioCraft 还提供了 EnCodec 音频压缩 / 分词器和 Multi Band Diffusion 解码器等功能。该库适用于音频生成的深度学习研究。
从音频生成照片般逼真的人类avatar
audio2photoreal是一个从音频生成照片级逼真avatar的开源项目。它包含了一个pytorch实现,可以从音频中合成交谈中的人类形象。该项目提供了训练代码、测试代码、预训练的运动模型以及数据集访问。它的模型包括人脸扩散模型、人体扩散模型、人体VQ VAE模型和人体引导变换器模型。该项目让研究人员和开发者能够训练自己的模型,并基于语音合成高质量的逼真avatar。
音乐生成工具,助力音乐制作人
musicgen-songstarter-v0.2是一个针对音乐制作人设计的音频生成模型,专门用于生成有用的旋律循环。该模型在Splice样本库中的旋律循环数据集上进行了微调,能够生成立体声音频,音频频率为32kHz。与v0.1版本相比,v0.2版本使用了三倍的独特样本,并且模型大小从中等提升到了大型。
OptimizerAI是一个AI声音效果生成器,为创作者、游戏开发者、艺术家和视频制作者提供服务
OptimizerAI专注于使用人工智能技术生成各种声音效果,旨在为游戏、视频、短片、广告等多媒体内容增添活力。该平台提供了高质量的音频生成服务,并计划推出文本到声音效果生成功能。
通过音频生成充满表情的肖像视频
阿里巴巴的EMO: 是一款生成具有表情丰富的面部表情视频的工具,可以根据输入的角色图像和声音音频生成各种头部姿势和表情的声音头像视频。支持多语言歌曲和各种肖像风格,能够根据音频节奏生成动态、表现丰富的动画角色。
Meta旗下AI音频生成研究
Audiobox是Meta的新一代音频生成研究模型,可以利用语音输入和自然语言文本提示生成声音和音效,轻松为各种用例创建定制音频。Audiobox系列模型还包括专业模型Audiobox Speech和Audiobox Sound,所有Audiobox模型都是基于共享的自监督模型Audiobox SSL构建的。
Read为用户生成个性化的每日新闻音频简报
Read是一个新闻音频生成平台。它可以自动搜集用户感兴趣的内容,生成个性化的每日音频新闻简报,帮助用户高效获取所需信息。该产品拥有人工智能生成的自然语音功能,支持邮件订阅,提供个性化推荐,功能强大。适合需要每日了解所关心事件和新闻的用户。
用文字创建、定制、吸引,Snowpixel 让您轻松生成美丽的图片、视频、音乐等作品。
Snowpixel 是一个能够通过文字生成美丽图片、视频、音乐等作品的平台。用户可以使用自己的数据训练定制模型,为作品增添个性化的风格。Snowpixel 提供了视频生成、音乐生成、图片生成、音频生成、3D 对象生成和像素艺术模型等功能。用户可以在不同的场景下使用 Snowpixel,比如创作个性化作品、定制模型、生成音乐、生成视频等。Snowpixel 的定价灵活,用户可以按需选择付费。
一款用于训练PyTorch计算机视觉模型的开源库。
YOLO-NAS Pose是一款免费的、开源的库,用于训练基于PyTorch的计算机视觉模型。它提供了训练脚本和快速简单复制模型结果的示例。内置SOTA模型,可以轻松加载和微调生产就绪的预训练模型,包括最佳实践和验证的超参数,以实现最佳的准确性。可以缩短训练生命周期,消除不确定性。提供分类、检测、分割等不同任务的模型,可以轻松集成到代码库中。
使用文本生成带有声音的短视频
ShortVideoGen是一个简单易用的文本转视频应用,使用最先进的视频和音频生成AI模型,帮助您在几秒钟内创建个性化视频。只需提交文本提示,指定帧率和最大帧数,选择是否需要声音,等待魔法发生,即可生成符合要求的视频。
用AI创作音乐,免费试用
Stable Audio是一款AI音乐生成工具,可根据用户的描述生成定制长度的音乐,支持商业使用。其高质量音频生成和商业授权让音乐创作更加简单。Stable Audio的使命是为创作者提供音乐创作工具,帮助他们实现音乐创作的梦想。
AI音乐生成引擎
Musico是一款由AI驱动的音乐生成引擎,可以根据手势、动作、代码或其他声音生成音乐。Musico的引擎结合传统和现代机器学习算法,以各种风格生成无尽的版权自由音乐。从半辅助到全自动的创作,Musico的引擎为音乐专业人士和非音乐人提供了适应其上下文的新的音频生成方式。
发现、创新、变现AI创意
AI创意市场是一个AI创意产品的在线市场,用户可以轻松买卖AI动力激发的创意,从文本生成开始,未来还会引入图像、视频和音频生成等更多功能。AI创意市场让用户进行交易并学习AI的最佳应用。
与您最喜爱的LLaMA LLM模型聊天
LlamaChat是一个桌面客户端,可以与LLaMA、Alpaca和GPT4All模型进行聊天。Alpaca是斯坦福大学基于OpenAI的text-davinci-003数据进行Fine-tuning后的7B参数LLaMA模型。您可以使用LlamaChat导入原始的PyTorch模型检查点文件或预转换的.ggml模型文件。LlamaChat是完全开源免费的,并且始终如一地保持开源。您可以在GitHub上找到更多信息。
用AI技术编程潜意识,实现目标达成
Binaural Beats Factory提供基于人工智能的在线自我催眠/潜意识/肯定音频生成器。通过解锁思维的力量,轻松实现目标。探索个性化双音节节拍和潜意识建议的可能性,同步大脑波,积极改变思维、情绪和行为。体验未来的音频创作与我们用户友好的在线应用程序,并发现大量免费的自我催眠/潜意识/肯定音频曲目。立即开始转变旅程,实现您想要的生活。
Stability AI 生成模型是一个开源的生成模型库。
Stability AI 生成模型是一个开源的生成模型库,提供了各种生成模型的训练、推理和应用功能。该库支持各种生成模型的训练,包括基于 PyTorch Lightning 的训练,提供了丰富的配置选项和模块化的设计。用户可以使用该库进行生成模型的训练,并通过提供的模型进行推理和应用。该库还提供了示例训练配置和数据处理的功能,方便用户进行快速上手和定制。
4K文本到图像生成的扩散变换器
PixArt-Sigma是一个基于PyTorch的模型定义、预训练权重和推理/采样代码的集合,用于探索4K文本到图像生成的弱到强训练扩散变换器。它支持从低分辨率到高分辨率的图像生成,提供了多种功能和优势,如快速体验、用户友好的代码库和多种模型选择。
使用简单、原始的 C/CUDA 进行 LLM 训练
karpathy/llm.c 是一个使用简单的 C/CUDA 实现 LLM 训练的项目。它旨在提供一个干净、简单的参考实现,同时也包含了更优化的版本,可以接近 PyTorch 的性能,但代码和依赖大大减少。目前正在开发直接的 CUDA 实现、使用 SIMD 指令优化 CPU 版本以及支持更多现代架构如 Llama2、Gemma 等。
老照片修复 图片无损放大工具
SwinIR 是一款基于 Swin Transformer 进行图像恢复的官方 PyTorch 实现,在经典、轻量级和真实世界图像超分辨率、灰度 / 彩色图像去噪以及 JPEG 压缩伪影去除等任务中取得了最先进的性能。它由浅层特征提取、深层特征提取和高质量图像重建组成,具有卓越的性能和参数优化。
Surya是一个用于任何语言中准确的逐行文本检测和识别(OCR)的项目。
Surya是一个多语言文档OCR工具包,具有准确的逐行文本检测功能。它在一系列文档和语言上都有效(参见使用和基准测试以获取更多细节)。Surya的命名源自印度太阳神,象征着具有普遍视野。Surya通过Python 3.9+和PyTorch实现,支持多种语言的高效OCR处理,包括图像动画和个性化T2I模型。Surya的特点是其高效性和多语言支持能力。
AI训练入门,超级易用的AI训练平台
训练面板是一个为初学者提供超级易用的AI训练平台。对于高级用户,我们提供可定制的设置。训练面板具有简洁直观的界面,使用户能够轻松地训练自己的AI模型。它支持各种机器学习算法和深度学习框架,包括TensorFlow和PyTorch等。通过训练面板,用户可以通过上传数据集、设置训练参数和监控训练进度来训练和优化自己的AI模型。训练面板还提供模型评估和预测功能,帮助用户评估模型的性能并进行预测。定价灵活,提供免费试用和付费订阅选项。
从人工智能反馈中获得内在动机
Motif 是一个基于 PyTorch 的项目,通过从 LLM(大型语言模型)的偏好中获取奖励函数,训练 AI 代理在 NetHack 上进行。它可以生成与人类行为直觉一致的行为,并且可以通过提示修改进行引导。
Unity深度学习推理库
Sentis是一个Unity中的神经网络推理库。您可以使用Sentis将训练好的神经网络模型导入Unity,然后在Unity支持的任何平台上本地实时运行它们。您可以在GPU或CPU上运行模型。使用Sentis需要一些使用机器学习模型的经验,例如在TensorFlow或PyTorch等框架中。
PyTorch训练平台,闪电般快速
Lightning AI是一个基于PyTorch的平台,可以帮助用户无痛地在本地机器和云环境之间进行AI模型的训练和部署。它支持各类热门AI模型如大型语言模型、Transformers、Stable Diffusion等的构建。关键特性包括对分布式多GPU训练的支持、内置MLOps功能、云端无服务器部署等。适用于AI研发团队、想要快速构建AI产品的公司以及拥有GPU资源的机构。
租用云GPU,从0.2美元/小时起
RunPod是一个可扩展的云GPU基础设施,用于训练和推理。你可以租用云GPU,从0.2美元/小时起,支持TensorFlow、PyTorch和其他AI框架。我们提供可信赖的云服务、免费带宽、多种GPU选项、服务器端点和AI端点,适用于各种场景。
快速AI培训,让神经网络再次不再“酷”
fast.ai是一个提供实用的深度学习课程和软件工具的平台。其课程覆盖了从深度学习基础到稳定扩散的内容。fast.ai为PyTorch提供了fastai软件库,帮助用户在实际项目中应用深度学习。其主要优势在于提供实践导向的教学和易于使用的工具。定价信息可在官网获取。
构建定制的大型语言模型(LLM)以增强聊天机器人的能力。
ChatRTX 是 NVIDIA 提供的一个用于构建定制大型语言模型(LLM)的平台,旨在提升聊天机器人的智能水平和交互能力。它利用先进的 AI 技术,通过理解自然语言处理(NLP)来提供更加人性化的对话体验。ChatRTX 的主要优点包括高度的可定制性、强大的语言理解能力和高效的交互设计,适合需要高级对话系统的各种商业应用。
业界首个llama3中文指令微调模型,支持长文本输入,实现高质量中文问答。
Unichat-llama3-Chinese是中国联通AI创新中心发布的业界首个基于Meta Llama 3模型的中文指令微调模型。该模型通过增加中文数据进行训练,实现了高质量的中文问答功能,支持长达28K的上下文输入,并计划发布支持长度64K的版本。模型的微调指令数据经过人工筛查,确保了数据的高质量。此外,该模型还计划陆续发布700亿参数的中文微调版本,包括长文本版本和加入中文二次预训练的版本。
© 2024 AIbase 备案号:闽ICP备2023012347号-1