让任何人的声音听起来调皮/有趣
bleep_that_sht 是一个使用 Python 编写的应用程序,它利用 Whisper 转录模型来转录音频,然后根据用户选择的关键词,使用相应的时间戳来替换为哔声。所有处理都在本地完成,无需上传数据,保护用户隐私。
系统性调研生成式AI的提示技术
The Prompt Report 是一份系统性调研报告,专注于生成式人工智能(GenAI)的提示技术。它通过结合人类和机器的努力,从多个数据库中处理了4797条记录,提取出1565篇相关论文。报告提供了58种基于文本的技术,并补充了多模态和多语言技术的广泛集合。其目标是提供一个易于理解和实施的提示技术目录,并回顾了作为提示扩展的代理,包括评估输出和设计有助于安全性和安全性的提示的方法。此外,报告还应用提示技术在两个案例研究中进行了实践。
用于训练大型语言模型的开源合成数据生成管道。
Nemotron-4 340B是NVIDIA发布的一系列开放模型,专为生成合成数据以训练大型语言模型(LLMs)而设计。这些模型经过优化,可以与NVIDIA NeMo和NVIDIA TensorRT-LLM配合使用,以提高训练和推理的效率。Nemotron-4 340B包括基础、指令和奖励模型,形成一个生成合成数据的管道,用于训练和完善LLMs。这些模型在Hugging Face上提供下载,并很快将在ai.nvidia.com上提供,作为NVIDIA NIM微服务的一部分。
NVIDIA ACE是一套用于创建数字人类、AI非玩家角色和交互式头像的生成式AI技术套件。
NVIDIA ACE提供了一套先进的生成式AI模型和微服务,易于部署且性能优越。这些AI模型基于商业安全、负责任许可的数据进行训练,并通过微调和防护措施确保无论用户输入如何,都能提供准确、恰当、切题的结果。ACE支持灵活的部署选项,可以在云端或NVIDIA RTX AI PC上部署和运行。此外,ACE还提供了数字人类工作流程,允许开发者将ACE NIMs集成到他们的产品、工具、服务或游戏中,用于特定领域的AI工作流程,如NPC和客户服务助手。NVIDIA还与Inworld AI合作,展示了将NVIDIA ACE集成到一个端到端NPC平台中的示例,该平台在Unreal Engine 5中提供了尖端的视觉效果。
ProJourney AI是一个生成式AI工具,为设计师和创作者提供了无需通过Discord的Midjourney生成器的访问权限,轻松通过文本提示生成高质量图像。
ProJourney AI是一个生成式AI工具,为设计师和创作者提供了访问Midjourney生成器的能力。它可以通过简单的文本提示生成高质量的图像,并且不需要将这些图像公开共享在Discord上。该工具的主要优点是提供了私密的图像生成功能,并且用户可以自由控制生成图像的质量和风格。ProJourney AI适用于各种设计任务,包括平面设计、插画、用户界面设计等。
一个开源的、增强检索的生成式聊天机器人。
Verba 是一个开源应用程序,旨在提供端到端、流畅且用户友好的检索增强生成(RAG)接口。它结合了最先进的RAG技术和Weaviate的上下文感知数据库,支持本地或通过云部署,可以轻松探索数据集并提取洞见。
使用生成式人工智能改变搜索体验
GenSearch是一款使用生成式人工智能技术的搜索引擎,通过强大的功能和用户友好的设计,提供精确的搜索结果,增强用户参与度和满意度。它不需要编写任何代码即可实现搜索引擎的部署和交付。GenSearch正在不断改进,计划推出API接口、数据驱动洞察和对话式搜索等功能。
隐私第一的企业生成式AI平台
Omnifact是专为工作场所打造的隐私第一的生成式AI平台。充分利用生成式AI的潜力,同时保护您的数据主权。Omnifact提供安全的企业级生成式AI平台,旨在提升生产力,简化知识管理,推动创新,并优先考虑数据安全和隐私。
MediaTek DaVinci 是一个基于MediaTek 的生成式AI平台
MediaTek DaVinci 是一个强大的生成式AI平台,能提供自然流畅的人工智能对话体验,充当个人助理。平台还能整合多种信息源,帮助用户全方位了解相关信息。平台可无限扩展,用户可通过插件和智能助手扩展功能,满足各种需求。平台上还有开发者自由创作的插件、模板和知识库,为用户提供独特的AI体验。
生成式AI资源中心,覆盖研究、面试资源、笔记本等
这个GitHub仓库是一个集中存放生成式人工智能相关资源的中心,包括每月最新研究论文、面试题库、课程材料、代码笔记本等。内容定期更新,旨在让开发者及从业人员能够及时跟进最新进展,提高生产力。主要资源包括论文摘要、面试问题分类、免费课程列表、开源笔记本等,还包括一些使用场景和范例。
基于稳定扩散生成高质量动漫风格图像的文本到图像模型
Animagine XL 3.1 是一款能够基于文本提示生成高质量动漫风格图像的文本到图像生成模型。它建立在稳定扩散 XL 的基础之上,专门针对动漫风格进行了优化。该模型具有更广泛的动漫角色知识、优化过的数据集和新的美学标签,从而提高了生成图像的质量和准确性。它旨在为动漫爱好者、艺术家和内容创作者提供有价值的资源。
借助生成式AI创建一致性角色和场景的视觉故事
Katalist是一款面向电影制片人、广告商和内容创作者的在线工具。它利用生成式AI技术帮助用户可视化创意构思,轻松创建故事板、视频创意和创意推介。Katalist的核心功能是可以分析剧本,自动提取人物、场景和活动,一键生成相应的视觉素材。用户无需任何AI专业知识,即可通过Katalist便捷地使用生成式AI技术。Katalist确保整个故事板中的角色、场景保持一致性,并允许用户轻松切换角色或场景元素。相比传统方式,使用Katalist可将内容制作周期缩短4倍。该工具定位于简化内容创作流程,帮助创作者在构思阶段高效可视化创意,优化沟通效率,并为拍摄当天做好准备规划。Katalist提供免费试用。
省时写个性化销售邮件,使用生成式AI和行业最佳实践。
Regie.ai是一个AI辅助销售邮件的工具,可以帮助繁忙的销售代表和SDR节省时间。通过使用我们的AI,您可以将制作个性化销售邮件的时间减少90%。我们的AI可以在几秒钟内研究联系人并撰写个性化邮件,每次都提供独特的信息,让您的潜在客户感到满意。使用AI提示和基于人物的CMS内容,摒弃模板,每次生成独特的消息。使用我们内置的CMS来访问您的电子邮件中所需的完美素材,消除对昂贵的CMS平台的需求。AI可以在您喜爱的销售推广平台、电子邮件服务或社交媒体平台内发挥作用。使用Regie.ai的Chrome扩展程序,在几秒钟内起草和发送相关的销售邮件。
新一代文本到图像生成AI模型
Stable Diffusion 3是stability公司推出的新一代文本到图像生成AI模型,相比早期版本在多主体提示、图像质量和拼写能力等方面都有了极大提升。该模型采用了diffusion transformer架构和flow matching技术,参数量范围从800M到8B不等,提供了从个人用户到企业客户多种部署方案。主要功能包括:高质量图片生成、支持多主体、拼写错误纠正等。典型应用场景有:数字艺术创作、图片编辑、游戏和电影制作等。相比早期版本,该AI助手具有更强大的理解和创作能力,是新一代安全、开放、普惠的生成式AI典范。
构建企业级生成式AI应用程序
Promptly是一款企业级生成式AI应用程序构建平台,无需编码即可快速构建生成式AI应用、代理和聊天机器人。您可以使用Promptly的模块化平台从原型到生产部署您的AI应用,无缝集成自己的数据和基于GPT的模型。
Rufus - 专业购物助手,基于生成式AI的对话式购物体验
Rufus是一款基于生成式AI的专业购物助手,接受Amazon广泛的产品目录、顾客评价、社区问答以及网络信息的培训。它能够回答关于购物需求、产品和比较的问题,根据对话背景提供建议,并在Amazon常用的购物体验中促进产品发现。Rufus将在Amazon移动应用的小部分客户中推出beta版本,并将在未来几周逐步向更多的美国客户推出。
灵活、可共享、可重复使用的生成式AI数据准备和评估工具
Unitxt是一款创新的库,专为生成式语言模型量身定制,用于定制文本数据准备和评估。Unitxt与HuggingFace和LM-eval-harness等常用库进行原生集成,并将处理流程拆分为模块化组件,实现了易定制和共享。这些组件包括模型特定格式、任务提示等全面的数据集处理定义。Unitxt-Catalog集中了这些组件,促进了现代文本数据工作流中的协作和探索。除了是一款工具,Unitxt还是一个社区驱动的平台,赋予用户协作构建、分享和推进他们的数据流水线的能力。
Oracle云平台的生成式AI服务
Oracle Generative AI Service是一个全托管的生成式AI服务,可以轻松地将多功能的语言模型集成到各种用例中,包括写作辅助、摘要生成和聊天机器人等。该服务基于Oracle Cloud Infrastructure,提供高性能、面向企业的模型,支持高效的微调和多个用例,安全可靠的企业级的数据管理、安全与管控。
© 2024 AIbase 备案号:闽ICP备08105208号-14