浏览量:28
让ChatGPT-4帮助您进行对话、交换反馈和进行有趣的会话-在Slack内部。
1v1 Meetings是一个在Slack中进行1v1会议的应用程序。它可以帮助您安排高效的会议、提供AI支持的行动点,并记录重要讨论和决策。您可以轻松跟踪会议,并跟踪待办事项。使用ChatGPT-4生成基于对话的有效和可行的摘要。
1对1会议机器人
Bondr使用人工智能连接您的员工进行个性化的1对1会议,促进更紧密的联系,增强团队合作力,提升公司文化。Bondr与Teams和Slack集成,自动化1对1会议调度,提供定制问题,增加团队沟通和工作满意度。
基于FLUX.1-dev的文本到图像生成模型
FLUX.1-dev-LoRA-Text-Poster是由Shakker-Labs开发的文本到图像生成模型,专门用于艺术文本海报的生成。该模型利用LoRA技术,通过文本提示来生成图像,为用户提供了一种创新的方式来创作艺术作品。模型的训练由版权用户cooooool完成,并在Hugging Face平台上共享,以促进社区的交流和发展。模型遵循非商业用途的flux-1-dev许可协议。
O1复制之旅:战略进展报告第一部分
O1-Journey是由上海交通大学GAIR研究组发起的一个项目,旨在复制和重新想象OpenAI的O1模型的能力。该项目提出了“旅程学习”的新训练范式,并构建了首个成功整合搜索和学习在数学推理中的模型。这个模型通过试错、纠正、回溯和反思等过程,成为处理复杂推理任务的有效方法。
在Slack上快速启动Google Meet
通过Meet for Slack,在Slack上设置、启动和分享Google Meet与您的同事,无需麻烦。您只需输入命令“/meet”,Meet for Slack将负责剩下的事情。每个主持人都可以获得免费的7天试用期。试用结束后,主持人可以订阅每年4.99美元或享受折扣的团队计划。
基于FLUX.1-dev模型的IP-Adapter,实现图像工作如文本般灵活。
FLUX.1-dev-IP-Adapter是一个基于FLUX.1-dev模型的IP-Adapter,由InstantX Team研发。该模型能够将图像工作处理得像文本一样灵活,使得图像生成和编辑更加高效和直观。它支持图像参考,但不适用于细粒度的风格转换或角色一致性。模型在10M开源数据集上训练,使用128的批量大小和80K的训练步骤。该模型在图像生成领域具有创新性,能够提供多样化的图像生成解决方案,但可能存在风格或概念覆盖不足的问题。
SkyReels-V1 是首个开源的人类中心视频基础模型,专注于高质量视频生成。
SkyReels-V1 是一个开源的人类中心视频基础模型,基于高质量影视片段微调,专注于生成高质量的视频内容。该模型在开源领域达到了顶尖水平,与商业模型相媲美。其主要优势包括:高质量的面部表情捕捉、电影级的光影效果以及高效的推理框架 SkyReelsInfer,支持多 GPU 并行处理。该模型适用于需要高质量视频生成的场景,如影视制作、广告创作等。
Unofficial community-created port of Midjourney for Slack
Midjourney for Slack是Midjourney的非官方社区创建的Slack插件。直接在您的公司Slack工作区中使用Midjourney机器人,与团队一起发挥创意。支持实时协作、图像生成、反馈和批准等功能。首次使用前5次图像生成免费,之后需要升级到付费计划。
ComfyUI Desktop V1是一款提供一键安装和全新界面的桌面客户端。
ComfyUI Desktop V1是一个为Windows和macOS设计的桌面客户端,它提供了一键安装的便利性,并拥有全新的用户界面。用户可以通过加入等待名单来获得早期访问权限。这款软件的主要优点在于它的易用性和现代化的界面设计,旨在提高用户的工作效率。ComfyUI Desktop V1由Comfy Org组织开发,是一个开源项目,可以在GitHub上找到其源代码。
会议助手,提高会议效率
1Page是一款智能会议助手,可帮助用户优化销售会议流程,提供必要资源,提高会议效率。通过AI技术,1Page能够自动整理会议内容,提供实时笔记和待办事项,方便团队协作。此外,1Page还提供会议数据分析和会议记录回放等功能,帮助用户更好地管理和评估会议。1Page采用订阅模式定价,提供多种套餐选择。
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
SkyReels V1 是一个基于 HunyuanVideo 微调的人类中心视频生成模型。它通过高质量影视片段训练,能够生成具有电影级质感的视频内容。该模型在开源领域达到了行业领先水平,尤其在面部表情捕捉和场景理解方面表现出色。其主要优点包括开源领先性、先进的面部动画技术和电影级光影美学。该模型适用于需要高质量视频生成的场景,如影视制作、广告创作等,具有广泛的应用前景。
1位大型语言模型推理框架
BitNet是由微软开发的官方推理框架,专为1位大型语言模型(LLMs)设计。它提供了一套优化的核心,支持在CPU上进行快速且无损的1.58位模型推理(NPU和GPU支持即将推出)。BitNet在ARM CPU上实现了1.37倍到5.07倍的速度提升,能效比提高了55.4%到70.0%。在x86 CPU上,速度提升范围从2.37倍到6.17倍,能效比提高了71.9%到82.2%。此外,BitNet能够在单个CPU上运行100B参数的BitNet b1.58模型,实现接近人类阅读速度的推理速度,拓宽了在本地设备上运行大型语言模型的可能性。
Magic 1-For-1 是一个高效的图像到视频生成模型,可在一分钟内生成一分钟的视频。
Magic 1-For-1 是一个专注于高效视频生成的模型,其核心功能是将文本和图像快速转换为视频。该模型通过将文本到视频的生成任务分解为文本到图像和图像到视频两个子任务,优化了内存使用并减少了推理延迟。其主要优点包括高效性、低延迟和可扩展性。该模型由北京大学 DA-Group 团队开发,旨在推动交互式基础视频生成领域的发展。目前该模型及相关代码已开源,用户可以免费使用,但需遵守开源许可协议。
苹果发布多模态LLM模型MM1
苹果发布了自己的大语言模型MM1,这是一个最高有30B规模的多模态LLM。通过预训练和SFT,MM1模型在多个基准测试中取得了SOTA性能,展现了上下文内预测、多图像推理和少样本学习能力等吸引人的特性。
基于FLUX.1-dev的中文人物肖像生成模型
AWPortraitCN是一个基于FLUX.1-dev开发的文本到图像生成模型,专门针对中国人的外貌和审美进行训练。它包含多种类型的肖像,如室内外肖像、时尚和摄影棚照片,具有强大的泛化能力。与原始版本相比,AWPortraitCN在皮肤质感上更加细腻和真实。为了追求更真实的原始图像效果,可以与AWPortraitSR工作流程一起使用。
开放发布的Grok-1模型,拥有3140亿参数
Grok-1是由xAI从头开始训练的314亿参数的专家混合模型(Mixture-of-Experts)。该模型未经针对特定应用(如对话)的微调,是Grok-1预训练阶段的原始基础模型检查点。
1键式AI,快速、高效、便捷
MaxAI.me 是一款Chrome插件,通过集成ChatGPT、GPT-4、Claude、Bard、Bing AI等强大的生成式人工智能模型,提供快速、高效、便捷的AI辅助功能。您可以在任何网页上一键使用AI,进行文本编辑、写作、总结、翻译、回复等多种操作。无需复制粘贴,支持多语言,隐私友好。支持GPT-4、GPT-3、Bard、Claude、Bing AI等主要模型,适用于各种生产力场景。
Sonus-1:开启大型语言模型(LLMs)的新时代
Sonus-1是Sonus AI推出的一系列大型语言模型(LLMs),旨在推动人工智能的边界。这些模型以其高性能和多应用场景的多功能性而设计,包括Sonus-1 Mini、Sonus-1 Air、Sonus-1 Pro和Sonus-1 Pro (w/ Reasoning)等不同版本,以满足不同需求。Sonus-1 Pro (w/ Reasoning)在多个基准测试中表现突出,特别是在推理和数学问题上,展现了其超越其他专有模型的能力。Sonus AI致力于开发高性能、可负担、可靠且注重隐私的大型语言模型。
DeepSeek-V3/R1 推理系统是一个高性能的分布式推理架构,专为大规模 AI 模型优化设计。
DeepSeek-V3/R1 推理系统是 DeepSeek 团队开发的高性能推理架构,旨在优化大规模稀疏模型的推理效率。它通过跨节点专家并行(EP)技术,显著提升 GPU 矩阵计算效率,降低延迟。该系统采用双批量重叠策略和多级负载均衡机制,确保在大规模分布式环境中高效运行。其主要优点包括高吞吐量、低延迟和优化的资源利用率,适用于高性能计算和 AI 推理场景。
AI高清视频会议系统,高效远程协作。
讯飞会议是安徽听见科技有限公司推出的一款AI高清视频会议系统,专注于提供线上远程网络云会议服务。它基于星火大模型,能够自动生成会议纪要,准确率高达97.5%。产品支持多端协同,包括PC、Mac、手机等,提供高清稳定流畅的音视频体验,同时具备弱网优化,确保声音清晰不卡顿,视频流畅不断。此外,讯飞会议还提供安全稳定的服务,采用AES256和SSL加密技术,保障数据安全。
1T开源多语言大型语言模型
Tele-FLM-1T是一个开源的1T多语言大型语言模型,基于解码器仅Transformer架构,经过约2T tokens的训练。该模型在规模上展现出卓越的性能,有时甚至超越了更大的模型。除了分享模型权重外,还提供了核心设计、工程实践和训练细节,期待对学术和工业社区都有所裨益。
腾讯会议是一款会议解决方案产品
腾讯会议是腾讯自主研发的一款会议软件,提供视频会议、网络研讨会、会议室等产品和服务,支持桌面客户端、移动端等多端使用。可实时共享屏幕,支持白板互动等,实现高清音视频会议。还提供开放API,可深度定制开发。适合企业员工在线会议、网络课堂、远程面试等多种场景使用。
使用Groq或OpenAI或Ollama创建o1类推理链
o1是一个实验性的项目,旨在通过使用大型语言模型(LLM)来创建推理链,帮助模型解决通常难以处理的逻辑问题。它支持Groq、OpenAI和Ollama后端,通过动态推理链让模型能够“思考”并解决问题。o1展示了仅通过提示就能显著提高现有模型的逻辑推理能力,而无需额外训练。
这是一个完全开放的 DeepSeek-R1 模型的复现项目,旨在帮助开发者复现和构建基于 R1 的模型。
huggingface/open-r1 是一个开源项目,致力于复现 DeepSeek-R1 模型。该项目提供了一系列脚本和工具,用于训练、评估和生成合成数据,支持多种训练方法和硬件配置。其主要优点是完全开放,允许开发者自由使用和改进,对于希望在深度学习和自然语言处理领域进行研究和开发的用户来说,是一个非常有价值的资源。该项目目前没有明确的定价,适合学术研究和商业用途。
Slack机器人,可实现跨时区的自动时间转换
Timezone Cat是一个基于AI的Slack机器人,可实现跨时区团队的无缝远程协作。它可以自动转换跨时区的时间,解决不同时区团队成员计划会议和沟通的困扰。
使用开源模型Llama-3.1 70b在Groq上创建类似o1的推理链
g1是一个实验性的项目,旨在通过使用Llama-3.1 70b模型在Groq硬件上创建类似于OpenAI的o1模型的推理链。这个项目展示了仅通过提示技术,就可以显著提高现有开源模型在逻辑问题解决上的能力,而无需进行复杂的训练。g1通过可视化的推理步骤,帮助模型在逻辑问题上实现更准确的推理,这对于提高人工智能的逻辑推理能力具有重要意义。
一个尝试复现OpenAI O1模型的编程辅助工具
O1-CODER是一个旨在复现OpenAI的O1模型的项目,专注于编程任务。该项目结合了强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,以增强模型的系统二型思考能力,目标是生成更高效、逻辑性更强的代码。这个项目对于提升编程效率和代码质量具有重要意义,尤其是在需要大量自动化测试和代码优化的场景中。
Miqu 1-70b是一个开源的大规模语言模型
Miqu 1-70b是一个开源大规模语言模型,采用了新颖的自我监督学习方法,可以处理各种自然语言任务。该模型参数量达170亿,支持多种prompt格式,可fine-tuning生成高质量的文本。其强大的理解和生成能力,使其可广泛应用于聊天机器人、文本摘要、问答系统等领域。
智元发布首个通用具身基座大模型GO-1,开创性提出ViLLA架构,推动具身智能发展。
智元通用具身基座大模型GO-1是智元推出的一款革命性的人工智能模型。该模型基于创新的Vision-Language-Latent-Action(ViLLA)架构,通过多模态大模型(VLM)和混合专家(MoE)系统,实现了从视觉和语言输入到机器人动作执行的高效转换。GO-1能够利用人类视频和真实机器人数据进行学习,具备强大的泛化能力,能够在极少数据甚至零样本下快速适应新任务和环境。其主要优点包括高效的学习能力、强大的泛化性能以及对多种机器人本体的适配性。该模型的推出标志着具身智能向通用化、开放化和智能化方向迈出了重要一步,有望在商业、工业和家庭等多个领域发挥重要作用。
© 2025 AIbase 备案号:闽ICP备08105208号-14