浏览量:39
最新流量情况
月访问量
831.56k
平均访问时长
00:04:18
每次访问页数
5.18
跳出率
40.72%
流量来源
直接访问
64.81%
自然搜索
19.45%
邮件
0.01%
外链引荐
15.38%
社交媒体
0.31%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
77.10%
新加坡
0.78%
美国
10.86%
多语种大模型
猎户星空 - 14B-Base 是一个具有 140 亿参数的多语种大模型,具有卓越的性能和多语言能力。它适用于各种聊天任务,能够提供高质量的用户交互体验。猎户星空 - 14B-Base 在多项评测中表现优异,可广泛应用于生产力、教育、商业等领域。
大规模多语种语音生成数据集
Emilia是一个开源的多语种野外语音数据集,专为大规模语音生成研究设计。它包含超过101,000小时的六种语言高质量语音数据和相应的文本转录,覆盖了各种说话风格和内容类型,如脱口秀、访谈、辩论、体育评论和有声书。
Meta 新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
未来演示控制的手势识别技术
Phantomy AI是一款利用计算机视觉软件,通过屏幕对象检测和手势识别技术,增强用户交互和演示的先进工具。它无需额外硬件,即可通过直观的手势控制屏幕,为用户提供了一种无需接触的交互方式。Phantomy AI的主要优点包括高精准的屏幕对象检测、基于手势的控制、流畅的幻灯片导航、增强的用户体验和广泛的应用场景。产品背景信息显示,Phantomy AI由AI工程师Almajd Ismail开发,他拥有软件开发和全栈开发的背景。关于价格和定位,页面上没有提供具体信息。
在线AI配音,将视频和音频本地化为任何语言
AI Dubbing Online是一项利用人工智能技术进行视频和音频配音的服务。它通过精确的声音同步和情感表达,帮助用户将内容本地化为100多种语言,扩大全球观众群体。这项技术的重要性在于它能够以高达95%的准确率提供无与伦比的配音质量,使用先进的自然语言处理技术来分析和配音,从而扩大观众覆盖范围。AI Dubbing Online被行业领导者和超过100万用户所信赖,它不仅是一个配音工具,还提供了一个全方位的解决方案,包括转录、字幕生成等,为整个本地化工作流程节省了时间和精力。
AIGC 应用快速构建平台
派欧算力云大模型 API 提供易于集成的各模态 API 服务,包括大语言模型、图像、音频、视频等,旨在帮助用户轻松构建专属的 AIGC 应用。该平台拥有丰富的模型资源,支持个性化需求的模型训练和托管,同时保证用户私有模型的保密性。它以高性价比、高吞吐量和高性能推理引擎为特点,适用于多种 AI 应用场景,如聊天机器人、总结摘要、小说生成器等。
国产化大模型,支持多模态,快速低成本智能化转型。
岩芯数智是一家专注于人工智能领域的公司,提供多种智能模型服务,包括Yan模型和Dolphin模型。Yan模型是国产化的大模型,支持多模态,承诺为用户提供训练周期短、数据集需求小、性价比更高的服务,帮助各产业链快速、低成本向智能化转型。Dolphin模型则提供智能对话、文章生成、文案摘要等功能,支持私域模型微调,以满足不同行业的需求。
字节跳动自研大模型,提供多模态能力
豆包大模型是字节跳动推出的自研大模型,通过内部50+业务场景实践验证,每日万亿级tokens大使用量持续打磨,提供多模态能力,以优质模型效果为企业打造丰富的业务体验。产品家族包括多种模型,如通用模型、视频生成、文生图、图生图、同声传译等,满足不同业务需求。
一款强大的移动端翻译软件,支持多种语言翻译。
疯狂翻译师是一款提供实时翻译服务的移动端软件,支持文字、图片、文档和视频翻译,覆盖200+语种,帮助用户跨越语言障碍,提升翻译效率,适用于国际交流、学习、工作等多种场景。
全面对标GPT-4 Turbo的AI大语言模型
讯飞星火是科大讯飞推出的一款全面对标GPT-4 Turbo的AI大语言模型,它通过集成多种AI技术,如语音识别、自然语言处理、机器学习等,为用户提供高效、智能的办公效率工具。该产品不仅能够处理文本信息,还能进行语音识别和生成,支持多语种,适用于企业服务、智能硬件、智慧政务、智慧金融、智慧医疗等多个领域。
几行代码接入大模型
智谱AI大模型开放平台是一个提供多种AI模型服务的平台,支持开发者和企业快速接入大模型API,构建变革性AI体验。平台提供GLM-4系列大模型,包括免费模型GLM-4-Flash、全自研最新版本GLM-4-Plus、支持200万上下文的GLM-4-Long等。此外,还提供多模态大模型,如视觉能力GLM-4V-Plus、文生图CogView-3-Plus、文生视频CogVideoX。平台面向开发者提供模型API、Alltools API、批处理API等服务,面向企业服务提供医疗健康、汽车、游戏娱乐、文旅、智能终端、智能制造、消费等行业解决方案。
低延迟、高质量的端到端语音交互模型
LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的低延迟、高质量的端到端语音交互模型,旨在实现GPT-4o级别的语音能力。该模型支持低延迟的语音交互,能够同时生成文本和语音响应。它在不到3天的时间内使用仅4个GPU完成训练,展示了其高效的训练能力。
多模态大模型,赋能企业智能化转型。
西湖心辰是心辰智能云旗下的一款多模态大模型产品,它集成了先进的人工智能技术,包括自然语言处理、机器学习和数据挖掘等,旨在为企业提供全面的AI解决方案。西湖心辰通过其高情商、高智商的AI能力,帮助企业在客服、销售、人事、研发和运营等多个领域实现智能化升级,提升工作效率和服务质量。
RWKV v6 Finch 14B,开源大模型,高效处理长文本。
RWKV v6 Finch 14B是RWKV架构的第六个版本,也是该系列中最大的模型。它通过引入数据依赖性到token shift和time-mixing中,提高了处理长文本时的效率。Finch 14B模型在处理提示时,能够更好地管理其长期记忆,从而提供更广泛的应用范围。该模型是开源的,由Linux Foundation认可,并且接受社区的GPU集群时间捐赠以支持训练。
企业级AI服务平台,提供大模型应用开发与部署
无问芯穹是一个面向企业级用户的AI服务平台,专注于提供大模型应用开发与部署的解决方案。它支持多种模型和芯片,提供端到端的服务体验,包括模型微调、模型服务、开发机、任务、推理服务等。无问芯穹致力于帮助开发者和企业快速构建和部署AI应用,提高开发效率,降低技术门槛。
国际领先的语言理解与长文本处理大模型。
GLM-4-Plus是智谱推出的一款基座大模型,它在语言理解、指令遵循和长文本处理等方面性能得到全面提升,保持了国际领先水平。该模型的推出,不仅代表了中国在大模型领域的创新和突破,还为开发者和企业提供了强大的语言处理能力,进一步推动了人工智能技术的发展和应用。
对话式全链路数据分析助手
百度GBI是一款依托大模型对话交互的商业分析助手,能够实现查询、绘图、归因、预测、洞察、总结等全链路数据分析任务,无需编写SQL代码,简化了数据分析流程,提高了效率,适用于各种业务场景。
智能间隔重复记忆卡片,学习多国语言。
Vocabuo是一款利用智能间隔重复算法的记忆卡片应用,帮助用户学习西班牙语、德语和英语。它提供音频、图片、解释和句子,帮助用户在15分钟内回忆大约100个单词。Vocabuo强调上下文学习的重要性,允许用户通过句子来学习单词,而不仅仅是孤立的单词。此外,它还提供了词汇提取器,可以从任何文本创建练习卡组,并支持YouTube集成和内置浏览器,帮助用户扩展词汇量。
深入分析TTFT、TPS等关键指标
该网站提供了国内常见模型提供商API服务的性能指标,包括TTFT(首token时延)、TPS(每秒输出token数)、总耗时、上下文长度以及输入输出价格等详细数据。它为开发者和企业提供了评估不同大模型性能的依据,帮助他们选择最适合自己需求的模型服务。
心理健康大模型,支持心理健康辅导链路。
EmoLLM是一个心理健康大模型,由LLM指令微调而来,旨在全面理解和促进个体、群体乃至整个社会的心理健康状态。它包含认知因素、情感因素、行为因素、社会环境、生理健康、心理韧性、预防和干预措施、评估和诊断工具等多个关键组成部分。EmoLLM通过微调配置,能够在心理咨询任务上提供支持,帮助用户更好地理解和应对心理问题。
自然交互的语音理解和生成基础模型
FunAudioLLM是一个旨在增强人类与大型语言模型(Large Language Models, LLMs)之间自然语音交互的框架。它包含两个创新模型:SenseVoice负责高精度多语种语音识别、情绪识别和音频事件检测;CosyVoice负责自然语音生成,支持多语种、音色和情绪控制。SenseVoice支持超过50种语言,具有极低的延迟;CosyVoice擅长多语种语音生成、零样本上下文生成、跨语言语音克隆和指令跟随能力。相关模型已在Modelscope和Huggingface上开源,并在GitHub上发布了相应的训练、推理和微调代码。
多语种语音理解模型,提供高精度语音识别与情感识别。
SenseVoice是一个包含自动语音识别(ASR)、语音语言识别(LID)、语音情感识别(SER)和音频事件检测(AED)等多语音理解能力的语音基础模型。它专注于高精度多语种语音识别、语音情感识别和音频事件检测,支持超过50种语言,识别性能超越Whisper模型。模型采用非自回归端到端框架,推理延迟极低,是实时语音处理的理想选择。
打造大模型时代的产品能力,低成本开发智能体,实现商业闭环。
文心智能体平台 AgentBuilder 是基于文心大模型的智能体平台,支持开发者根据行业领域和应用场景,选择不同开发方式打造智能体。其主要优点包括低成本开发、流量分发路径支持,为用户提供完整的产品开发闭环。
AI驱动的新型网页,重构信息互动。
Sparkpage 是由 Genspark 推出的革命性网页形式,致力于通过 AI 技术改善用户在线获取信息的方式。它通过内容蒸馏和整合,提供无商业影响和编辑偏见的丰富、可靠信息。内置的 AI 助手能够动态响应用户查询,提供个性化的见解和信息。
Lumalabs AI从文本和图像快速生成高质量、逼真视频的AI模型
Lumalabs AI的Dream Machine是一个AI模型,能够直接从文本和图像快速生成高质量的逼真视频。它是一个高度可扩展且高效的transformer模型,专门针对视频进行训练,能够生成物理上准确、一致且充满事件的镜头。Dream Machine是构建通用想象力引擎的第一步,现已对所有人开放。
易用、灵活、高效的开源大模型应用开发框架。
Agently是一个开源的大模型应用开发框架,旨在帮助开发者快速构建基于大语言模型的AI agent原生应用。它通过提供一系列工具和接口,简化了与大型语言模型的交互过程,使得开发者可以更专注于业务逻辑的实现。Agently框架支持多种模型,易于安装和配置,具有高度的灵活性和扩展性。
© 2024 AIbase 备案号:闽ICP备08105208号-14