最新流量情况
月访问量
42.72k
平均访问时长
00:03:25
每次访问页数
2.51
跳出率
39.15%
流量来源
直接访问
65.31%
自然搜索
26.80%
邮件
6.34%
外链引荐
0.35%
社交媒体
1.20%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
卢森堡
56.34%
美国
14.64%
德国
6.12%
英国
2.82%
越南
1.70%
使用的 Sora 同架构视频生成模型
Viva 是一个免费的 AI 生成工具和社区,提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能,以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容,使图像和视频更加高质量和 4K。Viva 使 AI 创作更简单、高效。海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。 文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频 目前运动幅度最大的视频生成模型,同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好,同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频,目前很多视频模型的演示都是横屏视频,竖屏的表现并不好,但是短视频又是视频内容的大头,所以竖屏视频的生成质量是个很重要的指标。 但是一致性有一部分测试中保持的不是很好,同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。
现代AI自动化全球会计解决方案,专为小型企业设计。
Fiskl是一个多货币的全球会计平台,为小型企业、创业者、开发者和自由职业者提供全面的财务管理工具。它支持170多种货币和21,000多家银行,利用人工智能技术简化银行对账流程,实现零接触Stripe支付和银行对账。Fiskl的主要优点包括实时现金流和财务概览、自动化银行同步、全球支付能力、AI驱动的对账节省高达80%的对账工作量。Fiskl的定价策略包括特别优惠,例如年度订阅可享受50%的循环折扣,并提供30天免费试用期。
为学习而生的AI阅读器,高效筛选优质内容,提升阅读和学习效率。
Cubox是一款专业的AI阅读器,旨在通过智能技术帮助用户筛选和整理阅读内容,提升阅读效率和学习效果。它具备自动高亮精彩内容、一键解读网页文章、专业级标注等功能,适用于需要大量阅读和学习的用户。产品背景信息显示,Cubox深受全球专业人士青睐,并且用户阅读的文章总数达到了23,325,802篇,显示了其广泛的用户基础和影响力。
由哔哩哔哩用户评论微调训练而成的本地聊天机器人
bilibot是一个基于哔哩哔哩用户评论训练的本地聊天机器人,支持文字聊天和语音对话。它使用Qwen1.5-32B-Chat作为基础模型,并结合苹果的mlx-lm LORA项目进行微调。语音生成部分基于GPT-SoVITS项目,使用派蒙语音模型。该机器人可以快速生成对话内容,适用于需要智能对话系统的场合。
谷歌高质量文本到图像模型,生成逼真、生活化图像。
Imagen 3 是谷歌一个先进的文本到图像的生成模型,它能够生成具有极高细节水平和逼真效果的图像,并且相较于之前的模型,其视觉干扰元素显著减少。该模型对自然语言的理解更为深入,能够更好地把握提示背后的意图,并从更长的提示中提取细节。此外,Imagen 3 在渲染文本方面表现出色,为个性化生日信息、演示文稿标题幻灯片等提供了新的可能性。
Google的尖端开放视觉语言模型
PaliGemma是Google发布的一款先进的视觉语言模型,它结合了图像编码器SigLIP和文本解码器Gemma-2B,能够理解图像和文本,并通过联合训练实现图像和文本的交互理解。该模型专为特定的下游任务设计,如图像描述、视觉问答、分割等,是研究和开发领域的重要工具。
GPT-4o,一款能够实时处理音频、视觉和文本的旗舰模型。
GPT-4o('o'代表'omni')是自然人机交互的重要一步,它可以接受任意组合的文本、音频、图像和视频输入,并生成任意组合的文本、音频和图像输出。它在音频输入响应上的速度极快,平均响应时间仅为320毫秒,与人类对话的响应时间相近。在非英语文本处理上取得了显著进步,同时在API上速度更快且成本降低了50%。GPT-4o在视觉和音频理解方面也比现有模型更出色。
专为数据标注、清洗和丰富设计的先进语言模型
Refuel LLM-2 是一款为数据标注、清洗和丰富而设计的先进语言模型。它在约30种数据标注任务的基准测试中超越了所有现有的最先进语言模型,包括GPT-4-Turbo、Claude-3-Opus和Gemini-1.5-Pro。Refuel LLM-2 旨在提高数据团队的工作效率,减少在数据清洗、规范化、标注等前期工作上的手动劳动,从而更快地实现数据的商业价值。
Aloe是一款专为医疗领域设计的高性能语言模型,提供先进的文本生成和对话能力。
Aloe是由HPAI开发的一款医疗领域的语言模型,基于Meta Llama 3 8B模型进行优化。它通过模型融合和先进的提示策略,达到了与其规模相匹配的最先进水平。Aloe在伦理和事实性指标上得分较高,这得益于红队和对齐工作的结合。该模型提供了医疗特定的风险评估,以促进这些系统的安全使用和部署。
MyCharacter.AI是一个基于AI协议构建的dApp,利用CharacterGPT V2多模态AI系统生成逼真、智能、交互式的AI角色,这些角色可在Polygon区块链上收藏。
MyCharacter.AI利用CharacterGPT V2多模态AI系统生成逼真、智能、交互式的AI角色。它的主要优点是生成的角色具有逼真的外观和智能的行为,可以与用户进行互动,并且可在Polygon区块链上收藏。MyCharacter.AI定位于提供一个独特的虚拟角色创作和收藏平台。
将您的图片变成游戏
Pic2Game AI是一个可以将您的照片转化成游戏场景和角色的工具。它使用AI技术来重新想象您的家庭、朋友、宠物、食物和风景,并以您喜爱的游戏中的艺术形式呈现。它的主要优点是可以将普通照片转化成富有创意和趣味性的游戏风格的图像。
Meme Fight Club是一个基于MemeCoins的在线游戏。
Meme Fight Club是一个在线游戏,使用MemeCoins参与比赛、购买道具和特殊技能。它提供了20个角色、特殊技能和多人在线竞技模式。
一个统一的文本到任意模态生成框架
Lumina-T2X是一个先进的文本到任意模态生成框架,它能够将文本描述转换为生动的图像、动态视频、详细的多视图3D图像和合成语音。该框架采用基于流的大型扩散变换器(Flag-DiT),支持高达7亿参数,并能扩展序列长度至128,000个标记。Lumina-T2X集成了图像、视频、3D对象的多视图和语音频谱图到一个时空潜在标记空间中,可以生成任何分辨率、宽高比和时长的输出。
AI图像描述生成器,准确提取图像关键元素并解读创作意图。
AI Image Description Generator 是一个基于ERNIE 3.5或GEMINI-PRO-1.5 API的图像描述生成器,能够准确提取图像中的关键元素,并解读其背后的创作意图。它支持多语言,集成了clerk.com用户管理平台,并使用Next.js构建全栈Web应用程序。该技术在科学研究、艺术创作以及图像与文本之间的互搜领域有广泛应用。
社交媒体管理平台
Social360是一个集合了人工智能的社交媒体管理平台,旨在提高用户的工作效率。它提供了一站式解决方案,包括文本到视频生成、社交媒体帖子创建和发布、内容调度等功能。Social360通过人工智能技术实现了自动化的社交媒体管理,帮助用户节省时间和精力。
允许用户直接在浏览器本地运行Phi-3模型的AI工具。
Phi-3 WebGPU是一款结合了Transformers.js和onnxruntime-web的AI模型,它利用WebGPU加速技术,提供超过20t/s的处理速度,并且所有数据处理在本地完成,确保用户隐私安全。尽管在中文回答上存在一些不足,但其在浏览器中提供的AI模型运行能力仍然值得关注。
一个由LLMs驱动的智能Siri,无需专用硬件即可使用。
Siri-Ultra是一个基于云的智能助手,可以在Cloudflare Workers上运行,并且可以与任何大型语言模型(LLM)配合使用。它利用了LLaMA 3模型,并且通过自定义函数调用来获取天气数据和在线搜索。这个项目允许用户通过Apple Shortcuts来使用Siri,从而消除了对专用硬件设备的需求。
利用SoundHound的独立语音AI平台,为您的业务提供独特优势。
SoundHound是一个独立的语音AI平台,它通过革命性的语音理解能力和简洁的响应方式,帮助企业提升客户体验、增强品牌价值,并创建深度个性化的体验。该平台支持25种语言,并能理解地区口音和语言变体。SoundHound AI已经得到像现代汽车、Snap Inc.、Pandora和高通等知名品牌的信任。
一款具有128k有效上下文长度的70B参数的大型语言模型。
Llama-3-Giraffe-70B-Instruct是Abacus.AI推出的一款大型语言模型,它通过PoSE和动态NTK插值的训练方法,具有更长的有效上下文长度,能够处理大量的文本数据。该模型在训练中使用了约1.5B个token,并且通过适配器转换技术,将Llama-3-70B-Base模型的适配器应用到Llama-3-Giraffe-70B-Instruct上,以提高模型的性能。
一个完全开源的大型语言模型,提供先进的自然语言处理能力。
MAP-NEO是一个完全开源的大型语言模型,它包括预训练数据、数据处理管道(Matrix)、预训练脚本和对齐代码。该模型从零开始训练,使用了4.5T的英文和中文token,展现出与LLaMA2 7B相当的性能。MAP-NEO在推理、数学和编码等具有挑战性的任务中表现出色,超越了同等规模的模型。为了研究目的,我们致力于实现LLM训练过程的完全透明度,因此我们全面发布了MAP-NEO,包括最终和中间检查点、自训练的分词器、预训练语料库以及高效稳定的优化预训练代码库。
使用AI技术,通过3张图片重塑你的个人风格。
Remix Yourself是一个基于AI技术的在线设计工具,由Omer Karisman创建,旨在通过零样本风格化肖像创建的扩散管道,为用户提供个性化的视觉重塑体验。该产品通过用户上传的3张图片,经过AI处理后,生成具有独特风格的肖像链接,不仅展示了AI在图像处理领域的应用,也为用户提供了一种新颖的自我表达方式。
快速了解HackerNews上火爆文章和网友评论的摘要服务
SuperTechFans是一个专注于提供HackerNews每日摘要的网站。它通过RPA方案自动获取Top Stories,并使用GPT技术自动生成文章和网友评论的摘要,帮助用户快速了解过去24小时内HackerNews上的热门话题和讨论焦点。
使用人工智能揭示艺术作品背后的细节、情感和含义。
AI说图解画是一款利用大模型语言能力理解图像元素及其关系的在线工具,它通过分析图像的色彩、形状、纹理等线索,为用户的艺术作品提供文字描述。该工具不仅为艺术家和设计师提供新的视角,也帮助普通用户深入理解图片内容,增强艺术欣赏能力。产品背景基于人工智能在图像识别和语言生成领域的最新进展,价格定位为1个积分进行一次图片解读,对于希望以低成本获得专业艺术分析的用户来说,是一个不错的选择。
Gemma 2B模型,支持10M序列长度,优化内存使用,适用于大规模语言模型应用。
Gemma 2B - 10M Context是一个大规模的语言模型,它通过创新的注意力机制优化,能够在内存使用低于32GB的情况下处理长达10M的序列。该模型采用了循环局部注意力技术,灵感来源于Transformer-XL论文,是处理大规模语言任务的强大工具。
一键生成惊艳的AI照片,仅需一张自拍照片即可即时创作出惊人的视觉效果
HyperBooth是一款AI图像生成器,只需点击一次即可开始创造艺术性的AI图像。在30秒内创建艺术性的AI图像,节省时间和金钱。每天可创建7000张高质量的AI图像,共有200种多样化的风格可供选择。
Autodesk 推出的实验性生成式 AI 模型,用于 3D 形状的创建。
Project Bernini 是 Autodesk 研究项目,旨在开发用于设计和制造行业的生成式人工智能。该模型能够从多种输入(包括 2D 图像、文本、体素和点云)快速生成功能性的 3D 形状。Bernini 模型专为专业几何工作流程设计,可以生成给定输入的多个功能性变体。Autodesk 致力于创建可以用于建筑、产品设计、娱乐等多个用例的生成模型,专注于生成功能性 3D 结构,因为这些模型的输出必须在现实世界中工作,以满足设计师的意图。
自动生成数据可视化、生成信息图表格
GPT Spreadsheets Visualization是一个工具,使用大型语言模型(如ChatGPT)自动探索数据、生成可视化和信息图表格。它可以与任何编程语言和可视化库一起使用,例如matplotlib、seaborn、altair、d3等,并与多个大型语言模型提供商(ChatGPT、PaLM、Cohere、Huggingface等)一起使用。它包括四个模块:摘要生成器、目标探索器、可视化生成器和信息图表格生成器。GPT Spreadsheets Visualization利用最先进的大型语言模型的语言建模和代码编写能力,实现了数据摘要、目标生成、可视化生成、信息图表格生成以及对现有可视化的操作、可视化解释、自动修复、推荐等核心自动化可视化功能。
© 2024 AIbase 备案号:闽ICP备2023012347号-1