Jina Embeddings V2 Base

Jina Embeddings V2 Base

Jina Embeddings V2 Base是一种英文文本嵌入模型,支持8192个序列长度。它基于Bert架构(JinaBert),支持ALiBi的对称双向变体,以允许更长的序列长度。该模型在C4数据集上进行了预训练,并在Jina AI的超过4亿个句子对和负样本的集合上进行了进一步训练。该模型适用于处理长文档的多种用例,包括长文档检索、语义文本相似度、文本重排序、推荐、RAG和LLM基于生成式搜索等。模型具有137百万个参数,推荐在单个GPU上进行推理。

需求人群:

"适用于自然语言处理任务,如文本相似度计算、文本检索、推荐系统等"

使用场景示例:

计算两个句子的相似度

进行文本检索

构建推荐系统

产品特色:

支持8192个序列长度

适用于处理长文档

支持语义文本相似度计算

支持文本重排序

支持推荐系统

支持生成式搜索

浏览量:129

打开站点

网站流量情况

最新流量情况

月访问量

25296.55k

平均访问时长

00:04:45

每次访问页数

5.83

跳出率

43.31%

流量来源

直接访问

48.39%

自然搜索

35.85%

邮件

0.03%

外链引荐

12.76%

社交媒体

2.96%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

13.77%

印度

8.48%

日本

3.85%

俄罗斯

4.86%

美国

17.58%

类似产品

新型嵌入模型,性能更强,价格更低。

OpenAI Embedding Models是一系列新型嵌入模型,包括两个全新的嵌入模型和更新的GPT-4 Turbo预览模型、GPT-3.5 Turbo模型以及文本内容审核模型。默认情况下,发送到OpenAI API的数据不会用于训练或改进OpenAI模型。新的嵌入模型具有更低的定价,包括更小、高效的text-embedding-3-small模型和更大、更强大的text-embedding-3-large模型。嵌入是表示自然语言或代码等内容中概念的一系列数字。嵌入使得机器学习模型和其他算法更容易理解内容之间的关系,并执行聚类或检索等任务。它们为ChatGPT和Assistants API中的知识检索以及许多检索增强生成(RAG)开发工具提供支持。text-embedding-3-small是新的高效嵌入模型,相比其前身text-embedding-ada-002模型,性能更强,MIRACL的平均分数从31.4%提升至44.0%,而在英语任务(MTEB)的平均分数从61.0%提升至62.3%。text-embedding-3-small的定价也比之前的text-embedding-ada-002模型降低了5倍,从每千个标记的价格$0.0001降至$0.00002。text-embedding-3-large是新一代更大的嵌入模型,能够创建高达3072维的嵌入。性能更强,MIRACL的平均分数从31.4%提升至54.9%,而在MTEB的平均分数从61.0%提升至64.6%。text-embedding-3-large的定价为$0.00013/千个标记。此外,我们还支持缩短嵌入的原生功能,使得开发者可以在性能和成本之间进行权衡。

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图