一个针对俄语电子商务搜索查询优化的句子相似度模型,专门用于区分产品搜索查询
下载量 15
发布时间 : 9/28/2024
模型简介
该模型基于Transformer架构,针对俄语电子商务领域的短文本搜索查询进行了优化,能够准确计算查询之间的语义相似度,帮助区分不同产品
模型特点
俄语电子商务优化
专门针对俄语电子商务搜索查询进行训练和优化
大规模训练数据
使用包含2.69亿条俄语搜索查询的语料库进行训练
高精度验证
验证数据集包含362,000条人工标注的实例
短文本优化
特别优化了短文本搜索查询的语义理解
模型能力
计算句子相似度
电子商务产品区分
俄语语义理解
短文本编码
使用案例
电子商务搜索
产品查询匹配
识别不同表述但指向相同产品的搜索查询
cos( SBE("apple 16 蓝色 pro max 256"), SBE("iphone 16 蓝色 pro max 256") ) = 0.96
产品版本区分
区分不同版本的产品查询
cos( SBE("iphone 15 pro max"), SBE("iphone 16 pro max") ) = 0.85
多语言匹配
跨语言产品匹配
识别不同语言表述的相同产品
cos( SBE("iphone 15 pro max"), SBE("苹果15 pro max") ) = 0.98
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文