G

Gte Base Ko

由 scottsuk0306 开发
这是一个基于阿里巴巴NLP/gte-multilingual-base模型,在韩语三元组数据集上微调的sentence-transformers模型,用于语义文本相似度等任务。
下载量 18
发布时间 : 11/17/2024
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射到768维的密集向量空间,可用于语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务。

模型特点

多语言基础模型
基于阿里巴巴NLP/gte-multilingual-base模型,具有良好的多语言处理能力
韩语优化
在韩语三元组数据集上进行了微调,特别适合韩语文本处理
高准确率
在开发集上达到0.9855的余弦准确率
长文本支持
最大序列长度达8192个token,适合处理长文本

模型能力

语义文本相似度计算
语义搜索
文本特征提取
文本聚类
文本分类

使用案例

信息检索
相似文档检索
根据查询文本查找语义相似的文档
高准确率的相似度匹配
内容推荐
相关内容推荐
根据用户浏览内容推荐语义相似的其他内容
提升用户粘性和内容发现效率