S

Simcse Model M Bert Thai Cased

由 kornwtp 开发
基于mBERT的SimCSE模型,专门针对泰语进行训练,用于生成句子和段落的768维向量表示
下载量 25
发布时间 : 12/22/2023
模型介绍
内容详情
替代品

模型简介

该模型采用SimCSE方法,以mBERT为基础模型,利用泰语维基百科数据进行训练,适用于句子相似度计算、聚类和语义搜索等任务

模型特点

泰语优化
专门针对泰语进行训练,在泰语文本处理任务中表现优异
SimCSE训练方法
采用对比学习框架SimCSE进行训练,提升了句子表示的区分能力
多语言基础
基于mBERT架构,保留了处理多语言文本的能力

模型能力

句子向量化
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
泰语文档相似性搜索
在泰语文档库中查找语义相似的文档
文本分析
泰语文本聚类
对大量泰语文本进行自动分类和分组