S

Simcse Model M Bert Thai Cased

由 mrp 开发
基于mBERT的泰语句子嵌入模型,使用SimCSE方法在泰语维基百科数据上训练,可将文本映射为768维向量
下载量 1,637
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用对比学习框架(SimCSE)微调mBERT,专门针对泰语文本生成语义嵌入向量,适用于句子相似度计算、语义搜索等任务

模型特点

泰语优化
专门针对泰语特性优化的句子嵌入模型
SimCSE框架
采用对比学习框架提升句子表示质量
高维语义空间
生成768维的密集向量表示

模型能力

句子向量化
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
泰语相似问题匹配
在问答系统中匹配语义相似的泰语问题
提高问答系统准确率
内容推荐
泰语新闻推荐
基于内容相似度的新闻文章推荐
提升用户阅读体验