W

Wangchanberta Base Att Spm Uncased

由 airesearch 开发
基于78.5GB泰语文本预训练的RoBERTa BASE模型,适用于掩码语言建模及文本分类任务
下载量 34.38k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于RoBERTa架构的泰语预训练模型,主要用于掩码语言建模预测和文本分类任务。支持多种下游NLP应用。

模型特点

大规模泰语预训练
基于78.5GB泰语文本数据训练,具有优秀的泰语理解能力
多任务支持
支持掩码语言建模、文本分类和序列标记等多种NLP任务
RoBERTa优化架构
采用改进的RoBERTa架构,具有更强的上下文理解能力

模型能力

泰语文本理解
掩码语言预测
情感分析
文本分类
序列标记

使用案例

社交媒体分析
情感分析
分析泰语社交媒体帖子的情感倾向
可分类为积极/中立/消极/提问四类情感
评论分析
评论星级预测
预测用户评论的星级(1-5星)
在Wongnai评论数据集上表现良好
新闻分类
多标签主题分类
对泰语新闻进行12类主题分类
在Prachathai67k数据集上实现多标签分类