W

Wangchanberta Base Wiki Newmm

由 airesearch 开发
基于泰语维基百科预训练的RoBERTa BASE模型,适用于泰语文本处理任务
下载量 115
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于泰语维基百科语料库预训练的RoBERTa BASE架构模型,主要用于泰语文本的掩码语言建模任务,也可用于文本分类和标记分类任务。

模型特点

泰语优化
专门针对泰语文本进行预训练和优化
多任务支持
支持多种下游任务,包括文本分类和命名实体识别
大规模预训练
基于泰语维基百科大规模语料库进行预训练

模型能力

掩码语言建模
文本分类
命名实体识别
词性标注

使用案例

情感分析
社交媒体情感分析
分析社交媒体帖子和推文的情感倾向
支持4种情感分类(积极、中性、消极、提问)
评论分析
用户评论星级预测
预测用户评论的星级评分(1-5星)
新闻分类
新闻主题分类
对新闻文章进行多标签主题分类
支持12种主题标签
信息提取
命名实体识别
从文本中识别命名实体
支持13种命名实体类型