R

Roberta TR Medium Wp 44k

由 ctoraman 开发
基于土耳其语的RoBERTa模型,采用掩码语言建模目标预训练,不区分大小写,适用于土耳其语文本处理任务。
下载量 84
发布时间 : 3/9/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个针对土耳其语优化的RoBERTa变体,使用WordPiece分词器,词汇表大小为44.5k。模型架构类似于bert-medium,包含8层和8个注意力头,隐藏层大小为512。

模型特点

土耳其语优化
专门针对土耳其语进行预训练和优化
WordPiece分词
使用44.5k词汇表的WordPiece分词器
中等规模架构
采用8层、8个注意力头的轻量级架构,隐藏层大小为512
无大小写区分
模型不区分文本大小写,适合处理不同大小写形式的土耳其语文本

模型能力

土耳其语文本理解
掩码语言建模
序列分类

使用案例

自然语言处理
土耳其语文本分类
可用于土耳其语文本的情感分析、主题分类等任务
土耳其语语言理解
适用于需要理解土耳其语文本的各种应用场景