R

Roberta Base Turkish Uncased

由 burakaytan 开发
基于土耳其语预训练的RoBERTa基础模型,使用38GB土耳其语语料训练
下载量 57
发布时间 : 4/20/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于土耳其语的RoBERTa基础模型,主要用于土耳其语文本的掩码语言建模任务,支持土耳其语文本理解和生成。

模型特点

大规模土耳其语预训练
使用38GB土耳其语语料(包含维基百科、OSCAR语料库和新闻网站数据)进行训练
高性能硬件训练
在配备Intel Xeon Gold处理器和Tesla V100显卡的高性能硬件环境下完成训练
优化的土耳其语处理
专门针对土耳其语特点进行优化,能更好地处理土耳其语文本

模型能力

土耳其语文本理解
掩码语言建模
文本补全
语义分析

使用案例

文本补全
完形填空应用
预测句子中被掩码的词语
能准确预测土耳其语句子中被掩码的关键词语
语义分析
文本相似度计算
计算土耳其语文本之间的语义相似度