X

Xlm Roberta Base Language Detection

由 papluca 开发
基于XLM-RoBERTa的多语言检测模型,支持20种语言的文本分类
下载量 2.7M
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于XLM-RoBERTa在语言识别数据集上微调后的版本,用于识别文本的语言类别。

模型特点

高准确率
在测试集上达到99.6%的平均准确率
多语言支持
支持20种常见语言的检测
基于XLM-RoBERTa
利用强大的跨语言预训练模型作为基础

模型能力

文本语言识别
多语言文本分类

使用案例

内容分类
多语言网站内容分类
自动识别用户提交内容的语言类别
准确率高达99.6%
数据预处理
多语言数据集预处理
在NLP任务前自动识别文本语言
提高后续处理效率