tf-xlm-roberta-large开源跨语言编码器 - 基于海量数据训练，跨语言应用超出色

首页

Tf Xlm Roberta Large

由 jplu 开发

XLM-RoBERTa是一个大规模跨语言句子编码器，基于100种语言的2.5TB数据训练，在多项跨语言基准测试中表现优异。

大型语言模型

Transformers

#跨语言理解 #大规模预训练 #多语言编码

下载量 236

发布时间 : 3/2/2022

模型简介

TensorFlow实现的XLM-RoBERTa模型，支持跨语言文本理解和处理任务。

模型特点

跨语言能力

支持100种语言的文本理解和处理

大规模预训练

基于2.5TB的多语言数据进行训练

TensorFlow实现

提供TensorFlow版本的模型权重

模型能力

跨语言文本理解

句子编码

文本特征提取

使用案例

自然语言处理

跨语言文本分类

对不同语言的文本进行分类

在多项跨语言基准测试中取得优异表现

多语言语义搜索

构建支持多语言的语义搜索引擎

属性	详情
模型类型	`jplu/tf-xlm-roberta-base`、`jplu/tf-xlm-roberta-large`
模型权重链接	`jplu/tf-xlm-roberta-base`：`config.json` • `tf_model.h5` `jplu/tf-xlm-roberta-large`：`config.json` • `tf_model.h5`

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Tf Xlm Roberta Large

模型简介

模型特点

模型能力

使用案例

🚀 Tensorflow XLM-RoBERTa

🚀 快速开始

✨ 主要特性

📦 安装指南

💻 使用示例

基础用法

高级用法

📚 详细文档

模型权重

Huggingface模型中心

🔧 技术细节

📄 许可证

🙏 致谢