InfoXLM-large开源跨语言预训练框架 - 免费部署提升跨语言表示学习效果

首页

Infoxlm Large

由 microsoft 开发

InfoXLM 是一个基于信息理论的跨语言预训练框架，旨在通过最大化不同语言之间的互信息来提升跨语言表示学习的效果。

大型语言模型

Transformers

#跨语言预训练 #信息理论优化 #多语言理解

下载量 1.1M

发布时间 : 3/2/2022

模型简介

InfoXLM 是一种跨语言预训练模型，通过信息理论的方法优化多语言表示，支持多种跨语言任务，如机器翻译、跨语言文本分类等。

模型特点

基于信息理论的预训练

通过最大化不同语言之间的互信息来优化跨语言表示学习。

跨语言能力

支持多种跨语言任务，如机器翻译和文本分类。

高效预训练

利用信息理论方法减少预训练过程中的冗余信息，提升模型效率。

模型能力

跨语言文本表示

机器翻译

文本分类

跨语言信息检索

使用案例

自然语言处理

跨语言机器翻译

将一种语言的文本翻译成另一种语言，利用 InfoXLM 的跨语言表示能力提升翻译质量。

跨语言文本分类

对多种语言的文本进行分类，适用于多语言内容管理场景。

文件	MD5 值
config.json	05b95b7d977450b364f8ea3269391953
pytorch_model.bin	c19438359fed6d36b0c1bbb107929579
sentencepiece.bpe.model	bf25eb5120ad92ef5c7d8596b5dc4046
tokenizer.json	eedbd60a7268b9fc45981b849664f747

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Infoxlm Large

模型简介

模型特点

模型能力

使用案例

🚀 InfoXLM

📚 详细文档

项目资源

MD5 信息

BibTeX 引用