C

Canine S

由 google 开发
CANINE-s是一种高效的无分词多语言预训练模型,直接在字符级别操作,支持104种语言。
下载量 46.51k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

CANINE-s是一种基于Transformer架构的预训练模型,无需显式分词器,直接在Unicode字符级别处理文本。适用于多种自然语言处理任务。

模型特点

无分词处理
直接在字符级别操作,无需显式分词器,简化输入处理流程。
多语言支持
在104种语言上预训练,具有广泛的语言适应性。
子词损失预训练
采用子词损失训练,在字符输入基础上预测子词标记,形成软归纳偏置。

模型能力

多语言文本理解
掩码语言建模
下一句预测
序列分类
标记分类
问答任务

使用案例

自然语言处理
文本分类
对多语言文本进行分类任务
命名实体识别
识别文本中的命名实体