C

Camembert Base Legacy

由 almanach 开发
CamemBERT是基于RoBERTa的法语语言模型,该版本使用维基百科4GB文本训练
下载量 24.98k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于RoBERTa架构的法语预训练语言模型,适用于各种法语自然语言处理任务

模型特点

法语优化
专门针对法语语言特点进行优化的预训练模型
多版本选择
提供6种不同版本,参数规模和数据源各不相同
基于RoBERTa架构
采用经过验证的RoBERTa架构,性能稳定可靠

模型能力

文本特征提取
掩码语言预测
上下文嵌入生成

使用案例

自然语言处理
文本补全
预测被掩码遮盖的文本内容
示例中成功预测'chèvre'为最可能的补全词
语义分析
提取文本的上下文嵌入特征
可获取各层次的语义表示