D

Distilcamembert Base

由 cmarkea 开发
DistilCamemBERT是法语CamemBERT模型的蒸馏版本,通过知识蒸馏技术显著降低模型复杂度,同时保持性能。
下载量 15.79k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是法语RoBERTa模型CamemBERT的蒸馏版本,适用于多种自然语言处理任务,如文本分类、语义匹配等。

模型特点

知识蒸馏技术
通过蒸馏技术显著降低模型复杂度,同时保持性能,损失函数包括蒸馏损失、余弦损失和MLM损失。
高性能
在多个法语NLP任务上表现优异,如文本分类F1分数达83%,命名实体识别F1分数达98%。
轻量化
相比原始CamemBERT模型,蒸馏版模型更轻量,适合资源有限的环境。

模型能力

文本分类
语义匹配
自然语言推理
命名实体识别
掩码填充

使用案例

文本处理
文本分类
对法语文本进行分类,如情感分析、主题分类等。
在FLUE数据集上F1分数达83%。
语义匹配
判断两个法语文本的语义相似性。
在FLUE数据集上F1分数达77%。
信息提取
命名实体识别
从法语文本中识别命名实体,如人名、地名等。
在wikiner_fr数据集上F1分数达98%。