D

Data2vec Text Base

由 facebook 开发
采用data2vec目标对英语语言进行预训练的通用自监督学习框架,通过统一方法处理不同模态任务
下载量 1,796
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于自蒸馏架构的Transformer模型,通过预测完整输入数据的潜在表征实现跨模态自监督学习,适用于自然语言理解任务

模型特点

跨模态统一框架
首次实现语音/视觉/文本的统一自监督学习方法,使用相同架构和目标函数
上下文表征预测
不同于传统预测局部标记的方法,直接学习预测包含全局信息的潜在表征
自蒸馏架构
通过遮蔽输入视图预测完整输入的潜在表征,实现知识蒸馏

模型能力

文本表征学习
序列分类
标记分类
问答系统

使用案例

文本理解
情感分析
对整句情感倾向进行分类
在GLUE基准测试中具有竞争力
命名实体识别
识别文本中的人名/地名/机构名等实体
问答系统
阅读理解
根据给定文章回答相关问题