语言: 中文
缩略图:
许可证: MIT
标签:
- 问答系统
- mobilebert
数据集:
- squad_v2
评估指标:
- squad_v2
小部件示例:
- 问题: "亚马逊雨林在英语中还有哪个别称?"
上下文: "亚马逊雨林(葡萄牙语:Floresta Amazônica或Amazônia;西班牙语:Selva Amazónica, Amazonía或通常称Amazonia;法语:Forêt amazonienne;荷兰语:Amazoneregenwoud),在英语中也被称为Amazonia或亚马逊丛林,是一片覆盖南美洲亚马逊盆地大部分地区的湿润阔叶林。该盆地面积达7,000,000平方公里(2,700,000平方英里),其中5,500,000平方公里(2,100,000平方英里)被雨林覆盖。这一区域涵盖九个国家的领土。森林主要分布在巴西境内,占雨林总面积的60%,其次是秘鲁占13%,哥伦比亚占10%,其余少量分布在委内瑞拉、厄瓜多尔、玻利维亚、圭亚那、苏里南和法属圭亚那。四个国家的州或省名称中包含'Amazonas'。亚马逊雨林占全球现存雨林面积的一半以上,是世界上最大且生物多样性最丰富的热带雨林带,估计拥有3900亿棵树木,分属16,000个物种。"
- 问题: "该盆地内有多少平方公里的雨林覆盖面积?"
上下文: "亚马逊雨林(葡萄牙语:Floresta Amazônica或Amazônia;西班牙语:Selva Amazónica, Amazonía或通常称Amazonia;法语:Forêt amazonienne;荷兰语:Amazoneregenwoud),在英语中也被称为Amazonia或亚马逊丛林,是一片覆盖南美洲亚马逊盆地大部分地区的湿润阔叶林。该盆地面积达7,000,000平方公里(2,700,000平方英里),其中5,500,000平方公里(2,100,000平方英里)被雨林覆盖。这一区域涵盖九个国家的领土。森林主要分布在巴西境内,占雨林总面积的60%,其次是秘鲁占13%,哥伦比亚占10%,其余少量分布在委内瑞拉、厄瓜多尔、玻利维亚、圭亚那、苏里南和法属圭亚那。四个国家的州或省名称中包含'Amazonas'。亚马逊雨林占全球现存雨林面积的一半以上,是世界上最大且生物多样性最丰富的热带雨林带,估计拥有3900亿棵树木,分属16,000个物种。"
基于SQuAD v2微调的MobileBERT模型
MobileBERT是BERT_LARGE的轻量化版本,采用瓶颈结构设计,并精细平衡了自注意力机制与前馈网络的关系。
本模型基于HuggingFace的google/mobilebert-uncased
检查点,在SQuAD2.0数据集上微调而成。
详细参数
数据集 |
划分 |
样本数 |
SQuAD2.0 |
训练集 |
13万 |
SQuAD2.0 |
验证集 |
1.23万 |
微调配置
总耗时约3.5小时。
性能指标
模型大小: 95MB
指标 |
本模型结果 |
原论文结果(表5) |
EM分数 |
75.2 |
76.2 |
F1分数 |
78.8 |
79.2 |
注:上述结果未进行超参数调优。
使用示例
from transformers import pipeline
qa_pipeline = pipeline(
"question-answering",
model="csarron/mobilebert-uncased-squad-v2",
tokenizer="csarron/mobilebert-uncased-squad-v2"
)
predictions = qa_pipeline({
'context': "比赛于2016年2月7日在加利福尼亚州圣克拉拉市旧金山湾区的李维斯体育场举行。",
'question': "比赛是在哪一天举行的?"
})
print(predictions)
由Qingqing Cao创建 | GitHub | Twitter
于纽约倾情制作 ❤️