license: bigscience-bloom-rail-1.0
datasets:
- xnli
language:
- fr
- en
pipeline_tag: zero-shot-classification
base_model:
- cmarkea/bloomz-3b-dpo-chat
模型介绍
我们推出基于Bloomz-3b-chat-dpo基础模型微调的Bloomz-3b-NLI模型。该模型采用语言无关方式训练于自然语言推理(NLI)任务。NLI任务的核心是判定假设句与前提句之间的语义关系,通常表现为句子对的逻辑关联。
模型目标是预测文本蕴含关系(句子A是否蕴含/矛盾/中立于句子B?),属于三分类任务(给定两个句子,预测三个标签之一)。若将句子A称为前提,句子B称为假设,则建模目标可表示为:
$$P(premise=c\in{contradiction, entailment, neutral}\vert hypothesis)$$
语言无关特性
需特别说明的是,假设句与前提句会随机选用英语或法语,每种语言组合的出现概率均为25%。
性能表现
类别 |
精确率 (%) |
F1分数 (%) |
样本量 |
总体 |
81.96 |
81.07 |
5,010 |
矛盾类 |
81.80 |
84.04 |
1,670 |
蕴含类 |
84.82 |
81.96 |
1,670 |
中立类 |
76.85 |
77.20 |
1,670 |
基准测试
法语前提与假设的测试表现:
法语假设与英语前提的跨语言测试表现:
零样本分类
训练此类模型的核心价值在于其零样本分类能力。这意味着模型无需特定训练即可对任意文本进行任意标签分类。相较于BERT、RoBERTa或CamemBERT等模型,Bloomz-3b-NLI大语言模型的独特优势在于能够建模并提取更复杂、更长文本结构中的信息。
零样本分类任务可公式化为:
$$P(hypothesis=i\in\mathcal{C}|premise)=\frac{e^{P(premise=entailment\vert hypothesis=i)}}{\sum_{j\in\mathcal{C}}e^{P(premise=entailment\vert hypothesis=j)}}$$
其中i代表由模板(如"该文本关于{}。")和候选标签("电影"、"政治"等)构成的假设句,假设集即{"该文本关于电影。", "该文本关于政治。", ...}。我们将通过这些假设句来衡量待分类前提句(即目标文本)的匹配度。
性能评估
基于法国影评网站Allociné的情感分析评估,数据集包含20,000条标注为积极/消极的影评。我们使用假设模板"Ce commentaire est {}."和候选类别"positif"/"negatif"。
使用指南
from transformers import pipeline
classifier = pipeline(
task='zero-shot-classification',
model="cmarkea/bloomz-3b-nli"
)
result = classifier (
sequences="昆汀·塔伦蒂诺极具影迷风格的导演特色体现在后现代非线性叙事、"
"充满流行文化引用的精妙对白,以及受剥削电影、功夫片和意式西部片启发,"
"兼具高度美学与极端暴力的场景设计中。",
candidate_labels="电影, 科技, 文学, 政治",
hypothesis_template="该文本关于{}。"
)
result
{"labels": ["电影",
"文学",
"科技",
"政治"],
"scores": [0.8745610117912292,
0.10403601825237274,
0.014962797053158283,
0.0064402492716908455]}
result = classifier (
sequences="Quentin Tarantino's very cinephile style is "
"recognized, among other things, by his postmodern and "
"non-linear narration, his elaborate dialogues often "
"peppered with references to popular culture, and his "
"highly aesthetic but extremely violent scenes, inspired by "
"exploitation films, martial arts or spaghetti western.",
candidate_labels="电影, 科技, 文学, 政治",
hypothesis_template="该文本关于{}。"
)
result
{"labels": ["电影",
"文学",
"科技",
"政治"],
"scores": [0.9314399361610413,
0.04960821941494942,
0.013468802906572819,
0.005483036395162344]}
引用说明
@online{DeBloomzNLI,
AUTHOR = {Cyrile Delestre},
URL = {https://huggingface.co/cmarkea/bloomz-3b-nli},
YEAR = {2024},
KEYWORDS = {自然语言处理 ; Transformer架构 ; 大语言模型 ; Bloomz},
}