M

Msmarco Portuguese Mt5 Base V1

由 doc2query 开发
基于mT5的doc2query模型,用于文档扩展和领域特定训练数据生成
下载量 44
发布时间 : 4/29/2022
模型介绍
内容详情
替代品

模型简介

该模型基于mT5架构,可为段落生成20-40个查询,用于文档扩展或生成嵌入模型的训练数据。

模型特点

文档扩展
可为段落生成20-40个查询,用于增强搜索引擎索引效果
训练数据生成
可生成(查询,文本)对用于训练高性能稠密嵌入模型
多语言支持
基于mT5架构,支持葡萄牙语处理

模型能力

文本生成
查询生成
文档扩展

使用案例

信息检索
搜索引擎增强
将生成的查询与原始段落共同索引,提高BM25检索效果
在BEIR论文中验证了BM25+docT5query作为强大搜索引擎的效果
机器学习训练
嵌入模型训练
为未标注文本集生成(查询,文本)对,用于训练稠密嵌入模型
GPL论文和SBERT.net上的示例展示了其有效性