M

Msmarco T5 Small V1

由 doc2query 开发
基于T5的doc2query模型,用于文档扩展和训练数据生成
下载量 23
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于T5架构,能够为输入文本生成相关查询,主要用于文档扩展和领域特定训练数据生成。

模型特点

文档扩展
可为段落生成20-40个相关查询,帮助缩小词汇搜索的词汇差距
训练数据生成
可用于生成(查询,文本)对,用于训练强大的密集嵌入模型
基于T5架构
使用google/t5-v1_1-small模型微调,具有高效的文本生成能力

模型能力

文本生成
查询生成
文档扩展
训练数据生成

使用案例

信息检索
搜索引擎优化
为文档生成相关查询并索引,提升传统BM25搜索引擎的效果
在BEIR基准测试中表现良好
机器学习
嵌入模型训练
生成(查询,文本)对作为训练数据,用于训练密集嵌入模型