A

All T5 Base V1

由 doc2query 开发
基于T5的doc2query模型,用于文档扩展和训练数据生成
下载量 171
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于T5架构,主要用于文档扩展和领域特定训练数据生成。它能够为输入文本生成相关查询,帮助改进搜索引擎效果或生成训练数据。

模型特点

文档扩展
可为段落生成20-40个相关查询,帮助改进搜索引擎效果
训练数据生成
可用于生成领域特定的训练数据,训练高效的稠密嵌入模型
多领域适应性
训练数据涵盖Reddit、StackExchange、亚马逊评论等多种领域

模型能力

文本生成
查询生成
文档扩展
训练数据生成

使用案例

搜索引擎优化
BM25索引增强
将生成的查询与原始文档一起索引,提升搜索引擎效果
在BEIR评估中证明能显著提升搜索效果
机器学习训练
嵌入模型训练
生成(查询,文本)配对用于训练稠密嵌入模型
可用于训练高效的语义搜索模型