R

Reasoning Bert Ccnews

由 bwang0911 开发
这是一个基于BERT微调的句子转换器模型,用于将句子和段落映射到768维向量空间,支持语义文本相似性、语义搜索等任务。
下载量 13
发布时间 : 3/28/2025
模型介绍
内容详情
替代品

模型简介

该模型基于google-bert/bert-base-uncased微调,训练数据集为reason_unfiltered,主要用于语义文本相似性计算、信息检索等自然语言处理任务。

模型特点

高质量句子嵌入
将句子和段落映射到768维密集向量空间,保留语义信息
推理引导排序损失训练
使用推理引导排序损失函数进行训练,优化语义相似性判断
多任务性能优化
在多个信息检索任务上表现良好,包括nfcorpus、trec-covid等数据集

模型能力

语义文本相似性计算
语义搜索
释义挖掘
文本分类
聚类分析

使用案例

信息检索
文档相似性搜索
在大规模文档集合中查找语义相似的文档
在nfcorpus数据集上达到0.5975的准确率@10
问答系统
匹配问题与候选答案的语义相似度
在quora数据集上达到0.7256的准确率@1
新闻分析
新闻内容相似性分析
分析不同新闻文章之间的语义关联度
基于CCNews数据集训练,适合新闻文本处理