R

Rhetoribert

由 KaiserML 开发
该模型是基于nomic-ai/nomic-embed-text-v1.5在科学文献数据集上微调的句子转换器,专门用于分析学术文本的修辞功能,如总结结果、表达局限性等。
下载量 70
发布时间 : 1/24/2025
模型介绍
内容详情
替代品

模型简介

将学术文本中的句子映射到768维向量空间,基于其修辞功能进行编码,适用于功能性文本相似度、局限性分析、修辞功能分类等任务。

模型特点

长文本处理能力
支持最大8192标记的序列长度,适合处理学术文献中的长段落
修辞功能编码
专门针对学术文本的修辞功能(如研究目的陈述、方法描述等)进行优化
多维度相似度
采用MatryoshkaLoss训练,支持从64到768维的多粒度相似度计算
高效检索
在科学文献检索任务上达到94.15%的nDCG@10指标

模型能力

学术文本嵌入生成
功能性文本相似度计算
科学文献检索
修辞功能分类
学术文本聚类分析

使用案例

学术研究
文献检索系统
基于修辞功能匹配相关研究文献
在测试集上达到90%的准确率@1
论文写作辅助
识别与当前写作内容修辞功能相似的参考句子
教育技术
学术写作评估
分析学生论文中各部分的修辞功能完整性