P

Physbert Cased

由 thellert 开发
PhysBERT是专为物理学设计的文本嵌入模型,基于120万篇物理论文训练,在物理学特定任务上表现优于通用模型。
下载量 2,496
发布时间 : 8/19/2024
模型介绍
内容详情
替代品

模型简介

基于BERT架构的物理学文本嵌入模型,采用SimCSE方法微调,优化物理学文献的信息检索、引文分类和聚类效果。

模型特点

物理学领域优化
专门针对物理学文献训练,在物理学特定任务上表现优于通用模型。
大规模训练数据
基于120万篇经过科学准确性校验的arXiv物理学出版物训练。
SimCSE微调
采用SimCSE方法进行微调,优化句子嵌入生成效果。

模型能力

物理学文本嵌入
信息检索
引文分类
文本聚类
科学文献分析

使用案例

学术研究
物理学文献检索
高效检索相关物理学文献
比通用模型具有更高的相关性和准确性
引文分类
对物理学论文引文进行分类
领域特定任务表现更优
知识管理
物理学文献聚类
对大量物理学文献进行自动聚类
便于知识组织和发现