I

Icd 10 Sentence Transformer 128 Dim Model

由 Atgenomix 开发
基于BioBERT的句子嵌入模型,在多个NLI数据集上训练,适用于句子相似度计算和语义搜索任务
下载量 1,292
发布时间 : 11/22/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个基于sentence-transformers的句子嵌入模型,能将句子和段落映射到768维的密集向量空间,适用于聚类或语义搜索等任务。模型在SNLI、MNLI、SCINLI、SCITAIL、MEDNLI和STSB数据集上进行了训练,以提供稳健的句子嵌入。

模型特点

多数据集训练
在SNLI、MNLI、SCINLI、SCITAIL、MEDNLI和STSB等多个数据集上训练,增强了模型的泛化能力
生物医学领域优化
基于BioBERT架构,特别适合处理生物医学领域的文本
稳健的句子嵌入
能生成768维的密集向量表示,捕捉句子的语义信息

模型能力

句子嵌入生成
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
医学文献检索
在生物医学文献数据库中进行语义搜索
文本分析
医学文本聚类
对医学研究论文或临床报告进行主题聚类