F

Fermi 1024

由 atomic-canyon 开发
面向核能领域优化的稀疏检索模型,将查询和文档编码为高维稀疏向量,提升核能专业术语的处理效率
下载量 2,502
发布时间 : 9/4/2024

模型简介

专为核能应用设计的稀疏检索模型,采用核能领域专用分词器构建词汇表和稀疏嵌入表示,优化了如'NRC'等专业术语的处理

模型特点

核能领域优化
使用核能领域专用分词器,将专业术语作为独立词元处理,提升准确性和效率
高效稀疏表示
生成高维稀疏向量,非零维度对应词汇表中的重要词元,显著降低计算和存储需求
长上下文支持
支持1024长度的上下文窗口,减少所需嵌入数量,降低计算成本

模型能力

核能领域文档检索
专业术语识别
高效向量编码
大规模文档处理

使用案例

核能信息检索
核能法规检索
快速检索NRC等核能监管机构的相关法规文档
在FermiBench上达到0.72 NDCG@10
技术文档搜索
高效搜索核电站技术文档中的特定内容
比通用模型减少50%计算成本
AIbase
智启未来,您的人工智能解决方案智库
简体中文