L

Lodestone Base 4096 V1

由 Hum-Works 开发
由Hum开发的sentence-transformers模型,支持4096 tokens长文本嵌入,适用于语义搜索和聚类任务
下载量 132
发布时间 : 8/25/2023
模型介绍
内容详情
替代品

模型简介

基于Transformer架构创新的长文本编码器,融合FlashAttention、ALiBi和GLU技术,可将句子和段落映射到768维向量空间

模型特点

超长上下文支持
通过ALiBi技术扩展至4096 tokens输入长度,适合处理长文档
高效注意力机制
集成FlashAttention优化计算效率,支持自动调用Triton高性能实现
轻量级设计
可在GPU/CPU上运行,平衡性能与资源消耗
多源训练数据
基于15亿句对的多领域数据(学术、问答、社区讨论等)微调

模型能力

文本向量化
语义相似度计算
信息检索
文本聚类

使用案例

知识管理
学术文献检索
基于S2ORC数据训练的嵌入可用于论文推荐系统
社区内容处理
问答对匹配
识别StackExchange等平台上的相似问题