O

Olmo2 8B SuperBPE T160k

由 UW 开发
80亿参数模型,采用创新的SuperBPE分词器,结合子词和超词标记,推理效率比传统BPE模型高30%。
下载量 28
发布时间 : 3/19/2025
模型介绍
内容详情
替代品

模型简介

基于OLMo2 7B架构构建的大语言模型,采用SuperBPE分词器,支持更高效的文本编码和生成。

模型特点

SuperBPE分词器
结合传统子词标记和创新的超词标记,跨越多词边界,显著提升编码效率。
高效推理
相比传统BPE模型,推理阶段的平均效率高出30%。
大词汇量
词汇量达20万,其中16万为子词标记,4万为超词标记。
长上下文支持
上下文长度为2,884个标记,相当于传统BPE模型4,096标记的实际字节量。

模型能力

文本生成
高效文本编码

使用案例

自然语言处理
文本生成
生成连贯、上下文相关的文本内容。
高质量文本输出,效率提升30%。
文本编码
高效编码长文本,减少标记数量。
更少的标记编码等量文本。