B

Bielik 1.5B V3.0 Instruct FP8 Dynamic

由 speakleash 开发
这是一个基于Bielik-1.5B-v3.0-Instruct模型的FP8动态量化版本,适配vLLM或SGLang推理框架,通过AutoFP8量化技术将参数字节数从16位降至8位,显著降低磁盘空间和GPU显存需求。
下载量 31
发布时间 : 5/4/2025
模型介绍
内容详情
替代品

模型简介

该模型是对Bielik-1.5B-v3.0-Instruct的权重和激活值进行FP8数据类型量化的版本,主要用于波兰语文本生成任务。

模型特点

FP8动态量化
采用AutoFP8量化技术,将参数字节数从16位降至8位,磁盘空间和GPU显存需求降低约50%
高效推理
适配vLLM >= 0.5.0或SGLang推理框架,优化推理效率
波兰语优化
专门针对波兰语文本生成任务进行优化

模型能力

波兰语文本生成
指令跟随

使用案例

智能助手
波兰语问答系统
用于构建波兰语智能问答助手