D

Dorna Llama3 8B Instruct Quantized4Bit

由 amirMohammadi 开发
Dorna-Llama3-8B-Instruct的4位量化版本,针对波斯语优化,集成Flash Attention 2技术提升推理效率
下载量 22
发布时间 : 6/8/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于Llama3架构的8B参数大语言模型,专门针对波斯语数据进行微调,并通过4位量化技术优化内存使用,适用于波斯语文本生成任务

模型特点

内存优化
4位量化技术显著降低内存需求,适合资源受限环境
推理加速
集成Flash Attention 2技术,提升处理速度
波斯语优化
专门针对波斯语数据进行训练/微调
部署便捷
无需额外安装LlamaCPP或Candle等库,开箱即用

模型能力

波斯语文本生成
英语文本生成
对话系统
问答系统
文本摘要

使用案例

语言服务
波斯语智能助手
用于构建波斯语对话系统
在人工评估中对比Persian Mind模型取得55.77%胜率
跨语言问答系统
支持波斯语和英语的问答服务
在新闻QA任务中表现优异
教育
语言学习工具
辅助波斯语学习者进行语言练习