llama-3-stinky-v2-8B开源文本生成模型 - 免费获取高质量文本创作能力

首页

Llama 3 Stinky V2 8B

由 nbeerbower 开发

这是一个基于Llama-3架构的8B参数模型，通过mergekit工具合并了多个预训练模型，具有较好的文本生成能力。

大型语言模型

Transformers

开源协议:其他 #多任务文本生成 #高推理准确率 #知识密集型任务

下载量 39

发布时间 : 5/11/2024

模型简介

该模型是一个合并了多个Llama-3变体的8B参数语言模型，专注于文本生成任务，在多个基准测试中表现良好。

模型特点

多模型合并

融合了12个不同的Llama-3变体模型，结合了各模型的优势

高性能

在多个基准测试中表现优异，平均得分70.27

模型库存方法

采用模型库存合并方法，以Mahou-1.1-llama3-8B为基础模型

模型能力

文本生成

问答系统

推理任务

代码生成

使用案例

教育

解题辅助

帮助学生解答数学和科学问题

在GSM8k数学测试中达到69.75%准确率

研究

知识问答

回答各种学术领域的问题

在MMLU测试中达到68.33%准确率

商业

内容生成

自动生成商业文案和报告

指标	值
平均值	70.27
AI2 推理挑战 (25 样本)	66.98
HellaSwag (10 样本)	83.20
MMLU (5 样本)	68.33
TruthfulQA (0 样本)	55.83
Winogrande (5 样本)	77.51
GSM8k (5 样本)	69.75

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Llama 3 Stinky V2 8B

模型简介

模型特点

模型能力

使用案例

🚀 llama-3-stinky-v2-8B

🚀 快速开始

✨ 主要特性

合并详情

合并方法

合并的模型

配置

Open LLM Leaderboard 评估结果

📄 许可证