Llama-160M-Chat-v1开源聊天模型 - 免费使用高效完成文本生成任务

首页

Llama 160M Chat V1

由 Felladrin 开发

这是一个160M参数的Llama聊天模型，基于JackFram/llama-160m微调而来，专注于文本生成任务。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #轻量级对话模型 #多领域问答 #低资源部署

下载量 586

发布时间 : 12/20/2023

模型简介

该模型是一个小型聊天语言模型，经过多个对话数据集微调，能够以同理心和详细程度回应用户的查询。

模型特点

小型高效

仅160M参数，适合资源有限的环境部署

多数据集微调

使用5个高质量对话数据集进行微调，提升对话能力

多格式支持

提供GGUF、ONNX、MLC和MLX等多种格式版本

模型能力

文本生成

对话交互

问答系统

创意写作

使用案例

对话系统

客服助手

用于回答客户基本问题

能提供同理心回答

教育问答

回答学生关于各种主题的问题

能提供详细解释

内容生成

创意写作

生成故事设定和情节

能提供创意性内容

🚀 1600万参数的Llama聊天模型

这是一个基于Llama架构的聊天模型，拥有1600万参数。它基于特定的基础模型，使用多个数据集进行训练，可用于文本生成任务。同时，该模型还提供了多种机器学习格式的版本，方便不同场景下的使用。

🚀 快速开始

✨ 主要特性

基础模型：基于 JackFram/llama-160m 基础模型构建。
训练数据集：使用了多个高质量数据集进行训练，包括 ehartford/wizard_vicuna_70k_unfiltered、totally-not-an-llm/EverythingLM-data-V3、Open-Orca/SlimOrca-Dedup、databricks/databricks-dolly-15k 和 THUDM/webglm-qa。
多格式支持：提供多种机器学习格式的版本，如 GGUF Felladrin/gguf-Llama-160M-Chat-v1、ONNX Felladrin/onnx-Llama-160M-Chat-v1、MLC Felladrin/mlc-q4f16-Llama-160M-Chat-v1 和 MLX mlx-community/Llama-160M-Chat-v1-4bit-mlx。

💻 使用示例

基础用法

from transformers import pipeline

generate = pipeline("text-generation", "Felladrin/Llama-160M-Chat-v1")

messages = [
    {
        "role": "system",
        "content": "You are a helpful assistant who answers user's questions with details and curiosity.",
    },
    {
        "role": "user",
        "content": "What are some potential applications for quantum computing?",
    },
]

prompt = generate.tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)

output = generate(
    prompt,
    max_new_tokens=1024,
    penalty_alpha=0.5,
    top_k=4,
    repetition_penalty=1.01,
)

print(output[0]["generated_text"])

📚 详细文档

旧版Open LLM排行榜评估结果

指标	值
平均值	30.27
AI2推理挑战赛（25次少样本学习）	24.74
HellaSwag（10次少样本学习）	35.29
MMLU（5次少样本学习）	26.13
TruthfulQA（0次少样本学习）	44.16
Winogrande（5次少样本学习）	51.30
GSM8k（5次少样本学习）	0.00

新版Open LLM排行榜评估结果

详细结果可查看此处

指标	值
平均值	4.10
IFEval（0次少样本学习）	15.75
BBH（3次少样本学习）	3.17
MATH Lvl 5（4次少样本学习）	0.00
GPQA（0次少样本学习）	1.01
MuSR（0次少样本学习）	3.17
MMLU - PRO（5次少样本学习）	1.51