开源Llama-3.2-400M-Amharic模型 - 专用于阿姆哈拉语处理，便捷实用！

首页

Llama 3.2 400M Amharic

由 rasyosef 开发

这是一个基于Meta公司Llama-3.2-1B模型的精简版本，专门针对阿姆哈拉语进行预训练，包含4亿参数，上下文长度为1024个标记。

大型语言模型

Transformers

其他#阿姆哈拉语生成 #小规模预训练 #非洲语言模型

下载量 310

发布时间 : 11/26/2024

模型简介

该模型是一个解码器变压器模型，专门用于阿姆哈拉语的文本生成任务，未经过监督微调。

模型特点

阿姆哈拉语优化

使用2.74亿个阿姆哈拉语文本标记进行预训练，专门优化了阿姆哈拉语的文本生成能力。

精简模型

基于Llama-3.2-1B模型的精简版本，参数规模为4亿，适合在单块A100 40GB显卡上运行。

高效训练

在单块A100 40GB显卡上仅用23小时完成预训练，验证困惑度为41.3。

模型能力

阿姆哈拉语文本生成

长文本生成（1024标记上下文长度）

使用案例

文本生成

新闻摘要生成

根据阿姆哈拉语新闻标题生成新闻摘要

生成连贯且符合语境的新闻内容

对话系统

用于阿姆哈拉语聊天机器人的回复生成

生成自然流畅的对话回复

🚀 Llama 3.2 400M阿姆哈拉语模型

本项目是Meta公司Llama-3.2-1B解码器Transformer模型的较小版本。该模型使用单张A100 40GB GPU，基于2.74亿个阿姆哈拉语文本标记，从头开始预训练了23小时。

模型信息

属性	详情
模型类型	Llama 3.2 400M阿姆哈拉语模型
训练数据	2.74亿个阿姆哈拉语文本标记
参数数量	4亿个参数
上下文大小	1024个标记
分词器	与Llama-3.2-1B使用相同的分词器，基于相同的阿姆哈拉语数据集从头训练，词汇量为32k
验证困惑度	41.3
模型状态	基础模型，尚未进行任何有监督微调

🚀 快速开始

📦 安装指南

首先，你需要安装最新版本的transformers库：

pip install -Uq transformers

💻 使用示例

基础用法

你可以使用pipeline直接调用该模型进行文本生成：

from transformers import pipeline

llama_am = pipeline(
    "text-generation",
    model="rasyosef/Llama-3.2-400M-Amharic",
    device_map="auto"
  )

prompt = "አዲስ አበባ"
llama_am(
    prompt,
    max_new_tokens=128,
    temperature=0.5,
    do_sample=True,
    top_k=8,
    top_p=0.8,
    repetition_penalty=1.2
  )

输出示例

[{'generated_text': 'አዲስ አበባ፣ ታህሳስ 8 ፣2012 (ኤፍ ቢ ሲ) የኢፌዴሪ የውጭ ጉዳይ ሚኒስትር አቶ ገዱ አንዳርጋቸው ከአፍሪካ ህብረት የስራ አስፈጻሚዎች ምክር ቤት መደበኛ ስብሰባ ጎን ለጎን ከዴሞክራቲክ ሪፐብሊክ ኮንጎ አቻቸው ማሪ ቱምባ ንዜዛ እና ከሌሎች የአፍሪካ አምባሳደሮች ጋር ተወያይተዋል።በውይይታቸውም በአፍሪካ የኮሮና ቫይረስን ለመከላከል እየተከናወኑ ባሉ ስራዎች ዙሪያ መምከራቸውን በትዊተር ገጻቸው አስፍረዋል።የሁለቱን ሀገራት ግንኙነት በተመለከተም፥ ኢትዮጵያ በህብረቱ ቋሚ አምባሳደርነት ባላት ሀላፊነት ለሹመት ማቅረብዋ የሚደነቅ መሆኑንም አንስተዋል።ኢትዮጵያ የኮቪድ19 ወረርሽኝን ለመግታት እያደረገች ባለው ጥረት ለደቡብ አፍሪካ ምስጋና አቅርባም ነበር፤ ቫይረሱን ለመቆጣጠር ከኢትዮጵያ ምን እንደምትማር በዝርዝር ላቀረብንላቸው ጥያቄም ወደፊት በሚሰሩ የትብብር መስኮች ላይ ተነጋግረን መስራት እንፈልጋለን ብለዋል።በቀጣይም ሁለቱ'}]