T

Tess 2.0 Llama 3 8B

由 migtissera 开发
Tess是Tesoro(意大利语中'宝藏'之意)的简称,这是一个基于meta-llama/Meta-Llama-3-8B模型进行训练的通用型大语言模型系列。
下载量 1,835
发布时间 : 5/5/2024
模型介绍
内容详情
替代品

模型简介

Tess-2.0-Llama-3-8B是一个通用型大语言模型,基于Llama-3架构,经过约10万条高质量代码和通用训练样本的微调,能够高效遵循指令并提供详细回答。

模型特点

高质量微调
基于约10万条高质量代码和通用训练样本进行微调,模型几乎总能遵循指令。
低学习率训练
仅进行1个epoch的低学习率微调,尽可能保持模型的信息熵。
通用型能力
适用于多种任务,包括对话、代码生成和通用文本处理。

模型能力

文本生成
对话系统
代码生成
指令遵循

使用案例

对话系统
智能助手
作为智能助手回答用户问题
能提供详细回答,几乎总能遵循指令
代码生成
代码辅助
帮助开发者生成和优化代码
基于高质量代码样本训练,能生成有效代码