vntl-llama3-8b-v2-gguf开源模型 - 免费部署助力日语视觉小说英译

首页

Vntl Llama3 8b V2 Gguf

由 lmg-anon 开发

基于LLaMA 3 Youko的qlora微调版本，专精日语视觉小说英译任务

机器翻译支持多种语言#日语视觉小说翻译 #直译风格优化 #多行文本支持

下载量 123

发布时间 : 1/2/2025

模型简介

该模型是针对日语视觉小说翻译至英语优化的语言模型，采用新版VNTL数据集微调，在准确性和稳定性上有显著提升

模型特点

高准确直译风格

新版数据集带来更高翻译准确性，输出趋向直译风格

多行翻译支持

相比前代单行限制，现可处理多行连续文本翻译

元数据增强

支持通过角色信息和背景知识指导翻译过程

稳定输出

即使在高温参数下运行仍保持较低错误率

模型能力

日语到英语翻译

视觉小说文本处理

角色对话翻译

文化特定术语翻译

使用案例

游戏本地化

视觉小说翻译

将日语视觉小说内容翻译为英文

准确率提升且风格一致的翻译输出

多媒体内容制作

字幕生成

为日语动画/游戏生成英文字幕

保持角色语气一致性的翻译

🚀 基于LLaMA 3 Youko的日语视觉小说翻译微调模型

这是一个基于LLaMA 3 Youko的QLoRA微调模型，使用新版VNTL数据集创建。该微调的目的是提升大语言模型将日语视觉小说翻译成英语的性能。

🚀 快速开始

本模型是基于LLaMA 3 Youko的微调版本，使用新版VNTL数据集进行训练，旨在提升日语视觉小说到英语的翻译性能。与之前版本不同，此版本不包含“聊天模式”。

✨ 主要特性

性能提升：全新构建和扩展了VNTL数据集，在准确性和稳定性方面优于之前版本，即使在高温参数下运行，错误也大幅减少。
格式调整：切换到默认的LLaMA 3提示格式，解决了自定义格式带来的使用困扰。
多行翻译支持：增加了对多行翻译的支持，而旧版本仅能处理单行翻译。
翻译准确性提升：整体翻译准确性更高，但与之前版本相比，翻译结果更倾向于直译。

📦 安装指南

文档未提供安装步骤，故跳过此章节。

💻 使用示例

基础用法

此微调模型使用LLaMA 3提示格式，以下是一个翻译提示示例：

<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>

[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>

[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は可愛いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>

[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."<|eot_id|>

使用温度参数为0时，该提示生成的翻译结果为：

[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."

高级用法

元数据部分不仅限于角色信息，还可以添加琐事信息，并教导模型正确发音较难的单词。以下是一个示例：

<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>

[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female
[element] Name: Murasamemaru (叢雨丸) | Type: Quality<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>

[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は叢雨丸いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>

使用温度参数为0时，该提示生成的翻译结果为：

[Shingo]: "Nah, I know it’s not the best thing to say, but I’m glad you got lost. Sakuno’s Murasamemaru, so I was really worried about you, you know?"

📚 详细文档

注意事项

对于新版的VNTL 8B，重新构建并扩展了VNTL数据集，在准确性和稳定性方面表现出色，即使在高温参数下运行，错误也大幅减少（不过为获得最佳准确性，仍建议使用温度参数0）。此版本的一些主要变化包括：

切换到默认的LLaMA 3提示格式，解决了自定义格式带来的使用困扰。
增加了对多行翻译的支持，而旧版本仅能处理单行翻译。
整体翻译准确性更高，但与之前版本相比，翻译结果更倾向于直译。

采样建议

为获得最佳结果，强烈建议在使用此模型时使用中性采样参数（温度0，无重复惩罚）。

🔧 技术细节

训练详情

此微调使用了与之前版本相似的超参数，唯一的区别是使用了全新的数据集。

属性	详情
模型类型	基于LLaMA 3 Youko的QLoRA微调模型
训练数据	lmg-anon/VNTL-v5-1k
Rank	128
Alpha	32
有效批量大小	45
热身比率	0.02
学习率	6e - 5
嵌入学习率	1e - 5
优化器	grokadamw
学习率调度	余弦
权重衰减	0.01
训练损失	0.42