多语言混合训练

# 多语言混合训练

Gemma 2 Llama Swallow 9b It V0.1

Gemma-2-Llama-Swallow系列模型是在Gemma-2基础上进行持续预训练构建的多语言大模型，特别增强了日语能力。

大型语言模型

Transformers 支持多种语言

Stockmark 2 100B Instruct Beta

Stockmark-2-100B是一个专注于日语能力的1000亿参数大语言模型，基于1.5万亿token的多语言数据预训练，并通过日语合成数据增强指令跟随能力。

大型语言模型

Transformers 支持多种语言

Llama 3 Youko 8b

基于Meta-Llama-3-8B在混合日语和英语数据集上进行220亿token持续预训练的日语优化模型

大型语言模型

Transformers 支持多种语言

Bangla Llama 7b Instruct V0.1

基于LLaMA-2架构优化的70亿参数孟加拉语大语言模型，支持指令跟随任务

大型语言模型

Transformers 支持多种语言

Discolm German 7b V1 AWQ

DiscoLM German 7B v1 是一个基于Mistral架构的7B参数德语语言模型，支持德语和英语，采用Apache-2.0许可证发布。

大型语言模型

Transformers 支持多种语言

Swiss German Xlm Roberta Base

该模型是基于xlm-roberta-base通过持续预训练在瑞士德语文本数据上微调而成的多语言模型，支持瑞士德语和标准德语处理。

大型语言模型

Transformers 其他

Openhathi 7B Hi V0.1 Base

OpenHathi系列的首个模型，基于Llama2架构，支持印地语、英语及混合语，拥有70亿参数。

大型语言模型其他

Vietnamese Llama2 7b 40GB

基于Llama2-chat 7B的越南语优化模型，通过增量预训练和高效分词器显著提升越南语处理能力

大型语言模型

Transformers 支持多种语言

bkai-foundation-models

Koalpaca Llama 1 7b

KoAlpaca是基于斯坦福羊驼模型的韩语版本，结合了LLAMA架构与Polyglot-ko技术，专为韩语文本生成任务优化。

大型语言模型

Transformers 支持多种语言

Byt5 Korean Base

ByT5-韩语是谷歌ByT5的韩语定制扩展版本，特别优化了韩语音节的编码处理。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24