日英双语

# 日英双语

Orihime-12B 是一个使用 mergekit 工具合并的预训练语言模型，基于 shisa-v2-mistral-nemo-12b 和 Himeyuri-v0.1-12B 模型融合而成，支持英文和日文。

大型语言模型

Transformers 支持多种语言

ELYZA Shortcut 1.0 Qwen 32B

ELYZA-Shortcut-1.0-Qwen-32B是基于Qwen2.5-32B-Instruct开发的非推理模型，能够绕过推理步骤直接生成最终答案。

大型语言模型

Transformers 支持多种语言

Gemma 2 Llama Swallow 2b It V0.1

Gemma-2-Llama-Swallow系列是通过对gemma-2模型进行持续预训练构建的，显著增强了日文语言处理能力，同时保留原有英文能力。

大型语言模型

Transformers 支持多种语言

HMS-Slerp-12B 是一个采用SLERP球面线性插值法合并的多语言聊天模型，支持英语和日语。

大型语言模型

Transformers 支持多种语言

Elvenmaid 12B Stock

基于ElvenMaid-12B系列模型合并的ChatML格式语言模型，支持英文和日文

大型语言模型

Transformers 支持多种语言

Elvenmaid 12B V2

ElvenMaid-12B-v2 是一个基于 ChatML 格式的 12B 参数语言模型，通过 mergekit 的 TIES 方法合并多个预训练模型而成，支持英文和日文交互。

大型语言模型

Transformers 支持多种语言

Heron NVILA Lite 1B

基于NVILA-Lite架构训练的日语视觉语言模型，支持日语和英语的图文交互

图像生成文本支持多种语言

Etherealaurora 12B V2

基于ChatML架构的对话模型，通过mergekit工具合并预训练语言模型生成

大型语言模型

Transformers 支持多种语言

Llama 3 VNTL Yollisa 8B GGUF

这是一个基于Llama-3架构的8B参数模型，专注于视觉小说和日本御宅族媒体内容的翻译与处理。

大型语言模型支持多种语言

基于SCE方法合并的多语言ChatML模型，支持英文和日文对话

大型语言模型

Transformers 支持多种语言

Llama 3.1 Swallow 70B Instruct V0.3

Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列，通过持续预训练增强了日语能力，同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Llama 3.1 Swallow 8B Instruct V0.3

Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列，通过持续预训练增强了日语能力，同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Llama 3.1 Swallow 8B Instruct V0.2

Llama 3.1 Swallow是基于Meta Llama 3.1模型进行持续预训练的大语言模型系列，增强了日语能力同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Mistral Nemo Japanese Instruct 2408

这是一个基于Mistral-Nemo-Instruct-2407的日语持续预训练模型，专注于日语文本生成任务。

大型语言模型

Safetensors 支持多种语言

Llama 3 Swallow 8B Instruct V0.1

基于Meta Llama 3构建的日语优化大语言模型，通过持续预训练增强日语能力，采用监督微调提升指令跟随能力

大型语言模型

Transformers 支持多种语言

Llama 3 ELYZA JP 8B

由ELYZA公司训练的大型语言模型，基于Meta-Llama-3-8B-Instruct增强日语能力

大型语言模型

Transformers 支持多种语言

Llava Calm2 Siglip

llava-calm2-siglip 是一个实验性的视觉语言模型，能够用日语和英语回答关于图像的问题。

图像生成文本

Transformers 支持多种语言

Shisa V1 Llama3 8b

基于Meta-Llama-3-8B-Instruct微调的日语优化大语言模型，在多个日语基准测试中表现优异

大型语言模型

Llama 3 8B Japanese Instruct

这是一个基于日语对话数据集微调的Meta-Llama-3-8B-Instruct模型，专注于日语对话任务。

大型语言模型

Transformers 支持多种语言

Fugaku-LLM是使用超级计算机'富岳'从零开始预训练的日本国产大语言模型，具有高度透明性和安全性，日语表现尤为出色

大型语言模型

Transformers 支持多种语言

Swallow MS 7b Instruct V0.1

基于Mistral-7B-v0.1进行持续预训练的日语增强大语言模型

大型语言模型

Transformers 支持多种语言

Swallow MS 7b V0.1

Swallow-MS-7b-v0.1是基于Mistral-7B-v0.1持续预训练的日语增强模型，由TokyoTech-LLM开发，在日语任务上表现优异。

大型语言模型

Transformers 支持多种语言

ELYZA Japanese Llama 2 13b Fast Instruct

基于Llama 2的日语优化模型，专为提升日语交互体验而设计

大型语言模型

Transformers 支持多种语言

ELYZA Japanese Llama 2 13b Instruct

ELYZA-japanese-Llama-2-13b是基于Llama 2进行额外预训练以扩展日语能力的模型。

大型语言模型

Transformers 支持多种语言

ELYZA Japanese Llama 2 7b Fast Instruct

基于Llama2架构，通过追加预训练扩展日语能力的语言模型

大型语言模型

Transformers 支持多种语言

ELYZA Japanese Llama 2 7b Instruct

基于Llama2架构，通过追加预训练扩展日语能力的语言模型

大型语言模型

Transformers 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24