日语优化

# 日语优化

Llm Jp 3.1 1.8b

LLM-jp-3.1-1.8b是由日本国立情报学研究所开发的大语言模型，基于LLM-jp-3系列，融入指令预训练增强指令遵循能力。

大型语言模型

Transformers 支持多种语言

Shisa V2 Llama3.3 70b

Shisa V2是由Shisa.AI训练的双语(日语/英语)通用聊天模型系列，基于Llama-3.3-70B-Instruct优化，专注于提升日语任务表现同时保持英语能力。

大型语言模型

Transformers 支持多种语言

Shisa V2 Mistral Nemo 12b

Shisa V2是由Shisa.AI训练的双语（日语/英语）通用聊天模型，专注于日语任务优化，同时保持英语能力。

大型语言模型

Transformers 支持多种语言

Shisa V2 Unphi4 14b

Shisa V2是由Shisa.AI训练的双语（日语/英语）通用聊天模型，专注于提升日语任务能力的同时保持强大的英语能力。

大型语言模型

Transformers 支持多种语言

Stockmark 2 100B Instruct Beta

Stockmark-2-100B是一个专注于日语能力的1000亿参数大语言模型，基于1.5万亿token的多语言数据预训练，并通过日语合成数据增强指令跟随能力。

大型语言模型

Transformers 支持多种语言

专精于日式动画风格表演台词领域的日语语音识别模型

Transformers 日语

EZO Llama 3.2 3B Instruct Dpoe

基于Meta AI的Llama 3.2微调的日语优化模型，支持多语言文本生成

大型语言模型

Transformers 支持多种语言

Llm Jp 3 1.8b Instruct

由日本国立情报学研究所开发的大语言模型，支持日语和英语，具备指令微调能力。

大型语言模型

Transformers 支持多种语言

Llama 3 Swallow 8B Instruct V0.1

基于Meta Llama 3构建的日语优化大语言模型，通过持续预训练增强日语能力，采用监督微调提升指令跟随能力

大型语言模型

Transformers 支持多种语言

Llama 3 ELYZA JP 8B

由ELYZA公司训练的大型语言模型，基于Meta-Llama-3-8B-Instruct增强日语能力

大型语言模型

Transformers 支持多种语言

由SB Intuitions公司训练的大语言模型，支持日语和英语，基于Llama2架构

大型语言模型

Transformers 支持多种语言

Shisa V1 Llama3 8b

基于Meta-Llama-3-8B-Instruct微调的日语优化大语言模型，在多个日语基准测试中表现优异

大型语言模型

Llama 3 Swallow 8B V0.1

基于Meta Llama 3构建的日语增强大语言模型，通过持续预训练和指令微调提升日语处理能力

大型语言模型

Transformers 支持多种语言

Fugaku LLM 13B Instruct

Fugaku-LLM是完全利用超级计算机'富岳'从头开始预训练的国产模型，以日语为主训练数据，在日语处理方面表现卓越

大型语言模型

Transformers 支持多种语言

Llama 3 Youko 8b

基于Meta-Llama-3-8B在混合日语和英语数据集上进行220亿token持续预训练的日语优化模型

大型语言模型

Transformers 支持多种语言

Fugaku-LLM是使用超级计算机'富岳'从零开始预训练的日本国产大语言模型，具有高度透明性和安全性，日语表现尤为出色

大型语言模型

Transformers 支持多种语言

Honyaku-7b-v2是其前代模型的改进版本，在多语言生成标签的遵循准确性上有所提升。

Swallow MS 7b Instruct V0.1

基于Mistral-7B-v0.1进行持续预训练的日语增强大语言模型

大型语言模型

Transformers 支持多种语言

Rakutenai 7B Chat

RakutenAI-7B-chat是乐天集团开发的日语大语言模型，在日语理解基准测试中表现优异，同时支持英语任务。基于Mistral-7B架构扩展词汇表优化日文处理。

大型语言模型

Transformers 支持多种语言

Whisper Large V3 Japanese 4k Steps Ct2

这是OpenAI Whisper large-v3模型的CTranslate2转换版本，专门针对日语进行了4000步的额外训练，支持多种语言的语音识别。

语音识别支持多种语言

Faster Whisper Large V3 Ja

基于OpenAI Whisper large-v3的日语优化版本，支持多语言语音识别

语音识别支持多种语言

Japanese E5 Mistral 7b Slerp

一个通过合并E5 Mistral 7B Instruct和Japanese StableLM Base Gamma 7B创建的日语文本嵌入模型，专注于句子相似度任务

Transformers 日语

ELYZA Japanese Llama 2 13b Fast Instruct

基于Llama 2的日语优化模型，专为提升日语交互体验而设计

大型语言模型

Transformers 支持多种语言

ELYZA Japanese Llama 2 13b Instruct

ELYZA-japanese-Llama-2-13b是基于Llama 2进行额外预训练以扩展日语能力的模型。

大型语言模型

Transformers 支持多种语言

Japanese Clip Vit B 32 Roberta Base

日语版本的CLIP模型，能够将日语文本和图像映射到相同的嵌入空间，适用于零样本图像分类、文本-图像检索等任务。

文本生成图像

Transformers 日语

基于Qwen-14B在混合日语和英语数据集上持续预训练的大语言模型，显著提升日语任务表现

大型语言模型

Transformers 支持多种语言

基于Llama 2系列增强日语能力的开源大语言模型，提供7B/13B/70B三种规模及指令调优版本

大型语言模型

Transformers 支持多种语言

CyberAgentLM2 是一个仅解码器的语言模型，基于公开可用的日语和英语数据集，预训练了1.3万亿个token。

大型语言模型

Transformers 支持多种语言

基于llama2-7b在日英混合数据集上进行持续预训练的大语言模型，在日语任务上性能显著提升

大型语言模型

Transformers 支持多种语言

Deberta V3 Japanese Base

基于DeBERTa V3架构的日语预训练模型，专为日语NLP任务优化设计

大型语言模型

Transformers 日语

globis-university

Deberta V3 Japanese Large

基于日语资源训练的DeBERTa V3大型模型，专为日语优化，无需形态分析器且尊重词语边界。

大型语言模型

Transformers 日语

globis-university

Deberta V3 Japanese Xsmall

基于日语资源训练的DeBERTa V3模型，专为日语优化，推理时不依赖形态分析器

大型语言模型

Transformers 日语

globis-university

ELYZA Japanese Llama 2 7b Fast Instruct

基于Llama2架构，通过追加预训练扩展日语能力的语言模型

大型语言模型

Transformers 支持多种语言

ELYZA Japanese Llama 2 7b Instruct

基于Llama2架构，通过追加预训练扩展日语能力的语言模型

大型语言模型

Transformers 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24