日语优化
Shisa V2 Llama3.3 70b
Shisa V2是由Shisa.AI训练的双语(日语/英语)通用聊天模型系列,基于Llama-3.3-70B-Instruct优化,专注于提升日语任务表现同时保持英语能力。
大型语言模型
Transformers
支持多种语言
S
shisa-ai
144
2
Shisa V2 Mistral Nemo 12b
Apache-2.0
Shisa V2是由Shisa.AI训练的双语(日语/英语)通用聊天模型,专注于日语任务优化,同时保持英语能力。
大型语言模型
Transformers
支持多种语言
S
shisa-ai
53
2
Shisa V2 Unphi4 14b
Apache-2.0
Shisa V2是由Shisa.AI训练的双语(日语/英语)通用聊天模型,专注于提升日语任务能力的同时保持强大的英语能力。
大型语言模型
Transformers
支持多种语言
S
shisa-ai
62
3
Stockmark 2 100B Instruct Beta
MIT
Stockmark-2-100B是一个专注于日语能力的1000亿参数大语言模型,基于1.5万亿token的多语言数据预训练,并通过日语合成数据增强指令跟随能力。
大型语言模型
Transformers
支持多种语言
S
stockmark
1,004
9
Anime Whisper
MIT
专精于日式动画风格表演台词领域的日语语音识别模型
语音识别
Transformers
日语
A
litagin
4,873
72
Llama 3 ELYZA JP 8B
由ELYZA公司训练的大型语言模型,基于Meta-Llama-3-8B-Instruct增强日语能力
大型语言模型
Transformers
支持多种语言
L
elyza
13.52k
113
Sarashina2 13b
MIT
由SB Intuitions公司训练的大语言模型,支持日语和英语,基于Llama2架构
大型语言模型
Transformers
支持多种语言
S
sbintuitions
1,167
17
Shisa V1 Llama3 8b
基于Meta-Llama-3-8B-Instruct微调的日语优化大语言模型,在多个日语基准测试中表现优异
大型语言模型
Transformers
S
shisa-ai
28
6
Llama 3 Swallow 8B V0.1
基于Meta Llama 3构建的日语增强大语言模型,通过持续预训练和指令微调提升日语处理能力
大型语言模型
Transformers
支持多种语言
L
tokyotech-llm
2,230
10
Fugaku LLM 13B Instruct
其他
Fugaku-LLM是完全利用超级计算机'富岳'从头开始预训练的国产模型,以日语为主训练数据,在日语处理方面表现卓越
大型语言模型
Transformers
支持多种语言
F
Fugaku-LLM
320
28
Llama 3 Youko 8b
基于Meta-Llama-3-8B在混合日语和英语数据集上进行220亿token持续预训练的日语优化模型
大型语言模型
Transformers
支持多种语言
L
rinna
1,249
60
Fugaku LLM 13B
其他
Fugaku-LLM是使用超级计算机'富岳'从零开始预训练的日本国产大语言模型,具有高度透明性和安全性,日语表现尤为出色
大型语言模型
Transformers
支持多种语言
F
Fugaku-LLM
25
123
Honyaku 7b V2
Apache-2.0
Honyaku-7b-v2是其前代模型的改进版本,在多语言生成标签的遵循准确性上有所提升。
机器翻译
Transformers
H
aixsatoshi
17
4
Swallow MS 7b Instruct V0.1
Apache-2.0
基于Mistral-7B-v0.1进行持续预训练的日语增强大语言模型
大型语言模型
Transformers
支持多种语言
S
tokyotech-llm
48
14
Rakutenai 7B Chat
Apache-2.0
RakutenAI-7B-chat是乐天集团开发的日语大语言模型,在日语理解基准测试中表现优异,同时支持英语任务。
大型语言模型
Transformers
支持多种语言
R
Rakuten
3,702
62
Whisper Large V3 Japanese 4k Steps Ct2
MIT
这是OpenAI Whisper large-v3模型的CTranslate2转换版本,专门针对日语进行了4000步的额外训练,支持多种语言的语音识别。
语音识别
支持多种语言
W
JhonVanced
54
4
Faster Whisper Large V3 Ja
MIT
基于OpenAI Whisper large-v3的日语优化版本,支持多语言语音识别
语音识别
支持多种语言
F
JhonVanced
46
3
Japanese E5 Mistral 7b Slerp
MIT
一个通过合并E5 Mistral 7B Instruct和Japanese StableLM Base Gamma 7B创建的日语文本嵌入模型,专注于句子相似度任务
文本嵌入
Transformers
日语
J
oshizo
94
7
ELYZA Japanese Llama 2 13b Instruct
ELYZA-japanese-Llama-2-13b是基于Llama 2进行额外预训练以扩展日语能力的模型。
大型语言模型
Transformers
支持多种语言
E
elyza
1,022
40
Japanese Clip Vit B 32 Roberta Base
日语版本的CLIP模型,能够将日语文本和图像映射到相同的嵌入空间,适用于零样本图像分类、文本-图像检索等任务。
文本生成图像
Transformers
日语
J
recruit-jp
384
9
Nekomata 14b
其他
基于Qwen-14B在混合日语和英语数据集上持续预训练的大语言模型,显著提升日语任务表现
大型语言模型
Transformers
支持多种语言
N
rinna
705
20
Swallow 70b Hf
基于Llama 2系列增强日语能力的开源大语言模型,提供7B/13B/70B三种规模及指令调优版本
大型语言模型
Transformers
支持多种语言
S
tokyotech-llm
2,088
10
Calm2 7b
Apache-2.0
CyberAgentLM2 是一个仅解码器的语言模型,基于公开可用的日语和英语数据集,预训练了1.3万亿个token。
大型语言模型
Transformers
支持多种语言
C
cyberagent
748
28
Deberta V3 Japanese Large
基于日语资源训练的DeBERTa V3大型模型,专为日语优化,无需形态分析器且尊重词语边界。
大型语言模型
Transformers
日语
D
globis-university
519.17k
2
Deberta V3 Japanese Xsmall
基于日语资源训练的DeBERTa V3模型,专为日语优化,推理时不依赖形态分析器
大型语言模型
Transformers
日语
D
globis-university
96
4
ELYZA Japanese Llama 2 7b Fast Instruct
基于Llama2架构,通过追加预训练扩展日语能力的语言模型
大型语言模型
Transformers
支持多种语言
E
elyza
1,576
75
ELYZA Japanese Llama 2 7b Instruct
基于Llama2架构,通过追加预训练扩展日语能力的语言模型
大型语言模型
Transformers
支持多种语言
E
elyza
5,917
67