指令调优
Gemma 3 27b It Qat Q4 0 Unquantized
Gemma 3是Google推出的轻量级、先进的多模态开放模型,基于与Gemini模型相同的研究和技术构建,支持文本和图像输入并生成文本输出。
文本生成图像
Transformers
G
google
11.53k
23
Gemma 3 12b It Qat Q4 0 Gguf
Gemma 3是谷歌基于Gemini技术构建的轻量级开放模型,支持文本和图像输入,生成文本输出。
图像生成文本
G
vinimuchulski
1,860
4
Gemma 3 4b It Quantized W4A16
Gemma 3是Google开发的轻量级开源大语言模型,本仓库提供其4B参数版本的W4A16量化模型,显著降低硬件需求。
大型语言模型
Transformers
G
abhishekchohan
592
2
Gemma 3 12b It Qat Q4 0 Gguf
Gemma 3是谷歌推出的轻量级尖端开源多模态模型,支持图文输入与文本输出,具有128K上下文窗口和140+语言支持。
图像生成文本
G
google
40.86k
109
Gemma 3 1b It
Gemma 3是Google推出的轻量级先进开放模型系列,基于与Gemini模型相同的研究和技术构建。
文本生成图像
Transformers
G
google
2.1M
347
Modernbert Large Nli
Apache-2.0
基于ModernBERT-large模型,通过多任务微调优化的自然语言推理模型,在零样本分类和NLI任务上表现优异。
大型语言模型
Transformers
支持多种语言
M
tasksource
61.52k
5
Llama 3 ELYZA JP 8B
由ELYZA公司训练的大型语言模型,基于Meta-Llama-3-8B-Instruct增强日语能力
大型语言模型
Transformers
支持多种语言
L
elyza
13.52k
113
Gemma 2 27b It
Gemma是Google推出的轻量级开源大语言模型系列,基于创建Gemini模型的相同技术构建,适用于多种文本生成任务。
大型语言模型
Transformers
G
google
160.10k
543
It 5.3 Fp16 32k
Apache-2.0
旋风0.5*是一个支持俄语和英语的开源大语言模型,扩展了RoPE上下文窗口至32k,优化了JSON处理和多轮对话能力
大型语言模型
Transformers
支持多种语言
I
Vikhrmodels
74
11
Meta Llama 3 70B Instruct AWQ
其他
Meta-Llama-3-70B-Instruct是Meta发布的70B参数规模的指令调优大语言模型,针对对话用例优化,在安全性和帮助性方面表现突出。
大型语言模型
Transformers
英语
M
TechxGenus
210
12
Openelm 450M Instruct
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,包含2.7亿至30亿参数的预训练及指令调优版本。
大型语言模型
Transformers
O
apple
114.41k
47
Openelm 270M
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,提升准确性。
大型语言模型
Transformers
O
apple
4,719
74
Gemma 1.1 7b It
Gemma是Google推出的轻量级开放模型系列,基于与Gemini相同技术构建,适用于文本生成任务。
大型语言模型
Transformers
G
google
17.43k
271
Codegemma 7b It
CodeGemma是基于Gemma构建的轻量级开源代码模型集合,专长于代码生成、补全和对话任务。
大型语言模型
Transformers
C
google
3,286
217
Codegemma 7b It GGUF
CodeGemma是基于Gemma构建的轻量级开源代码模型系列,专注于代码补全、生成和对话任务。
大型语言模型
C
google
46
56
Codellama 13b Instruct Hf
Code Llama是Meta发布的预训练生成文本模型系列,专注于代码生成与理解,包含70亿至340亿参数的不同版本。
大型语言模型
Transformers
其他
C
meta-llama
2,307
22
Swallow 70b Hf
基于Llama 2系列增强日语能力的开源大语言模型,提供7B/13B/70B三种规模及指令调优版本
大型语言模型
Transformers
支持多种语言
S
tokyotech-llm
2,088
10
Llama2 MedTuned 7b
Apache-2.0
基于Llama2 7B模型进行指令调优的生物医学领域专用模型
大型语言模型
Transformers
L
nlpie
444
11
Codellama 13b Instruct Hf
CodeLlama-13b-Instruct是Meta发布的130亿参数指令调优代码生成模型,专为安全指令跟随和代码助手应用设计
大型语言模型
Transformers
其他
C
codellama
206.94k
147
Gpt2 Open Instruct V1
MIT
这是一个基于open-instruct-v1数据集微调的GPT2模型,采用羊驼格式的提示模板进行指令调优。
大型语言模型
Transformers
英语
G
vicgalle
2,124
34