Marin 8b Instruct
Apache-2.0
Marin 8B是一个开源的8B参数规模的大型语言模型,基于Llama架构开发,支持英语文本生成任务。
大型语言模型
英语
M
marin-community
239
1
Llama 3.1 8B AthenaSky MegaMix
Apache-2.0
通过MergeKit融合多个高质量模型的8B参数大语言模型,优化了推理、对话和创意生成能力
大型语言模型
Transformers

英语
L
ZeroXClem
105
2
Guardreasoner 1B
其他
GuardReasoner 1B是基于meta-llama/Llama-3.2-1B通过R-SFT和HS-DPO微调的版本,专注于分析人类与AI交互的分类任务。
大型语言模型
Transformers

英语
G
yueliu1999
154
4
Guardreasoner 3B
其他
基于Llama-3.2-3B通过R-SFT和HS-DPO方法微调的安全防护模型,用于分析人机交互中的有害内容
大型语言模型
Transformers

G
yueliu1999
172
3
Guardreasoner 8B
Apache-2.0
GuardReasoner 8B是基于meta-llama/Llama-3.1-8B微调的模型,专注于推理式LLM安全防护
大型语言模型
Transformers

G
yueliu1999
480
2
Hunyuan 7B Instruct
其他
混元-7B-Instruct是腾讯发布的中英文双语大语言模型,具备强大的文本生成和理解能力,是目前最强的中文7B Dense模型之一。
大型语言模型
Transformers

英语
H
tencent
598
48
Gemma 2 27b
Gemma是Google推出的轻量级开源大语言模型,基于与Gemini相同技术构建,适用于文本生成任务。
大型语言模型
Transformers

G
google
11.89k
207
Llama3 German 8B 32k
基于Meta Llama3-8B优化的德语大语言模型,通过650亿德语语料持续预训练,专为德语优化并支持32k长上下文
大型语言模型
Transformers

德语
L
DiscoResearch
91
13
Calme 2.3 Llama3 70b
基于Meta-Llama-3-70B-Instruct模型通过DPO微调的大语言模型,在多项基准测试中表现优异
大型语言模型
Transformers

英语
C
MaziyarPanahi
31
4
Rhea 72b V0.5
Apache-2.0
Rhea-72b-v0.5是基于Smaug-72B-v0.1微调的大语言模型,在HuggingFace开放大模型排行榜上排名第一。
大型语言模型
Transformers

英语
R
davidkim205
103
135
Openhercules 2.5 Mistral 7B AWQ
Apache-2.0
OpenHercules-2.5-Mistral-7B 是一个基于 Mistral-7B 架构的融合模型,结合了 Hercules-2.5-Mistral-7B 和 OpenHermes-2.5-Mistral-7B 的优势,适用于文本生成
大型语言模型
Transformers

英语
O
solidrust
30
1
Gemma 7b Zephyr Sft
其他
基于Google Gemma 7B模型,采用Zephyr SFT配方微调的大语言模型,主要用于文本生成任务
大型语言模型
Transformers

G
wandb
19
2
Ghost 7b V0.9.1
MIT
Ghost 7B是一个专注于优化推理和多任务知识的大型语言模型,支持英文和越南文,基于Mistral 7B架构。
大型语言模型
Transformers

支持多种语言
G
ghost-x
1,142
11
Orthogonal 2x7B V2 Base
orthogonal-2x7B-v2-base 是一个基于 Mistral-7B-Instruct-v0.2 和 SanjiWatsuki/Kunoichi-DPO-v2-7B 的混合专家模型,专注于文本生成任务。
大型语言模型
Transformers

O
LoSboccacc
80
1
Darebeagle 7B
Apache-2.0
DareBeagle-7B是通过LazyMergekit合并mlabonne/NeuralBeagle14-7B和mlabonne/NeuralDaredevil-7B得到的7B参数大语言模型,在多个基准测试中表现优异。
大型语言模型
Transformers

D
shadowml
77
1
Tiny Llava V1 Hf
Apache-2.0
TinyLLaVA是一个小型大规模多模态模型框架,专注于视觉语言任务,参数规模小但性能优异。
图像生成文本
Transformers

支持多种语言
T
bczhou
2,372
57
Galactica 6.7B EssayWriter
基于Galactica架构的67亿参数大语言模型,专注于文章写作任务,在开放大语言模型排行榜中平均得分37.75。
大型语言模型
Transformers

G
KnutJaegersberg
105
4
Openorca Platypus2 13B
OpenOrca-Platypus2-13B是Platypus2-13B与OpenOrcaxOpenChat-Preview2-13B的融合模型,结合了STEM/逻辑数据集和GPT-4精炼数据集的优势
大型语言模型
Transformers

英语
O
Open-Orca
5,266
225
Polyglot Ko 12.8b
Apache-2.0
Polyglot-Ko-12.8B是由EleutherAI多语言团队开发的大规模韩语自回归语言模型,具有12.8亿参数,专门针对韩语优化。
大型语言模型
Transformers

韩语
P
EleutherAI
732
82
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文