Proofgpt V0.1 6.7B
MIT
ProofGPT-v0.1 是一个基于 GPT-NeoX 架构、拥有 67 亿参数的语言模型,训练数据来源于 proof-pile 数据集。
大型语言模型
Transformers

英语
P
hoskinson-center
168
10
Olmo 2 0425 1B SFT
Apache-2.0
OLMo 2 1B SFT是基于OLMo-2-0425-1B模型的监督微调版本,在Tulu 3数据集上训练,旨在实现多种任务的最先进性能。
大型语言模型
Transformers

英语
O
allenai
1,759
2
Gams 9B Instruct GGUF
GaMS-9B-Instruct是基于Google Gemma 2系列开发的斯洛文尼亚语大语言模型,支持斯洛文尼亚语、英语及部分南斯拉夫语系语言。
大型语言模型
支持多种语言
G
tknez
81
2
F5 TTS Vietnamese 100h
基于F5-TTS微调的紧凑版本,训练数据为150小时的越南语语音,仅限研究用途。
语音合成
其他
F
hynt
123
14
Llama 3.2 3B NuminaQA
Apache-2.0
基于FineMath-Llama-3B微调的3B参数问答模型,使用Numia-1.5问答数据集训练
大型语言模型
Transformers

L
lkevinzc
330
3
C4ai Command R7b 12 2024 Abliterated GGUF
这是c4ai-command-r7b-12-2024-abliterated模型的量化版本,使用llama.cpp进行量化,支持多种量化类型,适用于不同硬件环境。
大型语言模型
支持多种语言
C
bartowski
867
13
VARCO VISION 14B HF
VARCO-VISION-14B是一款强大的英韩视觉语言模型,支持图像和文本输入,生成文本输出,具备定位、指代和OCR功能。
图像生成文本
Transformers

支持多种语言
V
NCSOFT
449
24
Llavaguard V1.2 0.5B OV
LlavaGuard是基于视觉语言模型的安全评估守护者,主要用于图像内容的安全分类和违规检测。
图像生成文本
L
AIML-TUDA
239
2
Llavaguard V1.2 7B OV Hf
LlavaGuard是基于视觉语言模型的安全评估系统,用于图像内容的安全分类和合规性检查。
图像生成文本
L
AIML-TUDA
1,148
5
Llavaguard V1.2 7B OV
LlavaGuard是基于视觉语言模型的安全评估系统,主要用于图像内容的安全分类和合规性检查。
图像生成文本
L
AIML-TUDA
193
2
Moirai Moe 1.0 R Base
这是一个预训练的时间序列预测模型,专注于时序数据分析与预测任务。
气候模型
Safetensors
M
Salesforce
374.41k
9
Moirai Moe 1.0 R Small
一个基于PyTorch的时间序列预测预训练模型,适用于多种时序数据分析任务
气候模型
M
Salesforce
130.92k
8
Llammlein 1B
其他
这是一个基于Tinyllama代码框架、使用RedPajama V2德语语料从头训练的德语Tinyllama 1B语言模型。
大型语言模型
Transformers

德语
L
LSX-UniWue
304
14
Plamo 100b
其他
由Preferred Elements公司基于英日双语开源数据集训练的千亿参数模型,提供商业与非商业双重许可
大型语言模型
Transformers

支持多种语言
P
pfnet
178
18
Cambrian 8b
Apache-2.0
寒武纪是一个开源的以视觉为核心设计的 multimodal LLM(多模态大语言模型)。
文本生成图像
Transformers

C
nyu-visionx
565
63
Moirai 1.1 R Large
Moirai-1.1-R是Salesforce推出的时间序列预测基础模型,针对低频数据预测性能显著提升。
气候模型
Transformers

M
Salesforce
14.11k
26
Moirai 1.1 R Base
Moirai-1.0-R模型的全新升级版本,在Monash知识库的40个数据集上取得显著进步,特别针对低频数据场景优化。
气候模型
Transformers

M
Salesforce
26.77k
7
Moirai 1.1 R Small
Moirai-1.1-R是Salesforce发布的时间序列预测基础模型,在低频数据(如年数据和季度数据)上表现优异,相比前代模型性能提升约20%。
气候模型
Transformers

M
Salesforce
14.61k
6
Brahmai Clip V0.1
MIT
基于ViT-L/14和掩码自注意力Transformer的CLIP模型,用于零样本图像分类研究
文本生成图像
Transformers

英语
B
brahmairesearch
12.53k
0
Latxa 7b V1.2
Latxa是基于LLaMA-2架构的巴斯克语大语言模型,专为低资源语言设计,在42亿token的巴斯克语料库上训练
大型语言模型
Transformers

支持多种语言
L
HiTZ
875
5
Llavaguard 7B
LlavaGuard是基于视觉语言模型的数据集安全评估与保障框架,主要用于内容安全评估。
图像生成文本
Transformers

L
AIML-TUDA
64
10
Llama 3 8B SFR SFT R
基于LLaMA-3-8B的监督微调模型,由Salesforce开发,用于强化学习人类反馈(RLHF)工作流程中的监督微调阶段。
大型语言模型
Transformers

L
Salesforce
22
8
Llamantino 3 ANITA 8B Inst DPO ITA
LLaMAntino-3-ANITA是基于Meta Llama 3构建的多语言(英语+意大利语)大型语言模型,专为意大利语NLP任务优化。
大型语言模型
Transformers

支持多种语言
L
swap-uniba
6,401
25
Minerva 1B Base V1.0
Apache-2.0
Minerva-1B-base-v1.0是由Sapienza NLP与FAIR及CINECA合作开发的10亿参数意英双语大语言模型,基于2000亿token(各1000亿意/英)训练
大型语言模型
Transformers

支持多种语言
M
sapienzanlp
551
28
Dictalm2.0 Instruct
Apache-2.0
基于DictaLM-2.0的指令微调大语言模型,专为希伯来语和英语聊天场景优化
大型语言模型
Transformers

支持多种语言
D
dicta-il
9,977
22
Cner Base
CNER模型是一个基于DeBERTa-v3-base架构的命名实体识别模型,能够联合识别和分类带有细粒度标签的概念和命名实体。
序列标注
Transformers

英语
C
Babelscape
20.66k
6
Dictabert Sentiment
专为希伯来语打造的尖端语言模型,基于BERT架构的情感分析模型
文本分类
Transformers

其他
D
dicta-il
1,242
1
Qra 1b
Apache-2.0
Qra是由波兰国家信息处理研究所与格但斯克理工大学联合开发的波兰语优化大语言模型系列,基于TinyLlama-1.1B初始化并在900亿波兰语token上训练
大型语言模型
Transformers

Q
OPI-PG
246
20
Llava V1.6 Vicuna 7b Gguf
Apache-2.0
LLaVA是一个开源的多模态聊天机器人,通过在多模态指令跟随数据上微调LLM训练而成。
文本生成图像
L
cjpais
493
5
Llava V1.6 34b
Apache-2.0
LLaVA是一个开源的多模态聊天机器人,基于大语言模型微调训练而成,支持图像和文本的交互。
文本生成图像
L
liuhaotian
9,033
351
TURNA
其他
TURNA是一个基于UL2框架的土耳其语言模型,适用于理解和生成任务,在多项土耳其语任务中表现优异。
大型语言模型
Transformers

其他
T
boun-tabi-LMG
187
75
UNA TheBeagle 7b V1
TheBeagle是基于The Bagel数据集训练的70亿参数模型,采用DPO(直接偏好优化)和UNA(统一神经架构)技术优化,在多任务中表现优异。
大型语言模型
Transformers

U
fblgit
88
37
Teenytinyllama 460m
Apache-2.0
TeenyTinyLlama-460m是一个针对巴西葡萄牙语优化的开源微型语言模型,参数规模为460M,基于Transformer架构预训练。
大型语言模型
其他
T
nicholasKluge
289
11
Phi 2 Arxiv Physics Instruct
Apache-2.0
基于Phi-2架构的物理领域问答模型,专门针对arXiv物理学论文内容进行指令微调
大型语言模型
Transformers

英语
P
AlgorithmicResearchGroup
15
3
Llamantino 2 7b Hf ITA
基于LLaMA 2的意大利语适配大语言模型,专注于意大利语文本生成任务
大型语言模型
Transformers

其他
L
swap-uniba
4,696
7
SOLAR 10.7B Instruct V1.0
SOLAR-10.7B是一个拥有107亿参数的高级大语言模型,在自然语言处理任务中表现出色,参数规模低于300亿的模型中性能领先。
大型语言模型
Transformers

英语
S
upstage
58.99k
623
Swallow 7b Instruct Hf
基于Llama 2系列优化的日语增强型大语言模型,通过监督式微调提升指令跟随能力
大型语言模型
Transformers

支持多种语言
S
tokyotech-llm
1,938
42
Llama Vid 7b Full 224 Video Fps 1
LLaMA-VID是基于LLaMA/Vicuna微调的开源多模态聊天机器人,通过扩展上下文令牌支持长达数小时的视频处理能力。
文本生成视频
Transformers

L
YanweiLi
86
9
Starling LM 7B Alpha
Apache-2.0
首个基于AI反馈强化学习(RLAIF)训练的开源大语言模型,在MT Bench测试中表现优异
大型语言模型
Transformers

英语
S
berkeley-nest
9,765
558
Llava Plus V0 7b
LLaVA-Plus 是一个可插拔学习技能的大型语言与视觉助手,主要用于多模态模型及聊天机器人的学术研究。
文本生成图像
Transformers

L
LLaVA-VL
79
38
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文