大模型推理
Medgemma 27b Text It 4bit
其他
MedGemma-27B-Text-IT-4bit是基于Google的MedGemma-27B-Text-IT模型转换而来的MLX格式模型,专为医疗和临床推理任务优化。
大型语言模型
M
mlx-community
193
3
Parakeet Tdt 0.6b V2 Onnx
NVIDIA Parakeet TDT 0.6B V2 是一个基于自动语音识别(ASR)任务的模型,适用于英语语音转文本任务。
语音识别
英语
P
istupakov
129
3
Rank1 32b
MIT
rank1-32b是一个基于Qwen2.5-32B训练的信息检索重排序模型,通过生成推理链进行相关性判断
大型语言模型
Transformers
英语
R
jhu-clsp
18
0
Meta Llama 3.3 70B Instruct AWQ INT4
Llama 3.3 70B Instruct AWQ INT4 是 Meta Llama 3.3 70B Instruct 模型的 4 位量化版本,适用于多语言对话用例,优化了文本生成任务。
大型语言模型
Transformers
支持多种语言
M
ibnzterrell
6,410
22
Cogvideox1.5 5B I2V
其他
CogVideoX 是一个开源视频生成模型,支持从图像生成视频,类似于清影平台。
图像生成视频
英语
C
THUDM
8,897
102
Llama 3.1 70B Japanese Instruct 2407
这是一个基于Meta-Llama-3.1-70B-Instruct持续预训练的日语大语言模型,支持日语和英语。
大型语言模型
Transformers
支持多种语言
L
cyberagent
343
74
Llama 3 8B Instruct QServe G128
Llama 3 是 Meta 公司推出的下一代开源大语言模型,具有更强的性能和更广泛的应用场景。
大型语言模型
Transformers
L
mit-han-lab
197
2
ARIA 70B V2 GGUF
ARIA 70B V2 是一个基于 Llama 2 架构的大规模语言模型,支持法语和英语,专注于文本生成任务。
大型语言模型
支持多种语言
A
TheBloke
1,100
3