多场景适配
Dmindai.dmind 1 Mini GGUF
DMind-1-mini 是一个轻量级的文本生成模型,适用于多种自然语言处理任务。
文本生成
D
DevQuasar
213
1
Devstral Small 2505 GGUF
Apache-2.0
Devstral-Small-2505的量化版本,提供多种精度选择以适应不同硬件需求
大型语言模型
支持多种语言
D
Antigma
170
1
Ultravox V0 5 Llama 3 2 1b GGUF
MIT
Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型,专注于高效处理语音转写任务。
语音识别
U
ggml-org
421
1
AM Thinking V1 GGUF
Apache-2.0
AM-Thinking-v1 是一个基于 GGUF 格式的文本生成模型,适用于多种自然语言处理任务。
大型语言模型
Transformers
A
Mungert
1,234
1
TRELLIS Image Large
MIT
TRELLIS图像条件版本是一个大型3D生成模型,能够从图像生成3D内容。
3D视觉
英语
T
Surn
80
0
TRELLIS Image Large Fork
MIT
TRELLIS是一个大型3D生成模型,通过结构化3D潜变量实现可扩展与多功能的3D内容生成。
3D视觉
英语
T
larsquaedvlieg
393
0
Secourses Rock
MIT
TRELLIS图像条件版本是一个大型3D生成模型,能够根据输入的2D图像生成对应的3D模型。
3D视觉
英语
S
MonsterMMORPG
100
0
LTX Video 0.9.7 Dev
其他
首个基于DiT架构的实时高质量视频生成模型,能以30帧/秒生成1216×704分辨率视频
视频处理
英语
L
Lightricks
477
7
Andrewzh Absolute Zero Reasoner Coder 7b GGUF
基于andrewzh的Absolute_Zero_Reasoner-Coder-7b模型的Llamacpp量化版本,支持多种量化级别,适用于推理和代码生成任务。
大型语言模型
A
bartowski
1,325
5
Nousresearch.deephermes ToolCalling Specialist Atropos GGUF
DeepHermes-ToolCalling-Specialist-Atropos 是一个专注于工具调用的文本生成模型,旨在通过自然语言处理技术实现高效的任务执行。
大型语言模型
N
DevQuasar
419
1
Allura Org Remnant Glm4 32b GGUF
Apache-2.0
Remnant-GLM4-32B 是一个基于 GLM4 架构的 32B 参数大语言模型,支持角色扮演和对话式交互,特别适合蝾螈相关的应用场景。
大型语言模型
A
bartowski
2,198
2
Reallybiglust Illustrious Realistic Hibrid Illustrious Sdxl
其他
基于稳定扩散XL的高质量真实感图像生成模型,能够根据文本描述生成细节丰富、照片级真实感的图像。
图像生成
英语
R
John6666
71
1
Multi2convai Quality De Bert
MIT
这是一个针对德语优化的Bert模型,专注于质量领域的文本分类任务。
文本分类
Transformers
德语
M
inovex
116
0
Violet Lyra Gutenberg V4
这是一个基于多个高质量模型合并的混合模型,专注于中文文本生成和对话任务。
大型语言模型
Transformers
V
ohyeah1
13
2
Oute TTS 500M
Apache-2.0
OuteTTS是一个专注于土耳其语的文本转语音(TTS)模型,基于500M参数规模,能够将土耳其语文本转换为自然语音。
语音合成
其他
O
Karayakar
27
0
Huihui Ai.glm 4 9B 0414 Abliterated GGUF
GLM-4-9B-0414-abliterated 是一个基于 GLM 架构的 9B 参数规模的大型语言模型,适用于文本生成任务。
大型语言模型
H
DevQuasar
3,172
3
Tgiangvoice
Spark-TTS 是一个先进的文本转语音系统,利用大语言模型(LLM)的强大能力,实现高准确度和自然流畅的语音合成。
语音合成
T
thinhkosay
16
0
Whisper Small Vi
MIT
基于openai/whisper-small针对越南语语音数据微调的自动语音识别模型,提升越南语转录准确性和鲁棒性
语音识别
Transformers
其他
W
namphungdn134
334
2
Rm
其他
BRIA RMBG v2.0是最先进的背景移除模型,专为高效分离各类图像的前景与背景而设计,适用于非商业用途。
图像分割
Transformers
R
cocktailpeanut
1,769
0
Bge Large Zh V1.5 GGUF
MIT
BAAI/bge-large-zh-v1.5是一个中文句子转换器模型,主要用于特征提取和句子相似度计算。
文本嵌入
中文
B
mradermacher
536
1
LBM Depth
基于潜在桥接匹配(LBM)技术的图像深度估计模型,通过潜在空间桥接实现快速图像转换
3D视觉
Safetensors
L
jasperai
44
3
Ade20k Semantic Eomt Large 512
MIT
该模型基于论文《你的ViT实际上是图像分割模型》开发,是一种用于图像分割任务的视觉Transformer模型。
图像分割
PyTorch
A
tue-mps
108
0
Dogs
Apache-2.0
基于Wan2.1 14B T2V模型训练的LoRA,专注于生成高质量的狗狗视频内容。
文本生成视频
英语
D
Remade-AI
39
1
Light R1 14B DS GGUF
Apache-2.0
Light-R1-14B-DS 是一个14B参数规模的量化大语言模型,支持文本生成任务,适用于资源受限环境下的高效推理。
大型语言模型
L
qihoo360
2,784
9
Huihui Ai.granite Vision 3.2 2b Abliterated GGUF
Granite Vision 3.2 2B Abliterated 是一个视觉语言模型,专注于图像文本转文本任务。
图像生成文本
H
DevQuasar
724
1
Skyreels V1 Hunyuan I2V HFIE
其他
SkyReels-V1-Hunyuan-I2V是由腾讯SkyworkAI开发的文本生成视频模型,基于Hunyuan架构,支持从文本输入生成视频内容。
文本生成视频
英语
S
jbilcke-hf
21
4
MMS TTS THAI FEMALEV2
一个基于VITS架构的泰语女性语音文本转语音(TTS)模型,支持高质量的泰语语音合成。
语音合成
其他
M
VIZINTZOR
47
0
Gte Qwen2 1.5B Instruct GGUF
Apache-2.0
基于阿里巴巴NLP/gte-Qwen2-1.5B-instruct的量化版本,主要用于句子相似度计算和文本嵌入任务。
大型语言模型
英语
G
mradermacher
365
2
Sd35m Sfwbooru Lokr
其他
基于Stable Diffusion 3.5架构的文本生成图像模型,支持高质量图像生成和图像到图像转换
图像生成
S
bghira
317
0
MMS TTS THAI FEMALE PODCAST
这是一个针对泰语优化的文本转语音(TTS)模型,特别适合生成女性播客风格的语音。
语音合成
其他
M
VIZINTZOR
51
0
Asr Conformer Largescaleasr
Apache-2.0
这是一个基于SpeechBrain框架训练的端到端自动语音识别系统,使用Conformer架构在25,000小时英文语音数据上训练。
语音识别
英语
A
speechbrain
92
12
Huihui Ai DeepSeek R1 Distill Llama 70B Abliterated GGUF
DeepSeek-R1-Distill-Llama-70B-abliterated 的 GGUF 量化版本,适用于本地推理,提供多种量化选项以满足不同硬件需求。
大型语言模型
H
bartowski
7,848
25
MMS TTS THAI FEMALEV1
这是一个泰语女性语音文本转语音(TTS)模型,基于VITS架构微调,支持高质量的泰语语音合成。
语音合成
Safetensors
其他
M
VIZINTZOR
81
2
Vitpose Plus Base
Apache-2.0
ViTPose是一个基于视觉Transformer的人体姿态估计模型,采用简洁设计在MS COCO关键点检测基准上取得81.1 AP的优异表现。
姿态估计
Transformers
英语
V
usyd-community
22.26k
10
Vitpose Base
Apache-2.0
基于视觉Transformer的人体姿态估计模型,在MS COCO关键点测试集上达到81.1 AP的优异表现
姿态估计
Transformers
英语
V
usyd-community
761
9
MMS TTS THAI MALEV1
这是一个基于VITS架构的泰语文本转语音(TTS)模型,专门针对男性声音进行微调训练。
语音合成
其他
M
VIZINTZOR
133
5
Summllama3.1 8B GGUF
基于Llama3架构优化的8B参数摘要生成模型,提供多种量化版本
大型语言模型
S
tensorblock
52
0
70B L3.3 Mhnnn X1
基于Llama-3-70B-Instruct微调的大语言模型,专注于创意文本生成和多任务处理
大型语言模型
Transformers
7
Sao10K
150
7
Aimv2 Large Patch14 224.apple Pt
AIM-v2是一个基于timm库的图像编码器模型,适用于图像特征提取任务。
图像分类
Transformers
A
timm
197
0
Sam2 Hiera Tiny.fb R896 2pt1
Apache-2.0
基于HieraDet图像编码器的SAM2模型,专注于图像特征提取任务。
目标检测
Transformers
S
timm
37
0