多数据集训练
Icedit Normal Lora
其他
这是一个基于LoRA技术的图像到图像转换模型,主要用于非商业用途的图像编辑任务。
图像生成
英语
I
RiverZ
1,046
7
Chunkformer Large Vie
基于ChunkFormer架构的大规模越南语自动语音识别模型,在约3000小时的越南语公开语音数据上微调,性能优异。
语音识别
其他
C
khanhld
1,765
12
Vitpose Plus Large
Apache-2.0
ViTPose++是基于视觉Transformer的人体姿态估计基础模型,在MS COCO关键点测试集上达到81.1 AP的优异表现。
姿态估计
Transformers
V
usyd-community
1,731
1
TIPO 500M Ft
其他
TIPO是基于文本预采样的提示优化文本转图像系统,通过大型语言模型优化用户输入提示,提升生成模型的质量与易用性。
文本生成图像
英语
T
KBlueLeaf
10.92k
29
Vitpose Base Coco Aic Mpii
Apache-2.0
ViTPose是一个基于视觉Transformer的人体姿态估计模型,通过简单的架构设计在MS COCO等基准上取得了优异表现。
姿态估计
Transformers
英语
V
usyd-community
38
1
Aura 4B GGUF
Apache-2.0
Aura-4B是一个基于AuraIndustries/Aura-4B的量化版本,使用llama.cpp进行imatrix量化,支持多种量化类型,适用于文本生成任务。
大型语言模型
英语
A
bartowski
290
8
Viwhisper Medium
MIT
针对越南语语音识别任务优化的Whisper-medium模型,在1308小时越南语数据上微调
语音识别
Transformers
其他
V
NhutP
139
4
Whisper Ja Anime V0.1
专注于日语动漫领域语音识别的Whisper变体模型,针对动漫音频特点优化
语音识别
日语
W
efwkjn
205
15
F5 Hindi 24KHz
基于F5架构从头开始训练的印地语文本转语音模型,由印度理工学院马德拉斯分校SPRING实验室开发。
语音合成
其他
F
SPRINGLab
1,430
18
Kazrush Ru Kk
Apache-2.0
kazRush-ru-kk 是一个基于T5配置的俄语到哈萨克语的翻译模型,在多个开源平行数据集上训练而成。
机器翻译
Transformers
其他
K
deepvk
332
8
Noobai Xl Nai Xl Epsilonpred10version Sdxl
其他
一个基于SDXL的动漫风格文本生成图像模型,适合新手使用,能够生成高质量的动漫角色和风格化图像。
图像生成
英语
N
John6666
87
3
Birefnet Matting
BiRefNet是一个基于双边参考的高分辨率二分图像分割模型,专注于背景去除和掩膜生成任务。
图像分割
B
ZhengPeng7
1,578
18
TIPO 500M
其他
TIPO是一个采用LLaMA架构的5亿参数模型,专为文本转图像生成中的提示优化而设计。
文本生成图像
英语
T
KBlueLeaf
2,013
51
Birefnet Lite 2K
高分辨率二分图像分割的双边参考框架,专注于背景去除和掩膜生成任务
图像分割
Safetensors
B
ZhengPeng7
3,400
8
Rad Dino Maira 2
其他
RAD-DINO-MAIRA-2 是一种基于DINOv2自监督学习训练的视觉变换器模型,专门用于编码胸部X光片图像。
图像嵌入
Transformers
R
microsoft
9,414
11
Test Push
Apache-2.0
distilvit是一个基于VIT图像编码器和蒸馏版GPT-2文本解码器的图像转文本模型,能够生成图像的文本描述。
图像生成文本
Transformers
T
tarekziade
17
0
Octo Base 1.5
MIT
Octo 是一个用于机器人技术的多模态基础模型,能够通过视觉和语言输入预测机器人动作。
多模态融合
Transformers
O
rail-berkeley
87
14
Rad Dino
其他
基于自监督学习DINOv2训练的视觉Transformer模型,专门用于编码胸部X光影像
图像分类
Transformers
R
microsoft
411.96k
48
Pix2text Table Rec
MIT
基于微软Table Transformer开发的表格结构识别模型,用于文档中的表格检测与识别任务
文字识别
Transformers
P
breezedeus
1,124
2
Japanese Reranker Cross Encoder Large V1
MIT
专为日语文本排序任务优化的交叉编码器模型,具有24层和1024隐藏层大小的高性能架构
文本嵌入
日语
J
hotchpotch
2,959
15
Japanese Bge Reranker V2 M3 V1
MIT
这是一个日语Reranker(交叉编码器)模型,用于文本排序任务,具有24层和1024隐藏层大小。
文本嵌入
日语
J
hotchpotch
1,151
15
Japanese Reranker Cross Encoder Small V1
MIT
这是一个日语训练的Reranker(交叉编码器)模型,用于文本排序任务。
文本嵌入
日语
J
hotchpotch
209
3
Japanese Reranker Cross Encoder Xsmall V1
MIT
这是一个日语训练的Reranker(交叉编码器)模型,用于文本排序任务。
文本嵌入
日语
J
hotchpotch
7,041
7
Whisper Tiny Vi
Apache-2.0
基于OpenAI Whisper-tiny架构微调的越南语自动语音识别(ASR)模型,在多个越南语数据集上表现出色
语音识别
Transformers
其他
W
doof-ferb
44
2
Finance LLM GGUF
其他
Finance LLM 是一个专注于金融领域的语言模型,基于 Llama 架构,经过 OpenOrca、Lima 和 WizardLM 等数据集的微调。
大型语言模型
英语
F
TheBloke
641
21
Deberta V3 Large Mnli Fever Anli Ling Wanli Binary
MIT
该模型是基于DeBERTa-v3-large架构的零样本分类模型,主要在五个NLI数据集上训练,适用于遵循原始NLI任务的任务。
文本分类
Transformers
英语
D
MoritzLaurer
30
0
Silver Retriever Base V1.1
银色检索器模型将波兰语句子或段落编码为768维稠密向量空间,可用于文档检索或语义搜索等任务。
文本嵌入
Transformers
其他
S
ipipan
862
9
Pairrm
MIT
PairRM是一个高效的成对奖励模型,用于比较和排序大语言模型的输出候选,支持多种应用场景如RLHF和最佳N采样。
大型语言模型
Transformers
英语
P
llm-blender
6,004
198
Ag Nli DeTS Sentence Similarity V1
Apache-2.0
该模型使用SentenceTransformers的Cross-Encoder类进行训练,用于预测两个句子语义相似度的分数。
文本嵌入
Transformers
支持多种语言
A
abbasgolestani
982
0
Wav2vec2 Large Robust 24 Ft Age Gender
该模型以原始音频信号作为输入,输出年龄预测值以及性别概率(儿童/女性/男性),同时输出最后一层transformer的池化状态。
音频分类
Transformers
W
audeering
44.13k
33
Wav2vec2 Large Robust 6 Ft Age Gender
该模型通过微调Wav2Vec2-Large-Robust,能够从原始音频中预测说话者的年龄和性别。
音频分类
Transformers
W
audeering
19.29k
2
Silver Retriever Base V1
Silver Retriever是一个针对波兰语的神经检索模型,专门用于句子相似度和段落检索任务。
文本嵌入
Transformers
其他
S
ipipan
554
11
Gpt2 Bangla Summurizer
这是一个基于GPT2架构的孟加拉语文本摘要生成模型,专门针对新闻内容进行优化。
文本生成
Transformers
其他
G
faridulreza
18
0
All MiniLM L6 V2 Ct2 Int8
Apache-2.0
这是一个基于MiniLM架构的句子嵌入模型,能将文本映射到384维向量空间,适用于语义搜索和文本相似度任务。
文本嵌入
英语
A
jncraton
40
0
Vegam Whisper Medium Ml
MIT
这是将thennal/whisper-medium-ml转换为CTranslate2模型格式的版本,用于马拉雅拉姆语语音识别
语音识别
其他
V
smcproject
83
5
Whisper Small Japanese
Apache-2.0
该模型是基于openai/whisper-small微调的日语语音识别模型,支持日语语音转文本任务。
语音识别
Transformers
日语
W
Ivydata
356
5
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT数据集对openai/whisper-base进行日语微调,适用于日语语音识别任务。
语音识别
Transformers
日语
W
Ivydata
137
3
Binarization Segformer B3
Openrail
基于SegFormer-B3架构微调的文档图像二值化模型,在DIBCO评估指标上表现优异
图像分割
Transformers
B
DiTo97
85
1
Stt De Fastconformer Hybrid Large Pc
这是一个基于FastConformer架构的德语自动语音识别模型,采用转换器和CTC混合训练方式,参数规模约115M。
语音识别
德语
S
nvidia
1,017
4
Reward Model Deberta V3 Large V2
MIT
该奖励模型经过训练,能够预测在给定问题下,人类会认为哪个生成的答案更好。
大型语言模型
Transformers
英语
R
OpenAssistant
11.15k
219