多数据集训练

# 多数据集训练

Icedit Normal Lora

这是一个基于LoRA技术的图像到图像转换模型，主要用于非商业用途的图像编辑任务。

图像生成英语

Ritrieve Zh V1 GGUF

本项目提供了对 richinfoai/ritrieve_zh_v1 模型的静态量化版本，通过量化处理减少存储空间和计算资源需求，同时保持一定性能。

大型语言模型

Transformers 中文

Chunkformer Large Vie

基于ChunkFormer架构的大规模越南语自动语音识别模型，在约3000小时的越南语公开语音数据上微调，性能优异。

语音识别其他

Bert Uncased Intent Classification

这是一个基于BERT的微调模型，用于将用户输入分类为82种不同的意图，适用于对话系统和自然语言理解任务。

Transformers 英语

Vitpose Plus Large

ViTPose++是基于视觉Transformer的人体姿态估计基础模型，在MS COCO关键点测试集上达到81.1 AP的优异表现。

TIPO是基于文本预采样的提示优化文本转图像系统，通过大型语言模型优化用户输入提示，提升生成模型的质量与易用性。

文本生成图像英语

Vitpose Base Coco Aic Mpii

ViTPose是一个基于视觉Transformer的人体姿态估计模型，通过简单的架构设计在MS COCO等基准上取得了优异表现。

Transformers 英语

Aura-4B是一个基于AuraIndustries/Aura-4B的量化版本，使用llama.cpp进行imatrix量化，支持多种量化类型，适用于文本生成任务。

大型语言模型英语

Viwhisper Medium

针对越南语语音识别任务优化的Whisper-medium模型，在1308小时越南语数据上微调

Transformers 其他

Whisper Ja Anime V0.1

专注于日语动漫领域语音识别的Whisper变体模型，针对动漫音频特点优化

语音识别日语

基于F5架构从头开始训练的印地语文本转语音模型，由印度理工学院马德拉斯分校SPRING实验室开发。

语音合成其他

Llama3 Aloe 8B Alpha GGUF

Llama3-Aloe-8B-Alpha 是一个专注于生物学和医学领域的8B参数大语言模型，提供GGUF格式量化版本

大型语言模型

Transformers 英语

kazRush-ru-kk 是一个基于T5配置的俄语到哈萨克语的翻译模型，在多个开源平行数据集上训练而成。

Transformers 其他

Noobai Xl Nai Xl Epsilonpred10version Sdxl

一个基于SDXL的动漫风格文本生成图像模型，适合新手使用，能够生成高质量的动漫角色和风格化图像。

图像生成英语

Birefnet Matting

BiRefNet是一个基于双边参考的高分辨率二分图像分割模型，专注于背景去除和掩膜生成任务。

TIPO是一个采用LLaMA架构的5亿参数模型，专为文本转图像生成中的提示优化而设计。

文本生成图像英语

Birefnet Lite 2K

高分辨率二分图像分割的双边参考框架，专注于背景去除和掩膜生成任务

Rad Dino Maira 2

RAD-DINO-MAIRA-2 是一种基于DINOv2自监督学习训练的视觉变换器模型，专门用于编码胸部X光片图像。

distilvit是一个基于VIT图像编码器和蒸馏版GPT-2文本解码器的图像转文本模型，能够生成图像的文本描述。

图像生成文本

Octo 是一个用于机器人技术的多模态基础模型，能够通过视觉和语言输入预测机器人动作。

多模态融合

基于自监督学习DINOv2训练的视觉Transformer模型，专门用于编码胸部X光影像

Pix2text Table Rec

基于微软Table Transformer开发的表格结构识别模型，用于文档中的表格检测与识别任务

Japanese Reranker Cross Encoder Large V1

专为日语文本排序任务优化的交叉编码器模型，具有24层和1024隐藏层大小的高性能架构

文本嵌入日语

Japanese Bge Reranker V2 M3 V1

这是一个日语Reranker（交叉编码器）模型，用于文本排序任务，具有24层和1024隐藏层大小。

文本嵌入日语

Japanese Reranker Cross Encoder Small V1

这是一个日语训练的Reranker（交叉编码器）模型，用于文本排序任务。

文本嵌入日语

Japanese Reranker Cross Encoder Xsmall V1

这是一个日语训练的Reranker（交叉编码器）模型，用于文本排序任务。

文本嵌入日语

Whisper Tiny Vi

基于OpenAI Whisper-tiny架构微调的越南语自动语音识别(ASR)模型，在多个越南语数据集上表现出色

Transformers 其他

Finance LLM GGUF

Finance LLM 是一个专注于金融领域的语言模型，基于 Llama 架构，经过 OpenOrca、Lima 和 WizardLM 等数据集的微调。

大型语言模型英语

Deberta V3 Large Mnli Fever Anli Ling Wanli Binary

该模型是基于DeBERTa-v3-large架构的零样本分类模型，主要在五个NLI数据集上训练，适用于遵循原始NLI任务的任务。

Transformers 英语

Silver Retriever Base V1.1

银色检索器模型将波兰语句子或段落编码为768维稠密向量空间，可用于文档检索或语义搜索等任务。

Transformers 其他

PairRM是一个高效的成对奖励模型，用于比较和排序大语言模型的输出候选，支持多种应用场景如RLHF和最佳N采样。

大型语言模型

Transformers 英语

Ag Nli DeTS Sentence Similarity V1

该模型使用SentenceTransformers的Cross-Encoder类进行训练，用于预测两个句子语义相似度的分数。

Transformers 支持多种语言

Wav2vec2 Large Robust 24 Ft Age Gender

该模型以原始音频信号作为输入，输出年龄预测值以及性别概率（儿童/女性/男性），同时输出最后一层transformer的池化状态。

Wav2vec2 Large Robust 6 Ft Age Gender

该模型通过微调Wav2Vec2-Large-Robust，能够从原始音频中预测说话者的年龄和性别。

Silver Retriever Base V1

Silver Retriever是一个针对波兰语的神经检索模型，专门用于句子相似度和段落检索任务。

Transformers 其他

Gpt2 Bangla Summurizer

这是一个基于GPT2架构的孟加拉语文本摘要生成模型，专门针对新闻内容进行优化。

Transformers 其他

All MiniLM L6 V2 Ct2 Int8

这是一个基于MiniLM架构的句子嵌入模型，能将文本映射到384维向量空间，适用于语义搜索和文本相似度任务。

文本嵌入英语

Vegam Whisper Medium Ml

这是将thennal/whisper-medium-ml转换为CTranslate2模型格式的版本，用于马拉雅拉姆语语音识别

语音识别其他

Whisper Small Japanese

该模型是基于openai/whisper-small微调的日语语音识别模型，支持日语语音转文本任务。

Transformers 日语

Whisper Base Japanese

本模型使用Common Voice、JVS和JSUT数据集对openai/whisper-base进行日语微调，适用于日语语音识别任务。

Transformers 日语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24