多场景适用

# 多场景适用

Voc2vec Hubert Ls Pt

voc2vec是专为非语言人类数据设计的基础模型，基于HuBERT框架构建，在125小时非语言音频数据上预训练。

Transformers 英语

Nano Image Captioning

这是一个基于bert-tiny和vit-tiny的轻量级图像字幕生成模型，仅重40MB，在CPU上运行速度极快。

图像生成文本

Transformers 英语

Vitpose Plus Huge

ViTPose++是基于视觉Transformer的人体姿态估计基础模型，在MS COCO关键点测试集上达到81.1 AP的优异表现。

YOLOv8 是 Ultralytics 开发的一个高效的目标检测模型，基于 YOLO (You Only Look Once) 架构，适用于实时目标检测任务。

Transformers 英语

开放剪辑是一个零样本图像分类模型，能够在不进行微调的情况下对图像进行分类。

Profanity Model 3.1

基于20万条文本数据训练而成的脏话检测模型，用于识别文本中的不当语言。

YOLOv10是一种实时端到端目标检测模型，具有高效的推理速度和较高的检测精度。

YOLOv10是清华大学MIG实验室开发的高效实时目标检测模型，提供端到端检测能力。

Blip Large Long Cap

基于BLIP微调的长文本图像描述生成器，适用于文生图提示和图像数据集标注

图像生成文本

Whisper Small Dialect Classifier Cross

该模型是基于whisper-small架构的方言分类器，用于识别和分类特定方言的语音输入。

基于VIT图像编码器和蒸馏版GPT-2文本解码器的视觉语言模型，用于图像描述生成任务

图像生成文本

Bert Finetuned Phishing

在钓鱼数据集上微调的BERT模型，能检测网址、邮件、短信和网站中的钓鱼攻击

Transformers 英语

Llama 2 70B Chat GGUF

Llama 2 70B Chat是由Meta开发的70亿参数大型语言模型，专为对话任务优化。

大型语言模型英语

Autotrain Multifamily V2 3736899404

这是一个使用AutoTrain训练的多类别图像分类模型，在验证集上达到了78.6%的准确率。

基于Anything V3微调的动漫风格Stable Diffusion模型，支持通过danbooru标签生成高质量图像

图像生成英语

Whisper Medium Tr

该模型是基于OpenAI的Whisper Medium模型在土耳其语数据集上微调的语音识别模型，词错误率显著降低。

Transformers 其他

Opus Mt Tc Big En Pt

这是一个用于英语到葡萄牙语（包括巴西葡萄牙语）的神经机器翻译模型，属于OPUS-MT项目的一部分。

Transformers 支持多种语言

It5 Base Summarization

基于gsarti/it5-base微调的意大利语文本抽象摘要生成模型，能够生成意大利语文本的摘要。

文本生成其他

Image Captioning Portuguese

这是一个能够将图像转换为葡萄牙语描述的模型，基于ViT和GPT2架构训练。

图像生成文本其他

adalbertojunior

T5 Base Spellchecker

基于T5-Base变换器构建的拼写检查器，用于文本拼写错误的检测和修正。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24