低资源高效训练

# 低资源高效训练

Arsh-llm 是一个基于Llama架构的5000万参数语言模型，擅长生成创意故事、连贯文本和实用代码。

大型语言模型

Transformers 英语

Mamba Nli Ensemble

基于Mamba状态空间模型在COMP34812数据集上微调的二元自然语言推理分类器

文本分类支持多种语言

Colqwen2.5 3b Multilingual V1.0

基于Qwen2.5-VL-3B-Instruct并采用ColBERT策略的多语言视觉检索器，在Vidore基准测试中表现优异

文本生成图像支持多种语言

Llama Bodo Translation Model

基于Meta-Llama-3.1-8B的4位量化版本微调的博多语-英语双向翻译模型，使用Unsloth优化训练速度

大型语言模型

Transformers 支持多种语言

Colqwen2.5 3b Multilingual

基于Qwen2.5-VL-3B-Instruct的多语言视觉检索器，采用ColBERT策略，在Vidore基准测试中表现优异

文本生成图像支持多种语言

基于SmolVLM-Instruct-500M与ColBERT策略的视觉检索模型，能高效通过视觉特征索引文档

文本生成图像英语

基于PaliGemma-3B架构的视觉-语言模型，专门针对皮肤病图像分析任务进行微调，可辅助识别各种皮肤状况。

图像生成文本

Transformers 英语

Suzume Llama 3 8B Japanese

基于Llama 3的日语微调模型，专为日语对话优化

大型语言模型

Turkish Gpt2 Large 750m Instruct V0.1

基于ytu-ce-cosmos/turkish-gpt2-large开发的土耳其语指令微调语言模型，通过3.5万条指令数据集微调

大型语言模型

Transformers 其他

Airavata是基于7B参数的OpenHathi模型在IndicInstruct数据集上微调而成的多语言大语言模型，支持英语和印地语。

大型语言模型支持多种语言

Gpt2 Finetuned Cnn Summarization V1

基于GPT-2微调的文本摘要生成模型

Distilbert Base Squad2 Custom Dataset

基于Distilbert_Base微调的SQuAD2.0及自定义问答数据集模型，专注于高效问答任务

Distilroberta Base Testingsb Testingsb

该模型是基于distilroberta-base在未知数据集上微调的版本，主要用于文本处理任务。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24