低资源高效

# 低资源高效

Gemma 3n是谷歌推出的轻量级多模态模型，基于Transformer架构，支持文本、音频和视觉（图像和视频）输入，适用于低资源设备。

图像生成文本

Phi 4 Reasoning Plus

Phi-4推理增强版是微软研究院开发的140亿参数开源推理模型，通过监督微调和强化学习优化，专注于数学、科学和编程领域的高级推理能力。

大型语言模型

Transformers 支持多种语言

Phi 4 Reasoning Plus GGUF

Phi-4-reasoning-plus 是由微软研究院开发的开源推理模型，专注于数学、科学和编程领域的高级推理能力。

大型语言模型支持多种语言

T5 Small Finetuned Xsum

基于T5-small模型在XSum数据集上微调的文本摘要模型

Llama 3.1 8B SuperNova EtherealHermes GGUF

基于Llama-3.1架构的8B参数大语言模型，提供多种量化版本的GGUF格式文件

大型语言模型英语

Ket5 News Summarizer

基于T5架构的韩语文本摘要模型，专门针对新闻报道进行微调训练

文本生成支持多种语言

Aya Vision 8B是一个开放权重的80亿参数多语言视觉语言模型，支持23种语言的视觉和语言任务。

图像生成文本

Transformers 支持多种语言

Qwen2.5 0.5B Portuguese V1

基于Qwen2.5-0.5B-Instruct微调的葡萄牙语大语言模型，专注于文本生成任务

大型语言模型其他

DRAMA-large (0.3B) 是一个基于剪枝后大语言模型架构构建的稠密检索模型，针对高效且可泛化的多语言文本检索任务进行优化。

Transformers 支持多种语言

Falcon3-10B-Instruct是Falcon3系列的开源基础模型，拥有100亿参数，专注于高质量指令跟随任务，支持多语言处理，上下文长度可达32K tokens。

大型语言模型

14B Qwen2.5 Kunou V1

14B-Qwen2.5-Kunou-v1是一个通用型角色扮演模型，开发规划较为随性，是小体量的14B版本，使用了优质、精炼的数据集，表现相当出色。

大型语言模型

Granite Embedding 30m English

IBM Granite Embedding 30M English 是一个基于 transformer 架构的英文文本嵌入模型，由 IBM 开发并发布。

Transformers 英语

BübleLM是一个小型德语语言模型，基于Gemma-2-2B架构优化，采用自定义德语分词器提升性能

大型语言模型

Transformers 德语

Llama 3.1 Storm 8B GGUF

Llama-3.1-Storm-8B是基于Llama-3.1-8B-Instruct构建的改进模型，在多项基准测试中表现优异，适用于对话和函数调用任务。

大型语言模型支持多种语言

Mistral Nemo Instruct 2407 Awq

Mistral-Nemo-Instruct-2407 是一个基于 Mistral 架构的指令微调大语言模型，适用于多种自然语言处理任务。

大型语言模型

Serafim 100m Portuguese Pt Sentence Encoder

基于sentence-transformers的葡萄牙语句子编码器，可将文本映射到768维向量空间，适用于语义搜索和聚类任务。

文本嵌入其他

采用3层Transformer架构的顶尖句子分割技术，支持多语言文本分割。

Transformers 支持多种语言

segment-any-text

OpenHermes 2.5 Mistral 7B 是基于 Mistral 架构微调的最先进模型，是 OpenHermes 2 的延续版本，在额外代码数据集上进行了训练。

大型语言模型

Ko Llama 3 8B Instruct

Ko-Llama-3-8B-Instruct 是一个专为提升韩语语言模型性能而开发的模型，基于 Meta-Llama-3-8B-Instruct 进行监督微调。

大型语言模型

Transformers 支持多种语言

Zion Alpha Instruction Tuned SLERP

Zion_Alpha_Instruction_Tuned_SLERP 是一款基于希伯来语训练的创新型语言模型，在情感分析和自然语言推理等任务中表现卓越。

大型语言模型

Transformers 支持多种语言

SicariusSicariiStuff

Nllb 200 Distilled 600M En Zh CN

这是一个基于Meta公司NLLB-200-distilled-600M模型微调的机器翻译模型，专门用于英语到简体中文的翻译任务。

Transformers 支持多种语言

Llama 3 Typhoon V1.5 8b Instruct

基于Llama3-8B架构开发的80亿参数指令调优泰语大语言模型，支持泰语和英语。

大型语言模型

Transformers 支持多种语言

Llama 3 Wissenschaft 8B

基于Llama-3-8b构建的多语言混合模型，融合了德语、意大利语和英语能力

大型语言模型

Llama 3 8B Summarization QLoRa

基于Meta-Llama-3-8B模型在scitldr数据集上使用QLoRa技术微调的摘要生成模型

大型语言模型

Llama 3 8B Dutch

基于Llama 3 8B的荷兰语对话模型，通过ORPO方法在荷兰语反馈数据集上优化训练

大型语言模型

Transformers 其他

Snowflake Arctic Embed Xs

Snowflake Arctic Embed XS 是一个轻量级的句子嵌入模型，专注于句子相似度和特征提取任务。

Rakutenai 7B Instruct

RakutenAI-7B-instruct是基于Mistral-7B架构优化的日语和英语大语言模型，在日语理解基准测试中表现优异，同时保持英语能力竞争力。

大型语言模型

Transformers 支持多种语言

Bloomz 560m Reranking

基于Bloomz-560m构建的双语重排序模型，用于衡量查询与上下文的语义相关性，支持法语和英语

大型语言模型

Transformers 支持多种语言

Prodigy 7B GGUF Imatrix

Prodigy_7B的GGUF-Imatrix量化版本，采用重要性矩阵技术提升量化质量

大型语言模型

Qra是由波兰国家信息处理研究所与格但斯克理工大学联合开发的波兰语优化大语言模型系列，基于TinyLlama-1.1B初始化并在900亿波兰语token上训练

大型语言模型

Normistral 7b Warm

NorMistral-7b-warm 是一个基于 Mistral-7b-v0.1 初始化的挪威语大型语言模型，在挪威公开文本上进行了持续预训练。

大型语言模型

Transformers 其他

Mobilellama 1.4B Chat

MobileLLaMA-1.4B-Chat 是基于 MobileLLaMA-1.4B-Base 微调而来的聊天模型，使用了 ShareGPT 数据集进行监督式指令微调。

大型语言模型

Mt5 Base Thaisum Text Summarization

基于mT5架构微调的泰语文本摘要模型，支持生成40-140字符的简洁摘要

Transformers 其他

Btlm 3b 8k Chat

BTLM-3B-8k-chat是基于BTLM-3B-8K-base开发的对话版本，采用DPO方法优化，专为符合人类偏好的对话场景设计。

大型语言模型

Transformers 英语

Saiga Mistral 7b GPTQ

Saiga Mistral 7B是基于Mistral架构的俄语大语言模型，由Ilya Gusev开发。

大型语言模型

Openhermes 2.5 Mistral 7B GPTQ

OpenHermes 2.5是基于Mistral-7B微调的高级语言模型，专注于代码生成和通用任务处理，性能优于前代版本。

大型语言模型

Transformers 英语

Openchat 3.5 GPTQ

OpenChat 3.5 7B是基于Mistral架构的7B参数大语言模型，由OpenChat团队开发，采用Apache 2.0许可证发布。

大型语言模型

Distilcamembert Lleqa

基于法语法律信息检索数据集LLeQA训练的句子嵌入模型，适用于法律文本的语义搜索和聚类任务

文本嵌入法语

maastrichtlawtech

Tst Summarization

基于google/pegasus-xsum微调的新闻摘要生成模型，在cnn_dailymail数据集上训练

Transformers 英语

Scandi Nli Base

基于NbAiLab/nb-bert-base微调的自然语言推理模型，支持丹麦语、挪威博克马尔语和瑞典语

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24