低资源高性能

# 低资源高性能

Qwen3 30B A1.5B High Speed

Qwen3-30B的高速优化版本，通过减少激活专家数量实现推理速度翻倍，适用于需要快速响应的文本生成场景

大型语言模型

Falcon H1 34B Base

Falcon-H1是由阿联酋技术创新研究院开发的混合架构语言模型，结合了Transformers和Mamba架构的优势，支持多语言处理。

大型语言模型

Transformers 支持多种语言

Bamba-9B-v2 是基于 Mamba-2 架构构建的仅解码器语言模型，专注于文本生成任务，性能优于 Llama 3.1 8B。

大型语言模型

ibm-ai-platform

Llama 3.3 70B Instruct Quantized.w4a16

基于Meta-Llama-3.1架构的量化优化模型，支持多语言，适用于商业和研究场景，在减少资源需求的同时保持高性能。

大型语言模型

Transformers 支持多种语言

Minitron 8B Base

Minitron-8B-Base是通过剪裁Nemotron-4 15B获得的大型语言模型，采用蒸馏持续训练方法，相比从头训练节省了40倍的训练token和1.8倍的计算成本。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24