中英双语

# 中英双语

Wr30a Deep 7B 0711 GGUF

这是 prithivMLmods/WR30a-Deep-7B-0711 模型的静态量化版本，支持多种自然语言处理和视觉理解任务。

图像生成文本

Transformers 支持多种语言

GLM 4.1V 9B Thinking AWQ

GLM-4.1V-9B-Thinking是一款强大的视觉语言模型（VLM），专注于多模态理解和推理，通过AWQ量化版本提供高效推理能力。

文本生成图像

GLM 4.1V 9B Thinking

GLM-4.1V-9B-Thinking是基于GLM-4-9B-0414基础模型的开源视觉语言模型，专注于提升复杂任务中的推理能力，支持64k上下文长度和4K图像分辨率。

图像生成文本

Transformers 支持多种语言

Deepseek R1 0528 AWQ

DeepSeek R1 0528的AWQ量化模型，支持使用vLLM在8块80GB GPU上以全上下文长度运行。

大型语言模型

Transformers 支持多种语言

cognitivecomputations

GLM 4 9B 0414 GGUF

GLM-4-9B-0414是GLM家族中的轻量级成员，拥有90亿参数，在数学推理和通用任务上表现出色，为资源受限场景提供了高效的解决方案。

大型语言模型支持多种语言

Openba V1 Based

OpenBA 是一个开源的 150 亿参数双语非对称序列到序列模型，从头开始预训练。

大型语言模型

Transformers 支持多种语言

GLM 4 32B 0414 8bit

该模型是从THUDM/GLM-4-32B-0414转换而来的8位量化MLX格式大语言模型，支持中英文文本生成任务。

大型语言模型支持多种语言

Qwen2.5 7B YOYO Super

Qwen2.5-7B-YOYO-super 是一个通过合并基础模型和微调模型优化的开源大语言模型，专注于提升指令跟随、数学和编码能力。

大型语言模型

Transformers 支持多种语言

Mixtex Finetune

MixTex base_ZhEn 是一个支持中文和英语的图像转文本模型，基于MIT许可证发布。

图像生成文本支持多种语言

Spaceexploreai Small Base Regression 27M

基于深度学习的投资预测系统，采用Transformer架构，融合DeepSeep-V3和LLama3设计结构，用于股价走势预测和技术分析。

大型语言模型支持多种语言

Qwen2.5 VL 3B Instruct GPTQ Int4

这是Qwen2.5-VL-3B-Instruct模型的GPTQ-Int4量化版本，适用于图像文本到文本的多模态任务，支持中文和英语。

图像生成文本

Transformers 支持多种语言

Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态语言模型，基于Qwen2.5架构，支持处理图像、视频、音频和文本输入，并输出文本。

多模态融合支持多种语言

HealthGPT 是一个专为统一的多模态医疗任务而开发的模型，支持英文和中文。

大型语言模型支持多种语言

Deepseek R1 Medical Response

这是一个基于DeepSeek-R1微调的医疗领域问答模型，专注于处理医疗相关的文本生成任务。

大型语言模型

Transformers 英语

ARWKV-R1-1B5 是基于RNN的70亿参数模型的早期预览版，通过从DeepSeek-R1-Distill-Qwen-1.5B进行三阶段知识蒸馏训练而成，上下文长度为2k。

大型语言模型

Transformers 支持多种语言

Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态大语言模型，基于Qwen2.5架构，支持处理文本、图像、视频和音频输入，并生成文本输出。

多模态融合

Safetensors 支持多种语言

FineMedLM-o1是一款专为高级医学推理设计的专业医疗大语言模型，采用多步推理机制，在给出最终答复前会反复推敲并完善其思考过程。

大型语言模型

Transformers 支持多种语言

Glm Edge V 2b Gguf

支持图像文本到文本转换的高效生成模型，适用于多种应用场景

图像生成文本支持多种语言

Oryx-1.5-7B是基于Qwen2.5语言模型开发的7B参数模型，支持32K tokens上下文窗口，专注于高效处理任意空间尺寸和时长的视觉输入。

文本生成视频

Safetensors 支持多种语言

Yi 1.5 9B Chat 16K Abliterated

基于大语言模型的消融版本，性能优于原始模型，支持中英文和长上下文处理。

大型语言模型

Transformers 支持多种语言

Paligemma 3B Chat V0.2

基于google/paligemma-3b-mix-448微调的多模态对话模型，专为多轮对话场景优化

文本生成图像

Transformers 支持多种语言

Cogvlm2 Llama3 Chat 19B Int4

CogVLM2是基于Meta-Llama-3-8B-Instruct构建的多模态对话模型，支持中英文，具备8K上下文长度和1344*1344分辨率图像处理能力。

文本生成图像

Transformers 英语

Minicpm 1B Sft Bf16

MiniCPM是面壁智能与清华大学自然语言处理实验室联合研发的端侧大语言模型系列，核心模型仅含12亿非词嵌入参数，在多项评测中超越更大规模的开源模型。

大型语言模型

Transformers 支持多种语言

MiniCPM-V是一款高效轻量级多模态模型，专为终端设备部署优化，支持中英双语交互，性能超越同规模模型。

文本生成图像

Minicpm 2B Dpo Bf16

MiniCPM是由面壁智能与清华大学自然语言处理实验室联合开源的一系列端侧大语言模型，核心语言模型MiniCPM-2B仅含24亿非词嵌入参数。

大型语言模型

Transformers 支持多种语言

Minicpm 2B Sft Fp32

MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧语言大模型，主体语言模型 MiniCPM-2B 仅有 24亿（2.4B）的非词嵌入参数量。

大型语言模型

Transformers 支持多种语言

Nanbeige 16B Base 32K GGUF

Nanbeige 16B Base 32K是由Nanbeige LLM Lab开发的大语言模型，支持中英文，具有32K上下文长度，适用于多种文本生成任务。

大型语言模型支持多种语言

深言科技联合清华大学NLP实验室开源的中英双语大语言模型，基于数万亿token高质量数据预训练，具备8K上下文窗口处理能力

大型语言模型

Transformers 支持多种语言

Chinese Llama 2 1.3b

Chinese-LLaMA-2-1.3B是基于Meta发布的Llama-2模型的中文基础模型，扩充了中文词表并进行了中文预训练，提升了中文基础语义理解能力。

大型语言模型

Transformers 支持多种语言

Codellama Chat 13b Chinese

CodeLlaMa是专为代码辅助设计的模型，擅长处理编程类问题解答，支持中英文多轮对话。

大型语言模型

Transformers 支持多种语言

Vicuna Baichuan 13b Chat

基于Baichaun-13B-chat的Vicuna微调对话模型，在通用对话和医疗咨询方面表现优异。

大型语言模型

Transformers 支持多种语言

Ziya Writing LLaMa 13B V1

姜子牙写作大模型V1是基于LLaMa的130亿参数指令微调模型，专注于写作任务，擅长处理公文报告、讲稿书信、创意文案等多类写作任务。

大型语言模型

Transformers 支持多种语言

Moss Moon 003 Sft

MOSS是一个支持插件增强的开源对话语言模型，参数量160亿，支持中英文对话及工具调用能力。

大型语言模型

Transformers 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24