大模型推理

# 大模型推理

LGAI EXAONE EXAONE 4.0 32B GGUF

LGAI-EXAONE的EXAONE-4.0-32B模型的量化版本，使用llama.cpp工具进行量化处理，旨在为不同硬件条件的用户提供更灵活的使用选择。

大型语言模型

Hunyuan A13B Instruct 5bit

基于腾讯混元A13B大模型转换的5bit量化版本，适用于苹果芯片的MLX框架

大型语言模型

Medgemma 27b Text It 4bit

MedGemma-27B-Text-IT-4bit是基于Google的MedGemma-27B-Text-IT模型转换而来的MLX格式模型，专为医疗和临床推理任务优化。

大型语言模型

Parakeet Tdt 0.6b V2 Onnx

NVIDIA Parakeet TDT 0.6B V2 是一个基于自动语音识别（ASR）任务的模型，适用于英语语音转文本任务。

语音识别英语

Cohereforai.c4ai Command R 08 2024 GGUF

CohereForAI发布的Command R模型量化版本，旨在让知识为大众所用。

大型语言模型

rank1-32b是一个基于Qwen2.5-32B训练的信息检索重排序模型，通过生成推理链进行相关性判断

大型语言模型

Transformers 英语

EXAONE 3.5 32B Instruct GGUF

EXAONE-3.5-32B-Instruct是一个32B参数的大型语言模型，支持指令跟随和对话任务。

大型语言模型支持多种语言

Meta Llama 3.3 70B Instruct AWQ INT4

Llama 3.3 70B Instruct AWQ INT4 是 Meta Llama 3.3 70B Instruct 模型的 4 位量化版本，适用于多语言对话用例，优化了文本生成任务。

大型语言模型

Transformers 支持多种语言

Cogvideox1.5 5B I2V

CogVideoX 是一个开源视频生成模型，支持从图像生成视频，类似于清影平台。

图像生成视频英语

Llama 3.1 70B Japanese Instruct 2407

这是一个基于Meta-Llama-3.1-70B-Instruct持续预训练的日语大语言模型，支持日语和英语。

大型语言模型

Transformers 支持多种语言

Llama 3 8B Instruct QServe G128

Llama 3 是 Meta 公司推出的下一代开源大语言模型，具有更强的性能和更广泛的应用场景。

大型语言模型

ARIA 70B V2 GGUF

ARIA 70B V2 是一个基于 Llama 2 架构的大规模语言模型，支持法语和英语，专注于文本生成任务。

大型语言模型支持多种语言

Fiction.live Kimiko V2 70B GGUF

Fiction Live Kimiko V2 70B 是一个基于 Llama 2 架构的大型语言模型，提供多种量化格式，适用于不同推理场景。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24