高精度推理

# 高精度推理

Nvidia OpenReasoning Nemotron 32B GGUF

NVIDIA OpenReasoning - Nemotron - 32B的量化版本，通过llama.cpp进行量化处理，减少模型存储和计算资源需求，便于部署。

大型语言模型

Nvidia OpenReasoning Nemotron 14B GGUF

这是NVIDIA的OpenReasoning-Nemotron-14B模型的量化版本，旨在提升模型在不同硬件上的运行效率和性能。

大型语言模型

Nvidia OpenReasoning Nemotron 7B GGUF

NVIDIA OpenReasoning-Nemotron-7B模型的量化版本，使用llama.cpp工具进行量化处理，提升在不同硬件上的运行效率和性能。

大型语言模型

Ddh0 Cassiopeia 70B GGUF

这是对ddh0/Cassiopeia-70B模型进行量化处理后的版本，通过量化技术减少模型存储空间并提升推理速度。

大型语言模型

T-pro-it-2.0 是基于 Qwen 3 模型家族构建的模型，结合了持续预训练和对齐技术，能在多种任务中提供高质量的推理和响应。

大型语言模型

Transformers 其他

Llama 3.3 70B Instruct FP8

IONOS Llama 3.3 70B Instruct FP8 是 Meta 的 Llama 3.3 70B Instruct 模型的优化版本，采用 FP8 量化技术提升性能和效率，适合生产环境部署。

大型语言模型

Transformers 支持多种语言

Clip Finetuned Deepfashion

这是一个自动生成的🤗 Transformers模型卡片，缺少具体模型信息。

大型语言模型

这是一个Hugging Face模型中心的Transformer模型，具体信息待补充

大型语言模型

Polaris 4B Preview F32 GGUF

Polaris是一种开源的后训练方法，利用强化学习优化和增强模型，提升推理能力。

大型语言模型

Transformers 英语

这是一个自动生成的transformers模型卡片，具体信息待补充。

大型语言模型

Um P2 Fine Tuned Llama Full 2

这是一个已推送到Hub上的transformers模型，具体功能和用途待补充。

大型语言模型

Skywork Skywork OR1 7B GGUF

Skywork-OR1-7B 是一个 7B 参数规模的大语言模型，提供多种量化版本以适应不同硬件需求。

大型语言模型

Andrewzh Absolute Zero Reasoner Coder 14b GGUF

基于andrewzh的Absolute_Zero_Reasoner-Coder-14b模型，使用llama.cpp进行imatrix量化的版本，适用于推理和代码生成任务。

大型语言模型

Voicelab Trurl 2 13b GGUF

trurl-2-13b是一个13B参数规模的大语言模型，提供GGUF格式的量化版本，适用于多种自然语言处理任务。

大型语言模型支持多种语言

Servicenow AI Apriel Nemotron 15b Thinker GGUF

这是一个由ServiceNow语言模型（SLAM）实验室构建的15B参数大语言模型，经过llama.cpp工具量化处理，适用于本地推理部署。

大型语言模型

Qwen3 32B Quantized.w4a16

Qwen3-32B的INT4量化版本，通过权重量化减少75%的磁盘和GPU内存需求，保持高性能

大型语言模型

Skin Disease Classifier

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途尚未明确说明。

大型语言模型

muhammadnoman76

Qwen3 32B FP8 Dynamic

基于Qwen3-32B进行FP8动态量化的高效语言模型，显著降低内存需求并提升计算效率

大型语言模型

Qwen3 4B Mishima Imatrix GGUF

基于Qwen3-4B的Mishima Imatrix量化版本，通过特定数据集增强散文风格生成能力

大型语言模型

Mlabonne Qwen3 8B Abliterated GGUF

这是Qwen3-8B-abliterated模型的量化版本，使用llama.cpp进行量化，适用于文本生成任务。

大型语言模型

Qwen3 30B A3B Base

Qwen3-30B-A3B-Base是Qwen系列最新一代大语言模型，在训练数据、模型架构和优化技术等方面有诸多改进，提供更强大的语言处理能力。

大型语言模型

Qwen Qwen3 8B GGUF

Qwen3-8B的量化版本，使用llama.cpp的imatrix选项进行量化，适用于文本生成任务。

大型语言模型

Kogptv3 Contextbasedv4

该模型是一个基于transformers库的模型，具体功能和用途需要进一步信息补充。

大型语言模型

该模型是一个基于transformers库的模型，具体用途和功能需要进一步信息确认。

大型语言模型

Imagecaptioning4

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途尚未明确说明。

大型语言模型

eduardo-bolognini

Gemma 3 4B It Qat GGUF

Google出品的Gemma 3 4B IT模型，支持多模态输入和长上下文处理，适用于文本生成和图像理解任务。

图像生成文本

lmstudio-community

Dreamgen Lucid V1 Nemo GGUF

基于 dreamgen/lucid-v1-nemo 的量化模型，使用 llama.cpp 进行多种量化处理，适用于文本生成任务。

大型语言模型英语

Sparklerl 7B Stage1

这是一个已发布在Hub上的transformers模型，具体功能和详细信息待补充。

大型语言模型

sparkle-reasoning

Sparklerl 7B Stage2 Aug

这是一个自动生成的transformers模型卡片，具体信息待补充。

大型语言模型

sparkle-reasoning

T5 Typo Correction V3

这是一个由系统自动生成的transformers模型卡片，具体模型信息待补充。

大型语言模型

Openclip ViT G FARE2

该模型是一个基于Transformers架构的模型，具体用途和功能需要进一步信息确认。

大型语言模型

News Classification

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途需进一步补充信息。

大型语言模型

phi-4是微软研究院开发的开源语言模型，专注于高质量数据和推理能力，适用于内存/计算受限环境。

大型语言模型支持多种语言

Reasonflux F1 7B

ReasonFlux-F1-7B是基于思维模板扩展的分层大语言模型推理模型，通过模板增强推理轨迹微调而成，在多项推理任务中表现优异。

大型语言模型

ReasonFlux-F1-32B是基于思维模板扩展的分层大语言模型，通过模板增强推理轨迹微调，在推理任务中表现优异。

大型语言模型

Deepfake Detector Faceforensics

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途需进一步补充信息。

大型语言模型

Full Finetuned Bert Qa

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途需要进一步补充信息。

大型语言模型

Alphatable 1.5B

该模型是一个基于transformers库的模型，具体用途和功能未明确说明。

大型语言模型

Reasoning TIES Coder V1.1

这是一个使用TIES方法合并的32B参数规模的大语言模型，基于Rombo-LLM-V3.1-QWQ-32b基础模型融合了多个FuseAI预览模型

大型语言模型

BenevolenceMessiah

Bytedance Research.ui TARS 72B SFT GGUF

字节跳动研究团队发布的72B参数规模的多模态基础模型，专注于图像文本转文本任务

图像生成文本

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24