商业研究通用

# 商业研究通用

Meta Llama 3.1 8B Instruct Quantized.w8a8

这是Meta-Llama-3.1-8B-Instruct模型的INT8量化版本，通过权重量化和激活量化优化，适用于多语言商业和研究用途。

大型语言模型

Transformers 支持多种语言

Phi 4 Mini Instruct

Phi-4-mini-instruct是一个轻量级开源模型，基于合成数据和过滤后的公开网站数据构建，专注于高质量、富含推理能力的数据。支持128K令牌的上下文长度和多语言处理。

大型语言模型

Transformers 支持多种语言

Llama 3.3 70B Instruct Quantized.w4a16

基于Meta-Llama-3.1架构的量化优化模型，支持多语言，适用于商业和研究场景，在减少资源需求的同时保持高性能。

大型语言模型

Transformers 支持多种语言

Llama 3.3 70B Instruct FP8 Dynamic

Meta推出的70B参数多语言大语言模型，支持多种语言对话和工具调用，在行业基准测试中表现优异。

大型语言模型

Transformers 支持多种语言

Llama 3.2 1B Instruct QLORA INT4 EO8

Llama 3.2 是 Meta 推出的多语言大语言模型系列，包含 1B 和 3B 参数的预训练和指令微调版本，支持 8 种官方语言，优化了多语言对话场景。

大型语言模型

PyTorch 支持多种语言

Llama 3.2 1B Instruct FP8

Llama-3.2-1B-Instruct的FP8量化版本，适用于多语言场景的商业和研究用途，性能接近原始模型。

大型语言模型

Safetensors 支持多种语言

Llama 3.2 11B Vision Instruct FP8 Dynamic

这是一个基于Llama-3.2-11B-Vision-Instruct的量化模型，适用于多语言的商业和研究用途，可用于类似助手的聊天场景。

图像生成文本

Safetensors 支持多种语言

Llama 3.1 8B Instruct GGUF

Meta Llama 3.1 8B Instruct 是一个多语言大语言模型，针对多语言对话用例进行了优化，在常见的行业基准测试中表现优异。

大型语言模型英语

Meta Llama 3.1 70B FP8

Meta-Llama-3.1-70B的FP8量化版本，适用于多语言的商业和研究用途，权重和激活均量化为FP8格式，减少约50%的存储和内存需求。

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 8B FP8

Meta-Llama-3.1-8B的FP8量化版本，适用于多种语言的商业和研究用途。

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 70B Instruct Quantized.w8a8

这是Meta-Llama-3.1-70B-Instruct的量化版本，通过INT8权重量化降低GPU内存需求和磁盘空间，同时提高计算吞吐量，适用于多语言商业和研究场景。

大型语言模型

Transformers 支持多种语言

Meta Llama 3 8B Instruct Bnb 8bit

这是Meta公司的Meta-Llama-3-8B-Instruct模型的8位量化版本，使用bitsandbytes进行量化，适用于高效的文本生成任务。

大型语言模型

Meta Llama 3 70B Fp8

Meta Llama 3 70B是由Meta开发的大语言模型，具有700亿参数，支持8k上下文长度，适用于英语的商业和研究用途。

大型语言模型

Transformers 英语

Meta Llama 3 70B Instruct GGUF

基于Meta官方Llama 3 70B指令微调模型的GGUF量化版本，支持2-16bit多种量化级别，适用于本地部署的对话场景

大型语言模型英语

Decilm 6b Instruct

DeciLM 6B-指令模型是一款专为短格式指令跟随设计的英语语言模型，基于DeciLM 6B通过LoRA微调技术训练而成

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24