模型简介
DeepSeek-R1 是一个基于 transformers 的大语言模型,支持英语,采用 MIT 许可证发布。它通过 Unsloth Dynamic v2.0 量化技术,在保持高效推理的同时提升了准确性。
模型特点
Unsloth Dynamic v2.0 量化
采用 1.58位 + 2位动态量化技术,相比标准量化方法显著提升了准确性。
选择性量化
通过选择性量化关键部分,在保持模型性能的同时减少资源消耗。
高效推理
优化后的量化模型在保持高准确性的同时实现了更快的推理速度。
模型能力
文本生成
语言理解
上下文推理
使用案例
自然语言处理
文本生成
可用于生成连贯、有逻辑的文本内容。
生成质量高,上下文连贯性良好
问答系统
构建基于知识的问答系统。
能够提供准确的答案
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文