D
Deepseek R1 Distill Llama 8B Abliterated
由 stepenZEN 开发
DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的蒸馏版大语言模型,参数规模为 8B,主要用于英文文本生成和理解任务。
下载量 119
发布时间 : 1/20/2025
模型简介
该模型是 DeepSeek 发布的 R1 系列模型之一,通过蒸馏技术从更大的模型中提取知识,保持了较高的性能同时减少了计算资源需求。
模型特点
蒸馏技术
通过蒸馏技术从更大的模型中提取知识,在保持性能的同时减少模型规模。
高效推理
8B 参数规模在保证性能的同时,降低了计算资源需求,适合更多应用场景。
英文优化
针对英文文本生成和理解任务进行了优化。
模型能力
文本生成
文本理解
问答系统
内容摘要
使用案例
内容生成
文章创作
生成高质量英文文章或段落
生成流畅、连贯的英文内容
对话系统
构建英文对话机器人
实现自然流畅的英文对话
文本理解
问答系统
回答基于英文文本的问题
准确理解问题并提供相关回答
内容摘要
生成英文文本的摘要
提取关键信息生成简洁摘要
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文