D

Deepseek V3 0324 Fused 4E 29B Unhealed Preview

由 AlphaGaO 开发
这是一个未经过完整训练的实验性模型,主要用于研究目的,通过模型融合技术创建,需要特定修复流程才能恢复正常功能。
下载量 167
发布时间 : 4/8/2025

模型简介

基于256个专家的DeepSeek-V3-0324模型,提供不同压缩级别的预览版本,主要用于研究模型融合和蒸馏技术。

模型特点

模型融合技术
通过专家融合技术显著减小模型大小(缩减至1/20-1/23),同时保持超出预期的性能表现
多领域能力提升
在MMLU-Pro、GPQA、AIME等多个基准测试中性能显著提升
中文能力增强
中文写作风格和质量提升,支持多轮交互式重写,翻译和书信写作优化
代码生成改进
前端网页开发能力增强,生成的代码更易执行,页面和游戏前端更美观
函数调用优化
修复了之前版本的函数调用问题,准确性提高

模型能力

文本生成
代码生成
中文写作
网页搜索增强
函数调用
JSON输出
FIM完成

使用案例

学术研究
模型融合技术研究
研究模型融合和蒸馏技术的效果和改进空间
提供不同压缩级别的模型变体供研究
内容创作
中文写作辅助
帮助用户生成高质量的中文内容
符合R1写作风格,中长篇写作质量更好
前端开发
网页代码生成
生成可执行的前端网页代码
代码可执行性提高,页面更美观
AIbase
智启未来,您的人工智能解决方案智库
简体中文