Devstral是一款专为软件工程任务设计的智能LLM,由Mistral AI和All Hands AI合作开发,擅长代码探索、多文件编辑和驱动软件工程代理。
下载量 72.26k
发布时间 : 5/21/2025
模型简介
Devstral是基于Mistral-Small-3.1微调而来的智能编码模型,具有128k tokens的上下文窗口,专注于软件工程任务,在SWE-bench上表现优异。
模型特点
智能编码
专为智能编码任务设计,是软件工程代理的理想选择
轻量级
240亿参数的紧凑尺寸,可在单个RTX 4090或32GB RAM的Mac上运行
长上下文窗口
支持128k tokens的上下文窗口
多语言支持
支持24种语言,包括主要编程语言和自然语言
开源许可
采用Apache 2.0许可证,允许商业和非商业用途
模型能力
代码探索
多文件编辑
软件工程代理
多语言文本生成
长上下文处理
使用案例
软件开发
代码库探索
帮助开发者理解和探索大型代码库
提高代码理解和维护效率
多文件代码编辑
同时编辑多个相关代码文件
保持代码一致性,提高开发效率
自动化软件工程
作为软件工程代理自动执行开发任务
减少重复性工作,加速开发流程
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文