Starcoder2 3b GGUF
StarCoder2-3B 是一个专注于代码生成的3B参数量的开源模型,由BigCode团队开发。
下载量 103
发布时间 : 11/8/2024
模型简介
StarCoder2-3B 是一个文本生成模型,特别擅长代码生成任务。它基于bigcode/the-stack-v2-train数据集训练,支持多种编程语言的代码生成和补全。
模型特点
高效的代码生成
在多个代码生成评估数据集上表现优异,如HumanEval pass@1达到31.7。
多种量化版本
提供从Q2_K到Q8_0共12种量化版本,满足不同硬件条件下的推理需求。
开源许可证
采用bigcode-openrail-m许可证,允许商业和研究用途。
模型能力
代码生成
代码补全
编程问题解答
使用案例
软件开发
自动化代码生成
根据自然语言描述生成可运行的代码片段
在HumanEval数据集上pass@1达到31.7
代码补全
在IDE中提供智能代码补全建议
在RepoBench-v1.1上编辑相似度达到71.19
编程教育
编程问题解答
帮助学生理解和解决编程问题
在GSM8K(PAL)数据集上准确率达到27.7
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文