cubert-20210711-Python-1024开源模型 - 免费部署助力Python源代码分析任务

首页

Cubert 20210711 Python 1024

由 claudios 开发

CuBERT是一个基于Python代码的上下文嵌入模型，专门用于处理源代码分析任务。

大型语言模型

Transformers

其他开源协议:Apache-2.0 #Python代码嵌入 #上下文窗口1024 #预训练模型

下载量 22

发布时间 : 4/30/2024

模型简介

CuBERT是一个预训练的语言模型，专门针对源代码分析任务设计。它基于Python BigQuery数据集训练，能够理解代码的上下文语义，适用于代码补全、错误检测等任务。

模型特点

源代码专用

专门针对Python源代码训练，能更好地理解编程语言的语法和语义

长上下文支持

支持1024标记的上下文窗口，适合处理较长的代码片段

预训练模型

已在大量Python代码上预训练，可直接用于下游任务

模型能力

代码上下文理解

代码补全

代码错误检测

代码语义分析

使用案例

代码开发辅助

智能代码补全

根据上下文预测可能出现的代码片段

代码错误检测

识别代码中的潜在错误或异常模式

代码分析

代码相似性检测

比较不同代码片段的语义相似度

属性	详情
模型类型	用于填充掩码的模型
训练数据	Python BigQuery数据集
标签	代码、CuBERT
论文链接	2001.00059

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Cubert 20210711 Python 1024

模型简介

模型特点

模型能力

使用案例

🚀 CuBERT：学习和评估源代码的上下文嵌入

🚀 快速开始

📄 许可证

📚 详细文档

引用

信息表格