E

Eurobert 210m Quality CL

由 TempestTeam 开发
自动评估自然语言和编程语言文本数据质量的模型,提供统一模型和双模型两种方案。
下载量 19
发布时间 : 3/18/2025
模型介绍
内容详情
替代品

模型简介

该模型通过评分体系自动评估文本数据质量,支持自然语言(法语、英语、西班牙语)和编程语言(Python、Java、JavaScript、C/C++)。提供统一模型和独立模型两种方案,适用于不同场景需求。

模型特点

多语言支持
同时支持自然语言(法语、英语、西班牙语)和编程语言(Python、Java、JavaScript、C/C++)的质量评估
双评估方案
提供统一模型和独立模型两种方案,可根据需求选择最适合的评估方式
有害内容识别
对有害内容识别表现优异,自然语言F1分数达0.93
清晰分类体系
提供四级分类等级:有害、低劣、中等、优质,便于理解和使用

模型能力

自然语言文本质量评估
编程语言代码质量评估
有害内容检测
多语言支持

使用案例

NLP预处理
文本语料库验证
在接入NLP系统前自动验证文本语料库质量
提高NLP系统输入数据质量
社区内容管理
技术社区内容评估
评估论坛、Stack Overflow、GitHub等技术社区内容质量
帮助筛选优质内容
代码生成
代码质量评估
评估代码生成系统输出的代码质量
提高代码生成系统的可靠性