R

Roberta Base Formality Ranker

由 s-nlp 开发
该模型基于RoBERTa架构,专门用于预测英语句子的正式或非正式程度。
下载量 1,349
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型经过训练,能够准确判断英语文本的正式程度,适用于文本风格分析和转换任务。

模型特点

高准确率
在GYAFC测试集上达到90.87%的准确率和0.9779的ROC AUC值。
数据增强处理
通过转换大小写和移除标点符号的数据增强方法,避免模型过度依赖表面特征。
多数据集训练
结合GYAFC和Pavlick-Tetreault两个正式度语料库进行训练。

模型能力

文本正式度分类
风格特征分析

使用案例

文本处理
正式度评估
自动评估文本的正式程度,用于写作辅助工具。
在GYAFC数据集上F1分数达到0.90
风格转换
作为风格转换系统的组成部分,帮助保持内容一致性。
教育
写作指导
帮助学生识别和调整写作风格以适应不同场合。