R

Rota

由 rti-international 开发
ROTA是一个机器学习模型,用于将自由文本的罪行描述转换为标准化的罪行代码类别,辅助刑事司法研究。
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过自然语言处理技术,将非结构化的罪行文本自动分类到NCRP代码手册中的指控类别,解决手动编码耗时问题。

模型特点

高效文本预处理
采用500+正则表达式处理拼写错误和缩写,移除法规前缀等噪声数据,实现文本标准化
多类别分类
支持85+指控类别的分类,涵盖从交通违规到暴力犯罪等广泛罪行类型
高准确率
在交叉验证中达到0.934的整体准确率和0.931的MCC分数
置信度评分
提供预测置信度分数,可通过阈值过滤低置信度预测以提高准确率

模型能力

罪行文本分类
法律文本标准化
刑事司法数据分析

使用案例

刑事司法研究
罪行数据标准化
将各州非标准化的罪行描述统一编码为NCRP标准类别
实现跨司法管辖区罪行数据的可比性分析
批量罪行分类
自动处理大规模罪行记录,替代人工分类
测试显示可节省90%+人工编码时间
法律数据分析
犯罪模式分析
通过标准化分类识别特定地区或时期的犯罪趋势