A

Anglicisms Spanish Mbert

由 lirondos 开发
这是一个预训练模型,用于检测西班牙新闻中未同化的英语词汇借用(又称英语借词)。
下载量 7,991
发布时间 : 3/28/2022
模型介绍
内容详情
替代品

模型简介

该模型标记西班牙语中使用的外来词汇(主要来自英语),如*fake news*、*machine learning*、*smartwatch*、*influencer*或*streaming*。

模型特点

多语言支持
基于多语言BERT架构,能够处理多种语言中的词汇借用问题。
高精度检测
在测试集上对英语借词的F1值达到85.19。
专业语料训练
使用COALAS语料库训练,包含370,000个词,覆盖欧洲西班牙语的多种书面媒体。

模型能力

英语借词检测
外来词识别
语码转换分析

使用案例

新闻分析
新闻文本分析
分析西班牙新闻中的英语借词使用情况
识别出如*fake news*、*machine learning*等未同化词汇
语言学研究
词汇借用研究
研究西班牙语中英语借词的使用频率和模式
提供量化数据支持语言接触研究