C

Czert B Base Cased

由 UWB-AIR 开发
CZERT是专门针对捷克语训练的类似BERT的语言表示模型,在多项捷克语NLP任务上表现优于多语言BERT模型
下载量 560
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

CZERT是基于BERT架构的捷克语预训练语言模型,包含基础版(CZERT-B)和ALBERT版(CZERT-A)两个变体,在情感分析、语义相似度、命名实体识别等任务上表现出色

模型特点

捷克语优化
专门针对捷克语训练,相比多语言BERT在捷克语任务上表现更优
多任务支持
支持从词元级到文档级的多种NLP任务
性能优越
在多项捷克语NLP基准测试中超越mBERT和SlavicBERT等模型

模型能力

文本分类
语义相似度计算
命名实体识别
形态标注
语义角色标注
情感分析

使用案例

情感分析
社交媒体评论情感分类
分析Facebook或CSFD(捷克电影数据库)评论的情感倾向
在CSFD数据集上达到84.79% F1分数
语义理解
新闻文本相似度计算
评估捷克新闻社(CNA)文本的语义相似度
Pearson相关系数达到84.345
信息提取
命名实体识别
从文本中识别捷克语人名、地名等实体
在CNEC数据集上达到86.274% F1分数