B

Bert Base Polish Uncased V1

由 dkleczek 开发
波兰语版本的BERT语言模型,提供区分大小写和不区分大小写两种变体,适用于波兰语自然语言处理任务。
下载量 3,853
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

Polbert是基于BERT架构的波兰语预训练语言模型,支持多种下游NLP任务,如文本分类、命名实体识别等。

模型特点

波兰语优化
专门针对波兰语特性优化,正确处理波兰语特殊字符和重音符号
全词掩码技术
区分大小写版本采用全词掩码技术,提升模型理解能力
语料优化
移除重复内容,使用更均衡的波兰语语料库训练

模型能力

文本分类
命名实体识别
文本填充
语义理解

使用案例

文本理解
诗歌作者识别
识别波兰著名诗人作品片段
正确识别Adam Mickiewicz为'pisarzem'(作家)
学术研究
波兰语语言学分析
用于研究波兰语语法和语义特征