H

Herbert Base Cased

由 allegro 开发
赫伯特是一个基于BERT架构的波兰语预训练语言模型,采用动态全词掩码和句子结构目标进行训练。
下载量 84.18k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

赫伯特是针对波兰语优化的高效Transformer模型,主要用于自然语言处理任务,如文本分类、问答和文本生成。

模型特点

波兰语优化
专门针对波兰语设计和训练,在波兰语任务上表现优异。
动态全词掩码
采用动态全词掩码策略进行预训练,提高了模型对波兰语的理解能力。
句子结构目标
除了传统的MLM任务外,还使用句子结构目标(SSO)进行训练,增强了模型对句子结构的理解。
大规模训练数据
使用了超过85亿词符的波兰语语料进行训练,覆盖多种文本类型。

模型能力

波兰语文本理解
波兰语文本生成
波兰语文本分类
波兰语问答系统

使用案例

自然语言处理
波兰语文本分类
可用于波兰语的情感分析、主题分类等任务。
波兰语问答系统
构建针对波兰语内容的问答系统。
波兰语文本生成
生成流畅的波兰语文本。