B

Bert Base Swedish Cased

由 KB 开发
瑞典国家图书馆/KBLab发布的瑞典语BERT基础模型,基于多源文本训练
下载量 11.16k
发布时间 : 6/7/2022
模型介绍
内容详情
替代品

模型简介

基于BERT架构的瑞典语预训练语言模型,训练数据包含书籍、新闻、政府出版物等多种来源

模型特点

多源训练数据
使用15-20GB来自书籍、新闻、政府出版物等多样化的瑞典语文本训练
全词掩码训练
采用全词掩码(Whole Word Masking)技术提升语言理解能力
区分大小写
保留文本原始大小写信息,适合需要区分大小写的应用场景

模型能力

文本理解
命名实体识别
语义分析

使用案例

信息提取
命名实体识别
识别文本中的人名、地点、组织等实体
在SUC 3.0数据集上微调的NER模型可识别5类实体
文本分析
语义理解
用于构建问答系统或聊天机器人