L

Luke Japanese Wordpiece Base

由 uzabase 开发
基于日语BERT改进的LUKE模型,专为日语命名实体识别任务优化
下载量 16
发布时间 : 8/10/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于LUKE架构改进的日语语言模型,通过切换基础模型为日语BERT并更新训练数据,增强了日语命名实体识别的能力。

模型特点

改进的基础模型
将基础模型从RoBERTa切换为日语BERT,相应地将分词器从Sentencepiece改为WordPiece
更新的训练数据
使用截至2023年7月1日的日语Wikipedia数据进行了预训练
增强的实体处理能力
新增支持处理`[UNK]`(未知)实体
兼容性优化
修复了transformers高版本兼容性问题,并调整了分词器输出以符合BERT规范

模型能力

日语文本理解
命名实体识别
处理未知实体

使用案例

自然语言处理
日语文本实体识别
识别日语文本中的人名、地名、组织机构等实体
能够准确识别包括未知实体在内的各类命名实体