H

Hoogberta NER Lst20

由 lst-nectec 开发
针对泰语命名实体识别任务微调的预训练语言模型,基于LST20数据集
下载量 95
发布时间 : 4/5/2023

模型简介

HoogBERTa是针对泰语自然语言处理任务开发的预训练语言模型,该版本专门针对命名实体识别(NER)任务在LST20数据集上进行了微调。

模型特点

泰语优化
专门针对泰语特性进行优化的预训练语言模型
多任务支持
支持命名实体识别、词性标注和子句边界分类等多种任务
预分词处理
采用BEST标准的预分词处理,确保输入质量

模型能力

泰语文本处理
命名实体识别
词性标注
子句边界分类

使用案例

文本分析
泰语文本实体提取
从泰语文本中识别并分类命名实体
可准确识别LST20数据集中定义的各种实体类型
语言处理
泰语文本预处理
为下游NLP任务提供预处理支持
提供词性标注和子句边界识别功能
AIbase
智启未来,您的人工智能解决方案智库
简体中文