基于SZTAKI-HLT/hubert-base-cc预训练模型,在NerKor+CARS-ONPP语料库上微调的匈牙利语命名实体识别模型,支持30多种实体类型。
下载量 6,780
发布时间 : 3/2/2022
模型简介
该模型是一个匈牙利语命名实体识别(NER)模型,能够识别包括人物、地点、组织、时间、数量等多种实体类型,适用于匈牙利语文本的实体标注任务。
模型特点
广泛的实体类型支持
支持30多种实体类型,包括OntoNotes 5.0标准类型和新增的匈牙利语特定类型。
大规模训练数据
基于NerKor+CARS-ONPP语料库训练,包含约100万标记的匈牙利语黄金标准标注数据。
专业领域扩展
新增了1.2万标记的机动车辆领域文本,增强特定领域的识别能力。
模型能力
识别匈牙利语文本中的命名实体
分类30多种实体类型
处理新闻领域文本
识别机动车辆相关实体
使用案例
信息提取
新闻文本分析
从匈牙利语新闻文章中提取人物、组织、地点等关键信息
可用于构建知识图谱或事件分析
汽车领域实体识别
识别汽车相关文章中的车辆型号、品牌等特定实体
支持汽车行业市场分析
文本标注
语料库构建
为匈牙利语NLP研究提供预标注数据
加速研究过程
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文