V

Vihealthbert Base Word

由 demdecuong 开发
ViHealthBERT是面向越南语健康文本挖掘的预训练语言模型,在医疗健康领域提供强基线性能
下载量 633
发布时间 : 4/20/2022
模型介绍
内容详情
替代品

模型简介

专为越南语医疗健康文本设计的预训练语言模型,支持命名实体识别、缩略词消歧和文本摘要等任务

模型特点

医疗领域优化
针对越南语医疗健康文本进行专门预训练,在相关任务上表现优异
双分词器支持
提供词级和音节级两种分词器版本,适应不同应用场景
配套数据集
发布医疗缩略词数据集(acrDrAid)和常见问题摘要数据集

模型能力

越南语医疗文本理解
命名实体识别
缩略词消歧
文本摘要生成

使用案例

医疗信息处理
COVID-19实体识别
从越南语医疗文本中识别COVID-19相关实体
在COVID-19 & ViMQ数据集上达到SOTA性能
医疗缩略词解析
解析越南语医疗文档中的专业缩略词
在acrDrAid数据集上表现优异
医疗文本摘要
常见问题摘要
生成越南语医疗常见问题的简洁摘要