K

Kobart Base V2

由 gogamza 开发
KoBART是基于BART架构的韩语编码器-解码器语言模型,通过文本填充噪声函数训练,支持韩语文本特征提取和生成任务。
下载量 5,937
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

韩语BART模型,采用自编码器形式训练,适用于韩语文本的特征提取和生成任务。

模型特点

韩语优化
专门针对韩语训练,包含韩语维基和其他多种韩语语料
表情符号支持
词汇表中特别添加了高频使用的表情符号,提升表情符号识别能力
高效分词
采用字符级BPE分词器进行训练,分词效率高

模型能力

韩语文本特征提取
韩语文本生成
文本填充
文本摘要

使用案例

文本处理
情感分析
用于韩语文本的情感分类
在NSMC数据集上达到90.24%的准确率
文本相似度计算
计算韩语句子间的语义相似度
在KorSTS数据集上斯皮尔曼系数达到81.66
问句配对
判断两个韩语问句是否语义相同
准确率达到94.34%