T

Tags Allnli GroNLP Bert Base Dutch Cased

由 textgain 开发
基于荷兰语BERT的句子嵌入模型,可将文本映射至768维向量空间,适用于语义相似度计算和文本分类任务
下载量 1,067
发布时间 : 2/23/2023

模型简介

该模型是基于sentence-transformers框架的荷兰语BERT模型,专门用于生成句子级嵌入向量,支持语义搜索、聚类和文本分类等自然语言处理任务。

模型特点

荷兰语优化
基于GroNLP的bert-base-dutch-cased模型专门针对荷兰语文本进行优化
高效语义编码
将变长句子编码为固定768维稠密向量,保留语义信息
多任务适用
生成的嵌入向量可用于聚类、语义搜索和分类等多种下游任务

模型能力

句子向量化
语义相似度计算
文本特征提取
主题分类
文本聚类

使用案例

媒体内容分析
新闻主题分类
如示例所示,可对新闻内容进行IPTC标准主题分类
能准确识别灾害类新闻内容
信息检索
语义搜索
基于语义相似度而非关键词匹配的文档检索
AIbase
智启未来,您的人工智能解决方案智库
简体中文