B

Bertopic ArXiv

由 MaartenGr 开发
基于BERTopic框架的预训练话题建模模型,使用约3万篇ArXiv论文摘要训练,支持多维度话题表示和分类
下载量 231
发布时间 : 5/30/2023
模型介绍
内容详情
替代品

模型简介

BERTopic是一个灵活模块化的话题建模框架,能够从海量数据中生成易于解释的话题分类。本模型展示了BERTopic中多种话题表示方法的组合应用。

模型特点

多维度话题表示
结合词性标注、KeyBERT启发式、MMR等多种技术生成丰富的话题表示
ChatGPT增强
利用ChatGPT生成话题标签和摘要,提升可解释性
模块化设计
支持灵活组合不同的话题表示和聚类算法

模型能力

文本分类
话题提取
关键词生成
话题摘要生成

使用案例

学术研究
论文主题分析
对ArXiv等学术论文库进行主题挖掘和分类
识别107个不同主题
内容分析
文档聚类
对大规模文档集合进行自动主题聚类