基于BERTopic框架的预训练话题建模模型,使用约3万篇ArXiv论文摘要训练,支持多维度话题表示和分类
下载量 231
发布时间 : 5/30/2023
模型简介
BERTopic是一个灵活模块化的话题建模框架,能够从海量数据中生成易于解释的话题分类。本模型展示了BERTopic中多种话题表示方法的组合应用。
模型特点
多维度话题表示
结合词性标注、KeyBERT启发式、MMR等多种技术生成丰富的话题表示
ChatGPT增强
利用ChatGPT生成话题标签和摘要,提升可解释性
模块化设计
支持灵活组合不同的话题表示和聚类算法
模型能力
文本分类
话题提取
关键词生成
话题摘要生成
使用案例
学术研究
论文主题分析
对ArXiv等学术论文库进行主题挖掘和分类
识别107个不同主题
内容分析
文档聚类
对大规模文档集合进行自动主题聚类
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文