C

Chonky Distilbert Base Uncased 1

由 mirth 开发
Chonky是一款能够智能地将文本分割成有意义的语义块的Transformer模型,适用于RAG系统。
下载量 1,486
发布时间 : 4/10/2025

模型简介

该模型处理文本并将其划分为语义连贯的片段,这些分块可作为RAG流程的一部分输入到基于嵌入的检索系统或语言模型中。

模型特点

智能语义分块
能够将文本智能地分割成有意义的语义块,提高RAG系统的效率。
基于DistilBERT
使用轻量级的DistilBERT-base-uncased模型,平衡了性能和效率。
易于集成
提供了专门的Python库和标准NER流程两种使用方式。

模型能力

文本分割
语义分析
RAG系统支持

使用案例

信息检索
RAG系统预处理
为基于嵌入的检索系统准备语义连贯的文本块
提高检索相关性和效率
文本处理
文档分割
将长文档分割成有意义的段落
便于后续分析和处理
AIbase
智启未来,您的人工智能解决方案智库
简体中文