C

Chonky Modernbert Large 1

由 mirth 开发
Chonky是一款能够智能地将文本分割成有意义的语义块的Transformer模型,适用于RAG系统。
下载量 54
发布时间 : 4/26/2025
模型介绍
内容详情
替代品

模型简介

该模型处理文本并将其划分为语义连贯的片段,这些分块可以作为RAG流程的一部分,输入到基于嵌入的检索系统或语言模型中。

模型特点

智能语义分块
能够将文本分割成有意义的语义块,保持内容的连贯性。
RAG系统优化
专为检索增强生成(RAG)系统设计,优化了分块质量。
长序列支持
在长度为1024的序列上进行了微调(基础模型支持最长8192的序列)。

模型能力

文本语义分块
段落分割
RAG系统预处理

使用案例

信息检索
RAG系统预处理
为检索增强生成系统准备语义连贯的文本块
提高检索系统的准确性和相关性
文本处理
文档分割
将长文档分割成有意义的段落
便于后续处理和分析