C

Charllama 35M

由 inkoziev 开发
CharLLaMa-35M 是一个微型语言模型,采用LLaMa架构,具有逐字符分词功能,适用于因BPE分词导致任务表现不佳时的各类实验场景。
下载量 61
发布时间 : 8/31/2023

模型简介

该模型专为俄语诗歌实验开发,预训练语料包含大量诗歌体文本,参数量为35,913,600,适用于生成式拼写检查、文本分类、文本转录和拼写错误检测等任务。

模型特点

逐字符分词
使用逐字符分词功能,适用于BPE分词表现不佳的场景,如拼写检查和文本转录。
诗歌体文本预训练
预训练语料包含大量俄语诗歌体文本,适合诗歌相关任务。
轻量级模型
参数量仅为35,913,600,适合资源有限的实验场景。

模型能力

文本生成
文本分类
拼写检查
文本转录
拼写错误检测

使用案例

文本处理
生成式拼写检查器
利用逐字符分词功能,检测和纠正拼写错误。
文本分类
替代TfidfVectorizer(analyzer='char'),在字符级n-gram基线表现良好的场景中使用。
文本转录
适用于需要逐字符处理的文本转录任务。
诗歌生成
俄语诗歌生成
利用预训练的诗歌体文本生成俄语诗歌。
AIbase
智启未来,您的人工智能解决方案智库
简体中文