T

Titulm Mpt 1b V1.0

由 hishab 开发
TituLM-1B-BN-V1 是一个专为生成和理解孟加拉语文本而训练的大型语言模型,基于包含45.1亿孟加拉语标记的数据集进行了广泛训练。
下载量 61
发布时间 : 12/4/2023
模型介绍
内容详情
替代品

模型简介

该模型采用解码器风格的Transformer架构,是Hishab公司迭代训练和发布的孟加拉语大语言模型系列的一部分,主要用于孟加拉语文本生成和理解。

模型特点

大规模孟加拉语训练
基于45.1亿孟加拉语标记的数据集进行训练,具备强大的孟加拉语理解和生成能力。
优化的Transformer架构
采用解码器风格的Transformer架构,具有16个注意力头和24个网络层,支持2048的最大序列长度。
高效训练
使用MosaicML的llm-foundry框架完成训练,经历了59轮迭代优化,最终损失值为3.11。

模型能力

孟加拉语文本生成
孟加拉语文本理解

使用案例

内容创作
孟加拉语歌词生成
根据用户输入的简短提示生成孟加拉语歌词。
生成符合孟加拉语语法和风格的歌词内容。
教育
孟加拉语学习辅助
帮助学习者理解和生成孟加拉语文本。
提供准确的孟加拉语示例和解释。