tibert-base开源语言模型 - 专为提格里尼亚语优化，免费处理语言任务

首页

Tibert Base

由 fgaim 开发

这是一个针对提格里尼亚语预训练的BERT基础模型，在4000万词符的数据集上进行了40轮预训练。

大型语言模型其他#提格里尼亚语NLP #低资源语言模型 #非洲语言处理

下载量 28

发布时间 : 3/2/2022

模型简介

该模型是一个单语预训练语言模型，专门为提格里尼亚语设计，基于BERT架构，适用于各种自然语言处理任务。

模型特点

大规模预训练

在4000万词符的提格里尼亚语数据集上进行预训练

完整BERT架构

采用标准BERT架构，包含12层网络和12个注意力头

TPU优化训练

使用TPU v3.8进行高效训练，提供Flax和PyTorch版本

模型能力

文本掩码预测

语义理解

词向量表示

使用案例

自然语言处理

文本补全

可用于提格里尼亚语文本的自动补全任务

如示例所示，能够准确预测[MASK]位置的词汇

语义分析

可用于提格里尼亚语文本的语义理解和分析

模型大小	层数 (L)	注意力头数 (AH)	隐藏层大小 (HS)	前馈网络维度 (FFN)	参数数量 (P)	最大序列长度 (Seq)
基础版 (BASE)	12	12	768	3072	1.1亿	512

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Tibert Base

模型简介

模型特点

模型能力

使用案例

🚀 提格雷尼亚语BERT基础模型

🚀 快速开始

✨ 主要特性

📦 安装指南

💻 使用示例

📚 详细文档

超参数

🔧 技术细节

📄 许可证

📄 引用信息