bert-ascii-medium开源语言模型 - 免费使用助力文本理解与处理任务

首页

Bert Ascii Medium

由 aajrami 开发

一个中等规模的BERT语言模型，通过预测被遮蔽标记中字符的ASCII码值之和作为预训练目标进行预训练。

大型语言模型

Transformers

#ASCII码预测 #中等规模BERT #字符级预训练

下载量 24

发布时间 : 11/8/2022

模型简介

该模型是一个基于BERT架构的中等规模语言模型，采用独特的ASCII码值之和预测作为预训练目标，旨在探索预训练目标对语言属性学习的影响。

模型特点

ASCII码值预测目标

采用预测被遮蔽标记中字符的ASCII码值之和作为预训练目标，不同于传统BERT的词汇预测。

中等规模架构

基于BERT架构的中等规模模型，平衡了性能和计算资源需求。

预训练目标研究

专为研究预训练目标如何影响语言属性学习而设计。

模型能力

文本表示学习

语言属性分析

预训练目标研究

使用案例

自然语言处理研究

预训练目标比较研究

用于比较不同预训练目标对语言模型学习效果的影响

可评估ASCII码预测目标与传统目标的差异

语言属性分析

用于分析模型对特定语言属性的掌握程度

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Bert Ascii Medium

模型简介

模型特点

模型能力

使用案例

🚀 bert-ascii-medium

🚀 快速开始

📄 许可证

📚 详细文档

引用信息