掩码语言建模

# 掩码语言建模

Llm Jp Modernbert Base

基于modernBERT-base架构的日语大语言模型，支持最大8192的序列长度，使用3.4TB日语语料训练

大型语言模型

Transformers 日语

SyllaBERTa是一款实验性基于Transformer的掩码语言模型，专为处理古希腊语文本设计，采用音节级分词。

大型语言模型

Transformers 其他

DUO是一个用于文本生成的预训练模型，可用于掩码语言建模任务，在OpenWebText语料库上进行训练，具有良好的性能。

大型语言模型

Transformers 英语

Moderncamembert Cv2 Base

基于1万亿高质量法语文本预训练的法语语言模型，是ModernBERT的法语版本

大型语言模型

Transformers 法语

Moderncamembert Base

ModernCamemBERT是基于1T高质量法语文本语料库预训练的法语语言模型，是ModernBERT的法语版本，专注于长上下文和高效推理速度。

大型语言模型

Transformers 法语

基于非编码RNA数据、采用掩码语言建模（MLM）目标预训练的RNA基础模型

蛋白质模型其他

DUO是一个基于Transformers库的预训练模型，专注于掩码语言建模任务，适用于自然语言处理领域。

大型语言模型

Transformers 英语

medBERT-base是基于BERT的模型，专注于医学和胃肠病学文本的掩码语言建模任务。

大型语言模型

Transformers 英语

基于XLM-Roberta基础模型微调的版本，采用RoPE（旋转位置编码）替换原始位置嵌入，支持2048序列长度

大型语言模型

Camembertv2 Base

CamemBERTv2是基于2750亿法语文本语料预训练的法语语言模型，是CamemBERT的第二代版本，采用RoBERTa架构，优化了分词器和训练数据。

大型语言模型

Transformers 法语

Ankh3是一个基于T5架构的蛋白质语言模型，通过联合优化掩码语言建模和序列补全任务进行预训练，适用于蛋白质特征提取和序列分析。

蛋白质模型

RiNALMo是基于掩码语言建模（MLM）目标预训练的非编码RNA（ncRNA）模型，在大量非编码RNA序列上通过自监督方式训练。

蛋白质模型其他

Roberta Kaz Large

基于RoBERTa架构的哈萨克语语言模型，采用RobertaForMaskedLM从头训练而成，适用于哈萨克语文本处理任务。

大型语言模型

Transformers 其他

Codeberta Small V1

CodeBERTa是一个基于RoBERTa架构的代码理解模型，专门针对多种编程语言训练，能够高效处理代码相关任务。

大型语言模型

Transformers 其他

SaudiBERT是首个专注于沙特方言文本的预训练大语言模型，基于大规模沙特推特和论坛语料库训练。

大型语言模型

Transformers 阿拉伯语

Caduceus Ps Seqlen 131k D Model 256 N Layer 16

Caduceus-PS是一个具有反向互补等变性的DNA序列建模模型，专为长序列处理设计。

Multilingual Albert Base Cased 128k

基于掩码语言建模(MLM)目标预训练的多语言ALBERT模型，支持60+种语言，具有参数共享的轻量级架构

大型语言模型

Transformers 支持多种语言

Multilingual Albert Base Cased 64k

基于掩码语言建模（MLM）目标预训练的多语言ALBERT模型，支持64k词表大小，区分大小写

大型语言模型

Transformers 支持多种语言

Multilingual Albert Base Cased 32k

基于掩码语言建模目标预训练的多语言ALBERT模型，支持50+种语言，区分大小写

大型语言模型

Transformers 支持多种语言

Nasa Smd Ibm V0.1

Indus是基于RoBERTa的仅编码器Transformer模型，专为NASA科学任务理事会(SMD)应用领域优化，适用于科学信息检索和智能搜索。

大型语言模型

Transformers 英语

Albertina 1b5 Portuguese Ptbr Encoder

Albertina 1.5B PTBR 是一个面向巴西葡萄牙语变体的基础大型语言模型，属于BERT家族的编码器，基于Transformer神经网络架构，并在DeBERTa模型基础上开发。

大型语言模型

Transformers 其他

Tahrirchi Bert Base

TahrirchiBERT-base是一个乌兹别克语（拉丁字母）的仅编码器Transformer文本模型，拥有1.1亿参数，通过掩码语言建模目标预训练。

大型语言模型

Transformers 其他

针对现代希伯来语的最先进BERT语言模型套件

大型语言模型

Transformers 其他

Parlbert German Law

基于德语法律数据训练的BERT模型，专注于法律文本处理

大型语言模型

Transformers 德语

BEREL 3.0是基于BERT架构的嵌入模型，专门为拉比编码语言设计，为相关研究和应用提供支持。

大型语言模型

Transformers 其他

BERTikal 是一个针对巴西法律语言的大写敏感BERT基础模型，基于BERTimbau的检查点，使用巴西法律文本训练而成。

大型语言模型

Transformers 其他

Albertina 100m Portuguese Ptbr Encoder

Albertina 100M PTBR是一个面向巴西葡萄牙语的基础大语言模型，属于BERT家族的编码器，基于Transformer神经网络架构，并在DeBERTa模型基础上开发。

大型语言模型

Transformers 其他

Albertina 100m Portuguese Ptpt Encoder

Albertina 100M PTPT 是一个面向欧洲葡萄牙语（葡萄牙）的基础大语言模型，属于BERT家族的编码器，基于Transformer神经网络架构，并在DeBERTa模型基础上开发。

大型语言模型

Transformers 其他

基于RoBERTa架构的新闻领域掩码语言模型，专门针对新闻文本进行预训练

大型语言模型

Transformers 英语

ARBERTv2是基于现代标准阿拉伯语(MSA)训练的升级版BERT模型，训练语料达243GB文本，包含278亿词元。

大型语言模型

Transformers 阿拉伯语

NorBERT 3 是新一代挪威语语言模型，基于BERT架构，支持书面挪威语（Bokmål）和新挪威语（Nynorsk）。

大型语言模型

Transformers 其他

Bert Mlm Medium

一个中等规模的BERT语言模型，采用掩码语言建模(MLM)预训练目标。

大型语言模型

基于掩码语言建模任务训练的混合专家(MoE)模型，参数规模达1.6万亿，采用类似T5的架构但前馈层替换为稀疏MLP层

大型语言模型

Transformers 英语

Esm2 T36 3B UR50D

ESM-2是基于掩码语言建模目标训练的新一代蛋白质模型，适用于各类以蛋白质序列为输入的下游任务微调。

蛋白质模型

My Awesome Eli5 Mlm Model

基于distilroberta-base微调的模型，具体用途未明确说明

大型语言模型

Esm2 T12 35M UR50D

ESM-2是基于掩码语言建模目标训练的前沿蛋白质模型，适用于各类蛋白质序列分析任务

蛋白质模型

Esm2 T6 8M UR50D

ESM-2是基于掩码语言建模目标训练的新一代蛋白质模型，适用于对蛋白质序列进行各类任务的微调。

蛋白质模型

Esm2 T48 15B UR50D

ESM-2是基于掩码语言建模目标训练的最先进蛋白质模型，适用于对蛋白质序列进行各种任务的微调。

蛋白质模型

Microbert Coptic Mx

这是一个针对科普特语的MicroBERT模型，通过掩码语言建模和XPOS标注的监督进行预训练。

大型语言模型

Transformers 其他

Finbert Pretrain

FinBERT是基于金融通讯文本预训练的BERT模型，专为金融自然语言处理任务设计。

大型语言模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24