预训练语言模型

# 预训练语言模型

由Trendyol预训练的土耳其语Bert模型，适用于多种自然语言理解任务。

大型语言模型

Transformers 其他

Chronos T5 Tiny

Chronos是基于语言模型架构的预训练时间序列预测模型家族，通过量化和缩放将时间序列转换为token序列进行训练。

Chronos T5 Mini

Chronos是基于语言模型架构的预训练时间序列预测模型家族，通过将时间序列转化为token序列进行训练，支持概率预测。

Llama 3 Spicy 8B

基于mergekit工具合并的预训练语言模型，融合了多个Llama-3变体模型的特点

大型语言模型

Chronos T5 Tiny

Chronos是基于语言模型架构的预训练时间序列预测模型家族，通过量化和缩放将时间序列转化为标记序列进行训练。

Bros Base Uncased

BROS是一个专注于文本和布局的预训练语言模型，能从文档中高效提取关键信息。

大型语言模型

Glot500是一个支持500多种语言的多语言预训练模型，基于掩码语言建模（MLM）目标训练。

大型语言模型

Japanese Gpt Neox 3.6b

一个拥有36亿参数的日语GPT-NeoX模型，基于Transformer架构，在3125亿token的日语语料上训练。

大型语言模型

Transformers 支持多种语言

Hoogberta NER Lst20

针对泰语命名实体识别任务微调的预训练语言模型，基于LST20数据集

Transformers 其他

Clinicalt5 Base

ClinicalT5是基于T5架构的生成式语言模型，专门针对临床文本处理进行了预训练，适用于医疗领域的自然语言处理任务。

大型语言模型

Italian Legal BERT

基于意大利语XXL BERT模型，在国家司法档案3.7GB预处理文本上进行额外预训练的法律领域专用模型

大型语言模型

Transformers 其他

哪吒(NEZHA)是一个面向中文理解的神经语境化表征模型，基于Transformer架构，由华为诺亚方舟实验室开发。

大型语言模型

Vihealthbert Base Word

ViHealthBERT是面向越南语健康文本挖掘的预训练语言模型，在医疗健康领域提供强基线性能

大型语言模型

ERNIE-Gram是一个通过显式N-Gram掩码语言建模进行预训练的自然语言理解模型

大型语言模型

Transformers 中文

Distil Slovakbert

这是一个基于RoBERTa架构的斯洛伐克语填充掩码模型，适用于处理斯洛伐克语文本任务。

大型语言模型

Transformers 其他

CDLM是一个专注于跨文档语言建模的预训练模型，能够处理多个文档间的语义关系。

大型语言模型

Transformers 英语

Multi Dialect Bert Base Arabic

基于Arabic-BERT初始化并在1000万条阿拉伯语推文上训练的多方言BERT模型，支持阿拉伯语多种方言识别

大型语言模型阿拉伯语

HeBERT是基于希伯来语的预训练语言模型，采用BERT架构，专注于极性分析与情感识别任务。

大型语言模型

Tcr Bert Mlm Only

TCR-BERT 是一个基于 BERT 架构的预训练模型，专门针对 T 细胞受体（TCR）序列进行优化，通过掩码氨基酸建模任务进行训练。

蛋白质模型

Araelectra Base Artydiqa

基于AraELECTRA的阿拉伯语维基百科问答系统，专为阿拉伯语阅读理解任务设计

Transformers 阿拉伯语

这是一个基于GPT-2架构的德语语言模型，专门针对德语文本生成任务进行了优化。

大型语言模型德语

anonymous-german-nlp

Bros Base Uncased

BROS是一个专注于文本与版面布局的预训练语言模型，旨在从文档中高效提取关键信息。

大型语言模型

naver-clova-ocr

Biosyn Sapbert Ncbi Disease

由韩国大学Dmis-lab开发的基于BioBERT的生物医学实体识别模型，专注于NCBI疾病数据集的特征提取任务

Bert Base Portuguese Cased

针对巴西葡萄牙语的预训练BERT模型，在多个NLP任务中达到最先进性能

大型语言模型其他

Chinese Bert Wwm

采用全词掩码策略的中文预训练BERT模型，旨在加速中文自然语言处理研究。

大型语言模型中文

FinancialBERT是基于海量金融文本预训练的BERT模型，旨在推动金融领域自然语言处理的研究与实践。

大型语言模型

Transformers 英语

KoBART是基于BART架构的韩语预训练模型，适用于多种韩语自然语言处理任务。

大型语言模型

Transformers 韩语

Gpt2 Chinese Ancient

专用于生成文言文文本的GPT2模型，基于300万条文言文数据预训练

大型语言模型中文

KoGPT2是基于Huggingface Transformers框架的韩语生成预训练模型，由SKT-AI开发并开源。

大型语言模型

Longformer Base Plagiarism Detection

该模型使用Longformer架构训练，专门用于检测机器改写的抄袭文本，在学术诚信维护中具有重要应用价值。

Transformers 英语

NepaliBERT 是一个基于 BERT 架构的先进尼泊尔语语言模型，采用掩码语言建模（MLM）方法进行训练。

大型语言模型

Chinese Bigbird Base 4096

基于BigBird架构的中文预训练模型，支持4096长度的上下文处理

大型语言模型

Transformers 中文

Bert Base Arabic Camelbert Ca

CAMeLBERT是针对阿拉伯语变体优化的BERT模型集合，CA版本专门针对古典阿拉伯语文本预训练

大型语言模型阿拉伯语

ParsGPT2 是一个波斯语版本的 GPT-2 模型，由 Hooshvare 团队开发，用于波斯语文本生成任务。

大型语言模型其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24