BERT架构优化

# BERT架构优化

Language Detection

基于BERT的多语言检测模型，支持200种语言的文本分类任务

文本分类支持多种语言

M2 BERT 128 Retrieval Encoder V1

M2-BERT-128是论文《Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT》中提出的8000万参数检索模型检查点

Transformers 英语

Layoutlm Wikipedia Ja

这是一个基于日语文本预训练的LayoutLM模型，主要用于处理日语文档的令牌分类任务。

大型语言模型

Transformers 日语

Environmentalbert Biodiversity

基于EnvironmentalBERT-base微调的生物多样性文本分类模型，专注于ESG/自然领域的生物多样性文本检测

大型语言模型

Transformers 英语

M2 Bert 80M 32k Retrieval

这是一个80M参数的M2-BERT预训练模型，支持长达32768的序列长度，专为长上下文检索任务优化

Transformers 英语

togethercomputer

GHisBERT是基于BERT架构的模型，专为历史德语数据从头训练而成，涵盖德语所有有文献记载的发展阶段。

大型语言模型

基于BERT架构的命名实体识别模型，专门用于标注人名、机构名及美国地址信息

Luke Japanese Wordpiece Base

基于日语BERT改进的LUKE模型，专为日语命名实体识别任务优化

Transformers 日语

EconoBert是基于bert-base-uncased在经济学领域数据集上微调的模型，适用于经济学、政治学和金融学领域的NLP任务。

大型语言模型

Transformers 英语

Geolm Base Toponym Recognition

GeoLM是一个用于从句子中检测地名的语言模型，基于全球范围的OpenStreetMap、WikiData和Wikipedia数据预训练，并在GeoWebNews数据集上微调。

Transformers 英语

Simcse Indobert Base

基于IndoBERT的SimCSE模型，用于生成印尼语句子的语义嵌入向量

Transformers 其他

基于indolem/indobert-base-uncased微调的印尼语文本分类模型，在评估集上准确率达79.54%

大型语言模型

Bert Base Han Chinese Pos Jindai

提供针对古汉语的词性标注功能，训练数据集涵盖汉语发展的四个历史时期。

Transformers 中文

由Sber AI团队与莫斯科国立大学人工智能研究所MLSA实验室联合训练的俄语BERT模型，专注于科学文本处理

大型语言模型

Transformers 其他

Vietnamese Address Embedding

这是一个基于sentence-transformers的模型，能够将越南语地址句子和段落映射到768维的密集向量空间，主要用于地址标准化任务。

哪吒(NEZHA)是一个面向中文理解的神经语境化表征模型，基于Transformer架构，由华为诺亚方舟实验室开发。

大型语言模型

Bert Ancient Chinese

这是一个基于BERT架构的中文预训练语言模型，支持文言文和现代汉语处理。

大型语言模型

Transformers 中文

Sentece Embeddings BETO

基于sentence-transformers的西班牙语BERT模型，用于生成句子和段落的768维向量表示

Legal Hebert Ft

Legal-HeBERT 是一个面向希伯来语法律及立法领域的 BERT 模型，旨在推动希伯来语法律自然语言处理研究与工具开发。

大型语言模型

Arabertmo Base V10

AraBERTMo是基于谷歌BERT架构的阿拉伯语预训练语言模型，支持填充掩码任务。

大型语言模型

Rubert Base Cased Sentiment

基于RuBERT架构的俄语短文本情感分类模型，支持中性、积极和消极三种情感分类

文本分类其他

基于韩语预训练的RoBERTa模型，适用于多种韩语自然语言处理任务。

大型语言模型

Transformers 韩语

Bert Base Arabertv01

基于BERT架构的阿拉伯语预训练语言模型，支持多种阿拉伯语NLP任务

大型语言模型阿拉伯语

Bert Medium Arabic

预训练的阿拉伯语BERT中型语言模型，基于约82亿词的阿拉伯语文本资源训练

大型语言模型阿拉伯语

基于日语维基百科数据集训练的BERT基础模型，适用于日语文本的掩码填充任务

大型语言模型

Transformers 日语

Muril Adapted Local

MuRIL是谷歌开源的基于17种印度语言及其转写版本预训练的BERT模型，支持多语言表示。

大型语言模型支持多种语言

Bert Base Chinese Ws

提供繁体中文的transformers模型及自然语言处理工具

大型语言模型中文

Bert Base Italian Xxl Uncased Finetuned ComunaliRoma

该模型是基于意大利语预训练模型bert-base-italian-xxl-uncased在特定数据集上微调的版本，适用于意大利语文本处理任务。

大型语言模型

当前最先进的希伯来语语言模型，基于BERT架构

大型语言模型其他

Klue Bert Base Aihub Mrc

基于KLUE BERT-base微调的韩语机器阅读理解模型，使用AIHub数据集训练

Transformers 韩语

Dehatebert Mono German

该模型基于多语言BERT微调，专门用于检测德语中的仇恨言论，采用单语（英语）训练数据。

文本分类德语

Hate-speech-CNERG

Arabertmo Base V4

AraBERTMo是一个基于BERT架构的阿拉伯语预训练语言模型，支持填充掩码任务。

大型语言模型

Transformers 阿拉伯语

SloBERTa是一个专门针对斯洛文尼亚语优化的单语BERT类模型，基于Camembert架构开发。

大型语言模型

Transformers 其他

Arabertmo Base V6

AraBERTMo是一个基于BERT架构的阿拉伯语预训练语言模型，支持填充掩码任务。

大型语言模型

Transformers 阿拉伯语

Bert Base Arabic Camelbert Da Sentiment

基于CAMeLBERT方言阿拉伯语模型微调的情感分析模型，支持阿拉伯语文本情感分类

Transformers 阿拉伯语

Chinese Bigbird Base 4096

基于BigBird架构的中文预训练模型，支持4096长度的上下文处理

大型语言模型

Transformers 中文

Arabertmo Base V2

基于BERT架构的阿拉伯语预训练语言模型，支持填充掩码任务

大型语言模型

Transformers 阿拉伯语

Arabertmo Base V3

AraBERTMo是一个基于谷歌BERT架构的阿拉伯语预训练语言模型，支持填充-掩码任务。

大型语言模型

Transformers 阿拉伯语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24