领域专用BERT

# 领域专用BERT

DA BERT Old News V1

首个基于丹麦专制时期（1660-1849年）历史文本训练的变压器模型，由奥尔堡大学研究人员开发，用于处理与现代丹麦语差异较大的历史文本语义。

大型语言模型其他

Langcache Embed Medical V1

这是一个基于阿里巴巴NLP/gte-modernbert-base微调的句子转换器模型，专门用于医疗领域的语义文本相似度计算，支持语义缓存功能。

Tsdae Lemone Mbert Base

这是一个基于mBERT的句子转换器模型，专门针对法国法律领域进行优化，能够将法律文本转换为768维向量表示。

文本嵌入法语

louisbrulenaudet

Industry Bert Sec V0.1

专为金融与监管领域优化的BERT句向量转换模型，基于SEC文件训练

Agriculture Bert Base Chinese

这是一个专为农业领域优化的BERT模型，采用MLM（掩码语言模型）自监督学习方法进行训练。

大型语言模型

Transformers 中文

Legalbert-pt 是针对葡萄牙语法律领域的语言模型，通过预训练获得领域专业化能力，可进一步微调用于特定任务。

大型语言模型

Biomednlp BiomedBERT Large Uncased Abstract

BiomedBERT是基于PubMed摘要文本从头预训练的生物医学领域大型语言模型，专注于提升生物医学自然语言处理任务表现。

大型语言模型

Transformers 英语

Biosimcse BioLinkBERT BASE

基于BioLinkBERT的生物医学句子嵌入模型，专为生物医学文本相似度计算设计

基于PatentSBERTa的专利问题与解决方案句子识别模型，可将句子和段落映射到768维稠密向量空间，适用于聚类或语义搜索等任务。

MatSciBERT是一个基于BERT架构的预训练语言模型，专门针对材料科学领域的文本挖掘和信息提取任务进行优化。

大型语言模型

Transformers 英语

Chemical Bert Uncased Pharmaceutical Chemical Classifier

基于13K化学和14K制药维基百科文章段落微调的化学领域语言模型，用于区分制药和化学领域的文本。

Transformers 英语

Biomednlp BiomedBERT Base Uncased Abstract Fulltext

BiomedBERT是基于PubMed摘要和PubMedCentral全文预训练的生物医学领域专用语言模型，在多项生物医学NLP任务中达到最先进水平。

大型语言模型英语

Batterybert Cased Abstract

BatteryBERT-cased是一个专门用于电池相关论文摘要分类的预训练语言模型，基于BERT架构，针对电池领域文本进行了优化。

Transformers 英语

Batteryonlybert Uncased Abstract

这是一个基于BatteryOnlyBERT-uncased的文本分类模型，专门用于电池相关论文摘要的分类任务。

Transformers 英语

Agri Sentence Transformer

这是一个基于sentence-transformers的模型，专门针对农业领域文本优化，能将句子和段落映射到512维向量空间，适用于聚类和语义搜索等任务。

Transformers 英语

Bert Small Japanese Fin

这是一个基于日语文本预训练的BERT模型，特别针对金融领域进行了优化。

大型语言模型

Transformers 日语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24