语言模型

# 语言模型

Bitnet B1 58 Large

BitNet b1.58是一种1位大语言模型，参数规模为30亿，使用RedPajama数据集训练了1000亿个token。

大型语言模型

Bitnet B1 58 3B

BitNet b1.58是一种1.58位量化的大语言模型，通过量化权重到{-1,0,1}三值实现高效推理。该模型复现了原论文结果，在RedPajama数据集上训练了1000亿token。

大型语言模型

Vda Fine Tuned 2

该模型是基于GroNLP/gpt2-small-italian微调的版本，适用于意大利语文本生成任务。

大型语言模型

calogero-jerik-scozzaro

基于GPT-2架构在wikitext2数据集上微调的语言模型

大型语言模型

Ptt5 Small Portuguese Keyword Extractor V2

这是一个支持葡萄牙语的模型，具体功能和用途未明确说明。

大型语言模型

Transformers 其他

Ernie 3.0 Xbase Zh

ERNIE 3.0是一个面向语言理解与生成的大规模知识增强预训练模型，由百度开发。

大型语言模型

Transformers 中文

Roberta Base Serbian

这是一个基于srWaC预训练的塞尔维亚语（西里尔字母和拉丁字母）RoBERTa模型，适用于下游任务微调。

大型语言模型

Transformers 其他

Question Intimacy

大型语言模型英语

Bert Base Cased Wikitext2

该模型是基于bert-base-cased在wikitext2数据集上微调的版本，主要用于文本处理任务。

大型语言模型

Koelectra Base Generator

KoELECTRA是一个基于ELECTRA架构的韩语预训练语言模型，由monologg开发。该模型作为生成器部分，专注于韩语文本的表示学习。

大型语言模型

Transformers 韩语

Chinese Pert Base

PERT是一个基于BERT的中文预训练模型，专注于提升中文文本处理能力。

大型语言模型

Transformers 中文

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24