学术研究专用

# 学术研究专用

Llm Jp 3.1 1.8b Instruct4

由日本国立情报学研究所开发的大语言模型，基于LLM-jp-3构建，通过指令预训练技术显著提升了遵循指令的能力。

大型语言模型

Transformers 支持多种语言

Proofgpt V0.1 6.7B

ProofGPT-v0.1 是一个基于 GPT-NeoX 架构、拥有 67 亿参数的语言模型，训练数据来源于 proof-pile 数据集。

大型语言模型

Transformers 英语

hoskinson-center

Olmo 2 0425 1B SFT

OLMo 2 1B SFT是基于OLMo-2-0425-1B模型的监督微调版本，在Tulu 3数据集上训练，旨在实现多种任务的最先进性能。

大型语言模型

Transformers 英语

Gams 27B Instruct

GaMS-27B-Instruct是基于谷歌Gemma 2系列改进的多语言大语言模型，特别针对斯洛文尼亚语等巴尔干半岛语言优化

大型语言模型

Gams 9B Instruct GGUF

GaMS-9B-Instruct是基于Google Gemma 2系列开发的斯洛文尼亚语大语言模型，支持斯洛文尼亚语、英语及部分南斯拉夫语系语言。

大型语言模型支持多种语言

F5 TTS Vietnamese 100h

基于F5-TTS微调的紧凑版本，训练数据为150小时的越南语语音，仅限研究用途。

语音合成其他

Llama 3.2 3B NuminaQA

基于FineMath-Llama-3B微调的3B参数问答模型，使用Numia-1.5问答数据集训练

大型语言模型

Herald Translator

Herald是一个自然语言标注的Lean 4数据集，主要用于自然语言处理和形式化验证领域的研究。

大型语言模型

C4ai Command R7b 12 2024 Abliterated GGUF

这是c4ai-command-r7b-12-2024-abliterated模型的量化版本，使用llama.cpp进行量化，支持多种量化类型，适用于不同硬件环境。

大型语言模型支持多种语言

VARCO VISION 14B HF

VARCO-VISION-14B是一款强大的英韩视觉语言模型，支持图像和文本输入，生成文本输出，具备定位、指代和OCR功能。

图像生成文本

Transformers 支持多种语言

Llavaguard V1.2 0.5B OV

LlavaGuard是基于视觉语言模型的安全评估守护者，主要用于图像内容的安全分类和违规检测。

图像生成文本

Llavaguard V1.2 7B OV Hf

LlavaGuard是基于视觉语言模型的安全评估系统，用于图像内容的安全分类和合规性检查。

图像生成文本

Llavaguard V1.2 7B OV

LlavaGuard是基于视觉语言模型的安全评估系统，主要用于图像内容的安全分类和合规性检查。

图像生成文本

Moirai Moe 1.0 R Base

这是一个预训练的时间序列预测模型，专注于时序数据分析与预测任务。

Moirai Moe 1.0 R Small

一个基于PyTorch的时间序列预测预训练模型，适用于多种时序数据分析任务

Llama 3.1 SauerkrautLM 70b Instruct AWQ

Wisperlama是由DFG资助的Wispermed小组博士生团队开发的文本生成模型，基于Llama-3.1架构优化。

大型语言模型

Safetensors 支持多种语言

Tucano-2b4是一个专门针对葡萄牙语进行原生预训练的大规模语言模型，基于变换器架构，在2000亿标记的GigaVerbo数据集上训练。

大型语言模型

Transformers 其他

这是一个基于Tinyllama代码框架、使用RedPajama V2德语语料从头训练的德语Tinyllama 1B语言模型。

大型语言模型

Transformers 德语

由Preferred Elements公司基于英日双语开源数据集训练的千亿参数模型，提供商业与非商业双重许可

大型语言模型

Transformers 支持多种语言

Datagemma Rig 27b It

DataGemma是基于Gemma 2微调的系列模型，用于整合Data Commons的公共统计数据，采用检索交错生成方法标注数据来源。

大型语言模型

寒武纪是一个开源的以视觉为核心设计的 multimodal LLM（多模态大语言模型）。

文本生成图像

Moirai 1.1 R Large

Moirai-1.1-R是Salesforce推出的时间序列预测基础模型，针对低频数据预测性能显著提升。

Moirai 1.1 R Base

Moirai-1.0-R模型的全新升级版本，在Monash知识库的40个数据集上取得显著进步，特别针对低频数据场景优化。

Moirai 1.1 R Small

Moirai-1.1-R是Salesforce发布的时间序列预测基础模型，在低频数据（如年数据和季度数据）上表现优异，相比前代模型性能提升约20%。

Brahmai Clip V0.1

基于ViT-L/14和掩码自注意力Transformer的CLIP模型，用于零样本图像分类研究

文本生成图像

Transformers 英语

brahmairesearch

Latxa是基于LLaMA-2架构的巴斯克语大语言模型，专为低资源语言设计，在42亿token的巴斯克语料库上训练

大型语言模型

Transformers 支持多种语言

LlavaGuard是基于视觉语言模型的数据集安全评估与保障框架，主要用于内容安全评估。

图像生成文本

Llama 3 8B SFR SFT R

基于LLaMA-3-8B的监督微调模型，由Salesforce开发，用于强化学习人类反馈（RLHF）工作流程中的监督微调阶段。

大型语言模型

Llamantino 3 ANITA 8B Inst DPO ITA

LLaMAntino-3-ANITA是基于Meta Llama 3构建的多语言（英语+意大利语）大型语言模型，专为意大利语NLP任务优化。

大型语言模型

Transformers 支持多种语言

Minerva 1B Base V1.0

Minerva-1B-base-v1.0是由Sapienza NLP与FAIR及CINECA合作开发的10亿参数意英双语大语言模型，基于2000亿token（各1000亿意/英）训练

大型语言模型

Transformers 支持多种语言

Dictalm2.0 Instruct

基于DictaLM-2.0的指令微调大语言模型，专为希伯来语和英语聊天场景优化

大型语言模型

Transformers 支持多种语言

CNER模型是一个基于DeBERTa-v3-base架构的命名实体识别模型，能够联合识别和分类带有细粒度标签的概念和命名实体。

Transformers 英语

Dictabert Sentiment

专为希伯来语打造的尖端语言模型，基于BERT架构的情感分析模型

Transformers 其他

Qra是由波兰国家信息处理研究所与格但斯克理工大学联合开发的波兰语优化大语言模型系列，基于TinyLlama-1.1B初始化并在900亿波兰语token上训练

大型语言模型

Llava V1.6 Vicuna 7b Gguf

LLaVA是一个开源的多模态聊天机器人，通过在多模态指令跟随数据上微调LLM训练而成。该版本是GGUF量化版本，提供了多种量化选项。

文本生成图像

LLaVA是一个开源的多模态聊天机器人，基于大语言模型微调训练而成，支持图像和文本的交互。

文本生成图像

TURNA是一个基于UL2框架的土耳其语言模型，适用于理解和生成任务，在多项土耳其语任务中表现优异。

大型语言模型

Transformers 其他

UNA TheBeagle 7b V1

TheBeagle是基于The Bagel数据集训练的70亿参数模型，采用DPO（直接偏好优化）和UNA（统一神经架构）技术优化，在多任务中表现优异。

大型语言模型

Teenytinyllama 460m

TeenyTinyLlama-460m是一个针对巴西葡萄牙语优化的开源微型语言模型，参数规模为460M，基于Transformer架构预训练。

大型语言模型其他

Phi 2 Arxiv Physics Instruct

基于Phi-2架构的物理领域问答模型，专门针对arXiv物理学论文内容进行指令微调

大型语言模型

Transformers 英语

AlgorithmicResearchGroup

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24