LoRA高效训练

# LoRA高效训练

Rewiz-Tom-7B是基于Tom-Qwen-7B-Instruct微调的70亿参数模型，专注于推理任务，适用于对话、头脑风暴等场景。

大型语言模型英语

基于Google Gemma-3-4b-pt微调的伪推理专家模型，专为结构化推理/伪诱导推理设计

大型语言模型

T3Q Qwen2.5 14b V1.0 E3

基于Qwen/Qwen2.5-14B-Instruct-1M模型进行后训练的版本，采用LoRA-8-4-0.0001-cosine-32-16配置，训练数据为train_data_v1.0。

大型语言模型

Transformers 支持多种语言

Wiroai Finance Qwen 1.5B

基于Qwen架构的金融领域专用语言模型，通过50万+金融指令微调

大型语言模型

Llama3.1 1B Neo BAAI 1000k

Llama3.1-Neo-1B-100w是基于Meta-Llama-3.1-8B-Instruct剪枝至1.4B参数规模，并采用LLM-Neo方法（结合LoRA与知识蒸馏）微调的高效语言模型。训练数据采样自BAAI/Infinity-Instruct的100万行数据。

大型语言模型

Llama 3 Gutenberg 8B

基于Llama-3-8b的微调模型，使用Gutenberg DPO数据集进行优化，适用于文本生成任务。

大型语言模型

Qra 1b Dolly Instruction 0.1

这是一个基于Qra-1b模型在波兰语指令数据集上微调的问答模型，主要用于回答用户提出的问题。

大型语言模型

Transformers 其他

Indic Gemma 2b Finetuned Sft Navarasa 2.0

基于Gemma-2b微调的多语言指令模型，支持15种印度语言及英语

大型语言模型

Transformers 支持多种语言

Telugu-LLM-Labs

Indic Gemma 7b Finetuned Sft Navarasa 2.0

基于Gemma-7b模型，在15种印度语言和英语的指令数据集上进行LoRA微调的多语言文本生成模型

大型语言模型

Transformers 支持多种语言

Telugu-LLM-Labs

Gemma2b Turkish Instruction

基于Gemma-2b模型针对土耳其语指令-响应对进行微调的文本生成模型，支持约75k训练数据规模

大型语言模型

Transformers 其他

Zhilu 13B Instruct

ZhiLu是基于中文Alpaca2-13B二次开发的金融大语言模型，通过海量中英文语料增量预训练与高质量指令数据对齐实现能力跃升，重点强化金融领域专业表现。

大型语言模型

SYSU-MUCFC-FinTech-Research-Center

Camel Platypus2 70B

Camel-Platypus2-70B 是由 Platypus2-70B 和 qCammel-70-x 合并而成的大型语言模型，基于 LLaMA 2 架构，专注于 STEM 和逻辑推理任务。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24