语言模型微调

# 语言模型微调

基于未知数据集微调的生成模型，具体训练数据和用途信息缺失

大型语言模型

Gemma 2 9b It WPO HB

基于gemma-2-9b-it模型，通过加权偏好优化(WPO)方法微调的大语言模型，提升了离线策略偏好优化的效果。

大型语言模型

Llama 3 Base 8B SFT

SimPO是一种无需参考奖励模型的偏好优化方法，简化了偏好对齐流程。

大型语言模型

Distilbert Base Uncased Distilled Squad

这是一个基于PyTorch实现的NLP模型，结合了语言模型和预测头，支持梯度回传。

大型语言模型

Transformers 英语

Roformer Chinese Small

RoFormer是一种基于旋转位置编码(RoPE)增强的Transformer模型，适用于中文文本处理任务。

大型语言模型中文

Roberta Base Russian V0

这是一个基于TAIGA语料库部分数据训练的类RoBERTa语言模型，主要用于俄语文本处理。

大型语言模型其他

Roberta Hindi Guj San

基于印地语、梵语和古吉拉特语维基百科文章训练的多语言RoBERTa类模型，支持三种印度语系语言处理。

大型语言模型其他

GPT-2 俄语版是基于 OpenAI 的 GPT-2 架构开发的俄语文本生成模型，专门针对俄语文本进行了优化和训练。

大型语言模型

Transformers 其他

MADE AI Dungeon Model RUS

基于GPT-2架构的俄语预训练语言模型，由Sberbank AI开发，适用于俄语文本生成任务。

大型语言模型

Transformers 其他

基于GPT-2架构的俄语文本生成模型，由AI Forever团队开发

大型语言模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24