Cymist2-v01-SFT开源语言模型 - 免费部署助力土英双语高效文本生成

首页

Cymist2 V01 SFT

由 cypienai 开发

Cymist2-v0.1是由Cypien AI团队开发的先进语言模型，专为土耳其语和英语的文本生成任务优化，支持检索增强生成(RAG)和监督微调(SFT)。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #土耳其语生成 #RAG增强 #多语言对话

下载量 2,729

发布时间 : 5/12/2024

模型简介

基于Mistral-7B架构优化的多语言文本生成模型，适用于通用任务和拟人化交互场景。

模型特点

多语言支持

专门优化土耳其语处理能力，同时支持英语文本生成

检索增强生成

集成RAG技术提升生成内容的相关性和准确性

高效推理

支持Flash-Attention 2加速技术，提高生成效率

模型能力

土耳其语文本生成

英语文本生成

检索增强生成

对话系统构建

使用案例

对话系统

土耳其语聊天机器人

构建能自然处理土耳其语的对话助手

内容生成

多语言内容创作

生成土耳其语和英语的营销文案或文章

🚀 Cymist2-v0.1-SFT模型卡片

Cymist2-v0.1-SFT是一款前沿的语言模型，由Cypien AI团队开发，专为文本生成任务进行了优化。该模型借助transformers库构建，并遵循Apache-2.0许可证开源。

🚀 快速开始

新版本发布

cymist-2-v02-SFT

✨ 主要特性

模型描述

开发团队：Cypien AI团队
模型类型：文本生成语言模型
支持语言：土耳其语、英语
许可证：Apache-2.0
微调基础模型：mistralai/Mistral-7B-v0.1

直接使用场景

此模型适用于需要理解土耳其语、具备检索增强生成（RAG）和文本生成能力的通用应用程序。它可以集成到聊天机器人、虚拟助手和其他需要理解并生成类人回复的人工智能系统中。

不适用场景

该模型不适用于可能因错误答案导致危害的关键系统，或需要超出通用文本生成范围的特定领域知识的场景。

📦 安装指南

文档未提及具体安装步骤，可参考transformers库的官方安装说明。

💻 使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "cypienai/cymist2-v01-SFT"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.pad_token_id = tokenizer.eos_token_id

高级用法

使用Flash-Attention 2进一步加速生成：

model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=torch.bfloat16,
        attn_implementation="flash_attention_2"
        )

示例用法

question="Yenilenebilir gıdalar nelerdir ?"
prompt= f"[INST] {question} [/INST]"

with torch.inference_mode():
  input_ids = tokenizer(prompt, return_tensors="pt").to(device)
  output = model.generate(**input_ids, max_new_tokens=8096)
  decoded_output = tokenizer.decode(output[0], skip_special_tokens=False)
  print(decoded_output)