quietstar-8-ahead开源AI模型 - 生成前先想八步，有效提升推理能力！

首页

Quietstar 8 Ahead

由 ezelikman 开发

基于Mistral-7b模型，采用Quiet-STaR方法进行持续预训练，在生成每个输出词元前会先生成8个思维词元，提升推理能力。

大型语言模型

Transformers

#思维链推理 #数学推理增强 #持续预训练优化

下载量 239

发布时间 : 3/18/2024

模型简介

该模型通过Quiet-STaR方法增强了大语言模型的推理能力，适用于需要复杂推理的文本生成任务。

模型特点

Quiet-STaR持续预训练

采用Quiet-STaR方法进行持续预训练，增强模型推理能力

思维词元生成

在生成每个输出词元前会先生成8个思维词元，提升推理质量

高效推理

基于Mistral-7b架构，保持高效推理速度的同时提升性能

模型能力

复杂文本生成

逻辑推理

多轮对话

知识问答

使用案例

教育

数学问题解答

解答需要多步推理的数学问题

相比基础模型能提供更准确的解答过程

研究

科学文献分析

理解和分析复杂科学文献内容

能更好地理解文献中的逻辑关系

属性	详情
数据集	open-web-math/open-web-math

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Quietstar 8 Ahead

模型简介

模型特点

模型能力

使用案例

🚀 Mistral-7b持续预训练项目

📦 数据集