O

Opt 175b Hyperparam

由 intlsy 开发
OPT是由Meta AI开发的开放预训练Transformer语言模型,包含1.3B参数,对标GPT-3系列模型
下载量 26
发布时间 : 9/15/2023
模型介绍
内容详情
替代品

模型简介

OPT是基于英文文本预训练的大型语言模型,采用因果语言建模目标训练,可用于文本生成和下游任务微调

模型特点

开放预训练
向研究社区开放的大规模语言模型,促进负责任AI研究
对标GPT-3
性能与规模对标GPT-3系列模型,但更易于研究访问
高效训练
应用了数据收集和高效训练的最新最佳实践

模型能力

文本生成
零样本学习
少样本学习
下游任务微调

使用案例

文本生成
创意写作
生成故事、诗歌等创意文本
可生成连贯的叙事文本
对话系统
构建聊天机器人基础
能生成基本对话响应
研究应用
语言模型研究
研究大语言模型的偏见、毒性等问题
可用于分析模型的社会影响