F

Flan T5 Base

由 google 开发
FLAN-T5是基于T5模型通过指令微调优化的语言模型,支持多语言任务处理,在相同参数量下性能优于原T5模型。
下载量 3.3M
发布时间 : 10/21/2022

模型简介

FLAN-T5是通过在1000多项多语言任务上进行指令微调的T5改进版本,显著提升了零样本和小样本学习能力。

模型特点

多任务指令微调
在1836项跨语言任务上微调,显著提升零样本和小样本学习能力
多语言支持
支持60多种语言的文本生成与理解任务
高效推理
提供FP16和INT8量化支持,可在消费级硬件上运行

模型能力

文本生成
机器翻译
问答系统
文本摘要
指令跟随
少样本学习

使用案例

语言研究
零样本NLP任务
无需微调直接处理未见过的NLP任务
在MMLU基准测试中达到75.2%准确率
多语言翻译
支持60+种语言间的互译
教育应用
语言学习助手
提供多语言语法检查和翻译辅助
AIbase
智启未来,您的人工智能解决方案智库
简体中文