推理: false
库名称: transformers
语言:
- 英语
- 法语
- 德语
- 西班牙语
- 意大利语
- 葡萄牙语
- 日语
- 韩语
- 中文
- 阿拉伯语
- 希腊语
- 波斯语
- 波兰语
- 印尼语
- 捷克语
- 希伯来语
- 印地语
- 荷兰语
- 罗马尼亚语
- 俄语
- 土耳其语
- 乌克兰语
- 越南语
许可证: cc-by-nc-4.0
额外授权提示: "提交此表单即表示您同意许可协议,并确认您提供的信息将根据Cohere的隐私政策被收集、使用和共享。您将收到关于Cohere实验室和Cohere研究、活动、产品和服务的电子邮件更新。您可以随时取消订阅。"
额外授权字段:
姓名: 文本
所属机构: 文本
国家:
类型: 选择
选项:
- 阿鲁巴
- 阿富汗
- 安哥拉
- 安圭拉
- 奥兰群岛
- 阿尔巴尼亚
- 安道尔
- 阿拉伯联合酋长国
- 阿根廷
- 亚美尼亚
- 美属萨摩亚
- 南极洲
- 法属南部领地
- 安提瓜和巴布达
- 澳大利亚
- 奥地利
- 阿塞拜疆
- 布隆迪
- 比利时
- 贝宁
- 博奈尔、圣尤斯特歇斯和萨巴
- 布基纳法索
- 孟加拉国
- 保加利亚
- 巴林
- 巴哈马
- 波斯尼亚和黑塞哥维那
- 圣巴泰勒米
- 白俄罗斯
- 伯利兹
- 百慕大
- 多民族玻利维亚国
- 巴西
- 巴巴多斯
- 文莱达鲁萨兰国
- 不丹
- 布韦岛
- 博茨瓦纳
- 中非共和国
- 加拿大
- 科科斯(基林)群岛
- 瑞士
- 智利
- 中国
- 科特迪瓦
- 喀麦隆
- 刚果民主共和国
- 库克群岛
- 哥伦比亚
- 科摩罗
- 佛得角
- 哥斯达黎加
- 古巴
- 库拉索
- 圣诞岛
- 开曼群岛
- 塞浦路斯
- 捷克
- 德国
- 吉布提
- 多米尼克
- 丹麦
- 多米尼加共和国
- 阿尔及利亚
- 厄瓜多尔
- 埃及
- 厄立特里亚
- 西撒哈拉
- 西班牙
- 爱沙尼亚
- 埃塞俄比亚
- 芬兰
- 斐济
- 福克兰群岛(马尔维纳斯)
- 法国
- 法罗群岛
- 密克罗尼西亚联邦
- 加蓬
- 英国
- 格鲁吉亚
- 根西岛
- 加纳
- 直布罗陀
- 几内亚
- 瓜德罗普
- 冈比亚
- 几内亚比绍
- 赤道几内亚
- 希腊
- 格林纳达
- 格陵兰
- 危地马拉
- 法属圭亚那
- 关岛
- 圭亚那
- 香港
- 赫德岛和麦克唐纳群岛
- 洪都拉斯
- 克罗地亚
- 海地
- 匈牙利
- 印度尼西亚
- 马恩岛
- 印度
- 英属印度洋领地
- 爱尔兰
- 伊朗伊斯兰共和国
- 伊拉克
- 冰岛
- 以色列
- 意大利
- 牙买加
- 泽西岛
- 约旦
- 日本
- 哈萨克斯坦
- 肯尼亚
- 吉尔吉斯斯坦
- 柬埔寨
- 基里巴斯
- 圣基茨和尼维斯
- 韩国
- 科威特
- 老挝人民民主共和国
- 黎巴嫩
- 利比里亚
- 利比亚
- 圣卢西亚
- 列支敦士登
- 斯里兰卡
- 莱索托
- 立陶宛
- 卢森堡
- 拉脱维亚
- 澳门
- 圣马丁(法属部分)
- 摩洛哥
- 摩纳哥
- 摩尔多瓦共和国
- 马达加斯加
- 马尔代夫
- 墨西哥
- 马绍尔群岛
- 北马其顿
- 马里
- 马耳他
- 缅甸
- 黑山
- 蒙古
- 北马里亚纳群岛
- 莫桑比克
- 毛里塔尼亚
- 蒙特塞拉特
- 马提尼克
- 毛里求斯
- 马拉维
- 马来西亚
- 马约特
- 纳米比亚
- 新喀里多尼亚
- 尼日尔
- 诺福克岛
- 尼日利亚
- 尼加拉瓜
- 纽埃
- 荷兰
- 挪威
- 尼泊尔
- 瑙鲁
- 新西兰
- 阿曼
- 巴基斯坦
- 巴拿马
- 皮特凯恩
- 秘鲁
- 菲律宾
- 帕劳
- 巴布亚新几内亚
- 波兰
- 波多黎各
- 朝鲜
- 葡萄牙
- 巴拉圭
- 巴勒斯坦国
- 法属波利尼西亚
- 卡塔尔
- 留尼汪
- 罗马尼亚
- 俄罗斯
- 卢旺达
- 沙特阿拉伯
- 苏丹
- 塞内加尔
- 新加坡
- 南乔治亚和南桑威奇群岛
- 圣赫勒拿、阿森松和特里斯坦-达库尼亚
- 斯瓦尔巴和扬马延
- 所罗门群岛
- 塞拉利昂
- 萨尔瓦多
- 圣马力诺
- 索马里
- 圣皮埃尔和密克隆
- 塞尔维亚
- 南苏丹
- 圣多美和普林西比
- 苏里南
- 斯洛伐克
- 斯洛文尼亚
- 瑞典
- 斯威士兰
- 圣马丁(荷属部分)
- 塞舌尔
- 阿拉伯叙利亚共和国
- 特克斯和凯科斯群岛
- 乍得
- 多哥
- 泰国
- 塔吉克斯坦
- 托克劳
- 土库曼斯坦
- 东帝汶
- 汤加
- 特立尼达和多巴哥
- 突尼斯
- 土耳其
- 图瓦卢
- 台湾
- 坦桑尼亚联合共和国
- 乌干达
- 乌克兰
- 美国本土外小岛屿
- 乌拉圭
- 美国
- 乌兹别克斯坦
- 梵蒂冈城国
- 圣文森特和格林纳丁斯
- 委内瑞拉玻利瓦尔共和国
- 英属维尔京群岛
- 美属维尔京群岛
- 越南
- 瓦努阿图
- 瓦利斯和富图纳
- 萨摩亚
- 也门
- 南非
- 赞比亚
- 津巴布韦
我同意仅将此模型用于非商业用途: 复选框
Aya-23-8B模型卡
注意: 这是Aya的旧版本。最新版本是Aya Expanse 8B,可在此处获取。我们还提供了多模态变体Aya Vision 8B,可在此处获取。
试用Aya Expanse和Aya Vision:
您可以在下载权重之前,在我们的托管Hugging Face Space此处试用最新的Aya模型。
模型概述
Aya 23是一个开放权重的指令微调模型研究版本,具有高度先进的多语言能力。Aya 23专注于将高性能的预训练Command系列模型与最近发布的Aya Collection配对。结果是一个强大的多语言大语言模型,支持23种语言。
此模型卡对应于Aya 23模型的80亿参数版本。我们还发布了350亿参数版本,您可以在此处找到。
我们覆盖23种语言:阿拉伯语、中文(简体与繁体)、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。
开发团队: Cohere Labs 和 Cohere
使用方法
请安装包含此模型必要更改的源存储库中的transformers
from transformers import AutoTokenizer, AutoModelForCausalLM
model_id = "CohereLabs/aya-23-8B"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id)
messages = [{"role": "user", "content": "Anneme onu ne kadar sevdiğimi anlatan bir mektup yaz"}]
input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt")
gen_tokens = model.generate(
input_ids,
max_new_tokens=100,
do_sample=True,
temperature=0.3,
)
gen_text = tokenizer.decode(gen_tokens[0])
print(gen_text)
示例笔记本
此笔记本展示了Aya 23 (8B)的详细使用,包括推理和使用QLoRA进行微调。
模型详情
输入: 模型仅输入文本。
输出: 模型仅生成文本。
模型架构: Aya-23-8B是一个自回归语言模型,使用优化的transformer架构。在预训练后,此模型经过指令微调(IFT)以遵循人类指令。
覆盖语言: 该模型特别针对多语言性进行了优化,支持以下语言:阿拉伯语、中文(简体与繁体)、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。
上下文长度: 8192
评估
有关基础模型、数据、指令微调和评估的更多详情,请参阅Aya 23技术报告。
模型卡联系
对于此模型卡中的错误或其他问题,请联系labs@cohere.com
使用条款
我们希望此模型的发布将使基于社区的研究工作更加普及,通过向全球研究人员发布高性能多语言模型的权重。此模型受CC-BY-NC许可证及可接受使用附加条款的约束,还需遵守Cohere实验室的可接受使用政策。
立即试用模型
您可以在Cohere的playground中试用Aya 23。您也可以在我们的专用Hugging Face Space此处使用它。
引用信息
@misc{aryabumi2024aya,
title={Aya 23: Open Weight Releases to Further Multilingual Progress},
author={Viraat Aryabumi and John Dang and Dwarak Talupuru and Saurabh Dash and David Cairuz and Hangyu Lin and Bharat Venkitesh and Madeline Smith and Kelly Marchisio and Sebastian Ruder and Acyr Locatelli and Julia Kreutzer and Nick Frosst and Phil Blunsom and Marzieh Fadaee and Ahmet Üstün and Sara Hooker},
year={2024},
eprint={2405.15032},
archivePrefix={arXiv},
primaryClass={cs.CL}
}