V

Velvet 2B

由 Almawave 开发
Velvet-2B是一个20亿参数的意大利语-英语双语大语言模型,基于Transformer架构从头训练,专注于文本生成和理解任务。
下载量 3,784
发布时间 : 2/10/2025
模型介绍
内容详情
替代品

模型简介

Velvet-2B是Velvet系列中的20亿参数版本,针对意大利语和英语进行了优化训练。该模型采用密集架构设计,支持多种自然语言处理任务,包括文本生成、分类、摘要和问答等。

模型特点

双语优化
专门针对意大利语和英语进行了平衡训练,有效降低过拟合偏差
扩展上下文窗口
支持4K token上下文窗口,可扩展至32K,适合处理长文档
多任务能力
经过指令微调,能够执行多种自然语言处理任务
高效推理
采用分组查询注意力(GQA)机制,提高推理效率

模型能力

文本摘要
信息抽取
检索增强生成(RAG)
文本复述
文本蕴含
自然语言推理
常识推理
文本分类
机器翻译
问答系统
文本补全

使用案例

内容生成
文章写作
生成意大利语或英语的新闻、博客等内容
可生成流畅、连贯的文本
产品描述
为电子商务平台生成产品描述
可生成符合产品特性的专业描述
信息处理
文档摘要
对长文档进行关键信息提取和摘要
可生成准确反映原文要点的摘要
问答系统
构建基于知识的问答应用
可提供准确的相关回答
语言服务
机器翻译
意大利语和英语之间的互译
可提供流畅的翻译结果
文本改写
对现有文本进行同义改写
可保持原意同时改变表达方式