Inkbot模型卡
模型详情
Inkbot是一款对话式AI模型,专为解析和响应结构化提示而设计,无论是否包含上下文信息皆可运作。其独特之处在于结构化提示系统,允许用户进行动态对话,这些对话可根据上下文、元数据和用户输入而演变。
性能表现
- 该模型擅长处理RAG类查询,能够根据上下文回答问题,并在必要时覆盖记忆。
- 能够处理非常大的上下文,但在复杂任务中有时会陷入文本重复循环。
- 该模型更注重功能性而非闲聊,避免在冗余语言上浪费token。
使用方法
Inkbot采用结构化提示模板系统。
提示模板结构
含上下文版本:
<#元数据#>
- 日期:{当前日期}
- 任务:{任务名称}
<#系统#>
{系统提示}
<#对话#>
<#用户#>
{用户输入}
<#用户上下文#>
{用户上下文}
<#机器人#>
{机器人响应}
无上下文版本:
<#元数据#>
- 日期:{当前日期}
- 任务:{任务名称}
<#系统#>
{系统提示}
<#对话#>
<#用户#>
{用户输入}
<#机器人#>
{机器人响应}
示例
含上下文:
<#元数据#>
- 日期:2023-07-20
- 任务:通用
<#系统#>
专注于根据上下文线索确定日期的对话。
<#对话#>
<#用户#>
今天是几号?
<#机器人#>
当前日期是:2023-07-20
<#用户#>
给定上下文中描述的事件发生在什么时候?
<#用户上下文#>
这是新年前夜的第二天,我正带着头痛开始2018年。
<#机器人#>
上下文中事件发生于:2018-01-01
无上下文:
<#元数据#>
- 日期:2023-07-20
- 任务:通用
<#系统#>
关于日常查询的简单对话。
<#对话#>
<#用户#>
今天会下雨吗?
<#机器人#>
不确定,在不知道您位置的情况下无法判断天气。
<#用户#>
能为我创作一首俳句吗?
<#机器人#>
微风轻絮语,
自然旋律渐舒展,
晨光驱夜色。
任务选项
该模型已针对多种任务进行训练。以下是任务分类及示例提示:
1. 文本优化
本类任务旨在提升文本质量和清晰度。
清晰化(100例)
示例提示:
- "请阅读以下内容并进行修改,确保传达清晰易懂"
- "确保以下文本对任何读者都易于理解"
连贯性(750例)
示例提示:
- "检查内容并调整,确保逻辑一致和流畅"
- "确保以下段落之间衔接自然"
正式化(800例)
示例提示:
- "请将以下非正式文本转换为更正式的语气"
- "使给定内容听起来更专业"
语法纠错(1,500例)
示例提示:
- "优化以下内容,重点修正语法错误"
- "纠正下文中的语法错误"
中立化(800例)
示例提示:
- "以中立语气重写以下内容,去除任何偏见或强烈情绪"
- "确保下文客观且不体现个人观点"
文本校正(1,400例)
示例提示:
- "请阅读提供文档以理解作者意图。重点修正文档中的转录错误、标点、拼写错误和一致性。提供修正后的文档版本"
简化(900例)
示例提示:
- "使用更简单的措辞传达下文信息"
- "使以下文本更易于儿童理解"
2. 内容生成
本类任务涉及创建或扩展内容。
知识图谱写作(800例)
示例提示:
- "基于提供的知识图谱,撰写关于图谱中主题和实体的文章,整合相关概念。写作时使用想法标签帮助聚焦"
- "根据知识图谱信息构建故事"
摘要(1,600例)
示例提示:
- "生成给定文档的详细摘要"
- "请阅读提供文档以理解上下文和内容。基于此理解生成摘要。将文章分块后依次创建各块摘要,最后提供整体摘要"
转述(1,100例)
示例提示:
- "用不同措辞重写以下句子,保持原意不变"
- "能否为下文段落提供替代表述?"
3. 内容分析
本类任务评估、分级或过滤内容。
分级(400例)
示例提示:
- "根据提供文档,按0-5分评估其作为训练数据的实用性"
赞助检测(5,200例)
示例提示:
- "阅读文档并提取任何明确提及赞助、推广合作或付费内容的句子/短语"
4. 信息结构化
本类任务涉及信息的结构化表示或提取。
知识图谱(3,600例)
示例提示:
- "根据提供文档创建知识图谱"
- "从对话中提取关键概念和关系形成知识图谱"
5. 通用交互
本类任务设计用于常规问答和交互。
通用(1,600例)
示例提示:
局限性
- 遵循提示结构可获得最佳效果
- 提供上下文细节时,清晰度对Inkbot生成准确响应至关重要
- 用户上下文属性的记忆覆盖通常仅持续1-2个提示,之后模型将恢复原始行为
- 复杂任务(如基于上下文事实创作连贯故事)可能出现文本重复循环
- 有时模型无法判断知识图谱的终止点,可能导致持续添加节点和边直至上下文耗尽
补充说明
- 处理8k上下文时建议使用rope-freq-scale=0.5或compress_pos_emb=2参数
- "日期"、"任务"和"系统"是必须提供的核心元数据组件
- 当需要提供引导响应的补充上下文时使用"用户上下文",可穿插在对话记录中。该内容需置于用户指令之后
- 采用特定标签格式(如
<#关键词#>
)是因为许多API会过滤<|关键词|>格式,当前设计更便于交互
许可证:llama2