提示词拼接

1月6日修改
本文讨论了如何拼接提示词以适配 CogAgent-9b-20241220 模型,该模型非连续对话模型,重点介绍了用户输入部分各字段要求、拼接顺序、继续执行的处理及模型回复相关内容。关键要点包括:
1.
用户输入字段要求:用户输入分 task、platform、format、History 四个字段,需严格按字段拼接。task 字段为任务描述,前加 Task:;platform 字段针对不同系统有对应标识;format 字段有多种返回格式选项;History 字段仅保留模型输出的 Action 以及 Grounded Operation 字段信息。
2.
拼接顺序:query = f'{task}{history}{platform}{format}',各部分拼接后需换行;若模型返回 end() 希望继续运行,query = f'{task}[Continue]\n{history}{platform}{format}'。
3.
模型回复:敏感操作在要求返回 Sensitive 时返回;Plan、Agent、Status、Action 字段按需返回;Grounded Operation 字段描述具体操作,有多种操作指令。不同 format 字段要求下模型回复格式和信息不同。
本章节将展示如何拼接提示词以适配 CogAgent-9b-20241220 模型。本模型不是连续对话模型,因此,本章节非常重要,请关注提示词是如何拼接的。
用户输入部分
用户输入部分分为四个字段,必须严格按照字段进行拼接,否则模型无法正常回答
task 字段
用户输入的任务描述,类似文本格式的prompt,该输入可以指导 CogAgent 模型完成用户任务指令。请保证简洁明了。
该字段前面必须增加 Task:关键词。例如,用户的任务是打开微信。则该部分提示词是:
Task: 打开微信
platform 字段
CogAgent 支持在多个平台上执行可操作Agent功能, 我们支持的带有图形界面的操作系统有三个系统,
Windows 10,11,请使用 WIN 字段。
Mac 14,15,请使用 MAC 字段。
Android 13,14,15 以及其他GUI和UI操作方式几乎相同的安卓UI发行版,请使用 Mobile 字段。
如果您使用的是其他系统,效果可能不佳,但可以尝试使用 Mobile 字段用于手机设备,WIN 字段用于Windows设备,MAC字段用于Mac设备。
format 字段
用户希 CogAgent 返回何种格式的数据, 这里有以下几种选项:
Answer in Action-Operation-Sensitive format.: 返回模型的行为,对应的操作,以及对应的敏感程度。
Answer in Status-Plan-Action-Operation format.: 返回模型的装题,行为,以及相应的操作。
Answer in Status-Action-Operation-Sensitive format.: 返回模型的状态,行为,对应的操作,以及对应的敏感程度。
Answer in Status-Action-Operation format.: 返回模型的状态,行为。
Answer in Action-Operation format. 返回模型的行为,对应的操作。