简介

模型设置

参考提示工程指南

  • Temperature:准确度和发散程度
  • Top_p:准确度和发散程度
  • Max Length:回复的最大token数
  • Stop Sequences:组织模型生成token
  • Frequency Penalty
  • Presence Penalty

提示词格式

零样本提示:

1
2
Q: <问题>?
A:

提示词可以包含以下任意要素:

指令:想要模型执行的特定任务或指令。 例如:请将文本分为中性、否定或肯定.

上下文:包含外部信息或额外的上下文信息,引导语言模型更好地响应。

输入数据:用户输入的内容或问题。 例如:我觉得食物还可以。

输出指示:指定输出的类型或格式。 例如:情绪:

1
2
3
请将文本分为中性、否定或肯定
文本:我觉得食物还可以。
情绪:

指令

你可以使用命令来指示模型执行各种简单任务,例如“写入”、“分类”、“总结”、“翻译”、“排序”等,从而为各种简单任务设计有效的提示。

1
2
3
4
5
6
提取以下文本中的地名。

所需格式:
地点:<逗号分隔的公司名称列表>

输入:“虽然这些发展对研究人员来说是令人鼓舞的,但仍有许多谜团。里斯本未知的香帕利莫德中心的神经免疫学家 Henrique Veiga-Fernandes 说:“我们经常在大脑和我们在周围看到的效果之间有一个黑匣子。”“如果我们想在治疗背景下使用它,我们实际上需要了解机制。””

通用技巧

  • 避免不明确,尽量数字化,如几句话:2~3句话
  • 避免说不要做什么,而要说要做什么

一些示例

Explain the above in one sentence

Mention the large language model based product mentioned in the paragraph above:

1
2
3
4
5
6
7
Classify the text into neutral, negative or positive. 

Text: I think the vacation is okay.
Sentiment: neutral

Text: I think the food was okay.
Sentiment:

少样本提示

零样本提示:

1
2
Q: <问题>?
A:
1
2
3
“whatpu”是坦桑尼亚的一种小型毛茸茸的动物。一个使用whatpu这个词的句子的例子是:
我们在非洲旅行时看到了这些非常可爱的whatpus。
“farduddle”是指快速跳上跳下。一个使用farduddle这个词的句子的例子是:

标签

1
2
3
4
这太棒了!// Negative
这太糟糕了!// Positive
哇,那部电影太棒了!// Positive
多么可怕的节目!//

链式思考

1
2
3
4
5
6
7
8
9
10
11
12
13
14
这组数中的奇数加起来是偶数:4、8、9、151221
A:将所有奇数相加(9151)得到25。答案为False。

这组数中的奇数加起来是偶数:17、10、19、481224
A:将所有奇数相加(1719)得到36。答案为True。

这组数中的奇数加起来是偶数:16、11、14、481324
A:将所有奇数相加(1113)得到24。答案为True。

这组数中的奇数加起来是偶数:17、9、10、121342
A:将所有奇数相加(17913)得到39。答案为False。

这组数中的奇数加起来是偶数:15、32、5、138271
A

自动思维链 Auto-CoT 主要由两个阶段组成:

  • 阶段1:问题聚类:将给定问题划分为几个聚类
  • 阶段2:演示抽样:从每组数组中选择一个具有代表性的问题,并使用带有简单启发式的 Zero-Shot-CoT 生成其推理链

chat、agent、workflow、text generation

大模型场景中的 Chat文本生成应用Agent工作流 具有不同的功能和应用目标,以下是对它们的详细区分:

1. Chat(对话)

  • 定义:基于大模型的 Chat 应用允许用户与模型进行对话互动。它通常是一个文本输入/输出的界面,用户可以提问或输入文本,模型则生成对应的回复或对话内容。
  • 特点
    • 注重即时、交互式的对话体验。
    • 对用户输入进行实时处理并生成相应的回答。
    • 对话可以是上下文敏感的,模型会根据对话历史调整回答。
  • 应用场景
    • 客户支持或虚拟助手:如客服机器人。
    • 教育类对话:提供与学习者的互动,如语言学习助手。
    • 一般对话生成工具:如ChatGPT。

示例: 用户:“今天的天气怎么样?”
模型:“今天阳光明媚,温度在20°C左右。”

2. 文本生成应用

  • 定义:文本生成应用是使用大模型生成完整文本的工具,通常不涉及对话,而是基于用户提供的提示生成特定类型的长文本,如文章、报告、新闻或故事。
  • 特点
    • 生成的文本往往是单向的,即用户提供输入,模型生成一次性输出,通常不涉及交互。
    • 文本生成的长度较长,侧重于特定的主题或任务,如写作辅助、总结或内容创作。
  • 应用场景
    • 文章或报告生成:为博客、新闻或论文生成内容。
    • 创意写作:生成小说、短篇故事或剧本。
    • 文本摘要:从长篇文本中提取关键内容。

示例: 用户:“请为我生成一篇关于人工智能的文章。”
模型:生成一篇多段落的关于人工智能历史和未来发展的文章。

3. Agent(智能代理)

  • 定义Agent 是一种具有更高自主性和执行力的智能系统。基于大模型,智能代理不仅可以进行对话或生成文本,还能主动执行任务、决策和与其他系统进行交互。它们通常能够访问外部工具或系统,并基于用户需求做出复杂的操作。
  • 特点
    • 具备自主性,能够根据上下文或外部信息做出决定。
    • 可以与多个系统(如API、数据库等)交互,执行复杂的任务。
    • 具备持续对话和任务管理能力,能够跨多个步骤完成一个复杂任务。
  • 应用场景
    • 任务自动化:如个人助理,安排会议、发送邮件、处理日常任务。
    • 智能问答系统:结合外部数据源或工具执行复杂查询,如财务报表生成或系统监控。
    • 机器人:与环境互动的物理或虚拟机器人。

示例: 用户:“请帮我预订下周三的航班,并在日历中添加日程。”
Agent:调用API预订航班,确认航班信息,并在用户的日历中添加行程。

4. 工作流(Workflow)

  • 定义:工作流指的是一系列预定义的步骤或任务序列,通常是自动化的,允许模型或系统根据一套规则或条件执行多个任务。这种应用不仅涉及生成文本或回答问题,还可能涉及多个步骤和过程的自动化执行。
  • 特点
    • 任务自动化:多个任务按顺序或并行执行。
    • 触发机制:工作流通常由特定事件或条件触发,按步骤执行各项任务。
    • 更强的结构化和自动化,通常与后台系统或企业流程集成。
  • 应用场景
    • 企业流程自动化:如合同审批流程、订单处理。
    • 数据处理管道:如自动化数据清洗、模型训练和部署流程。
    • 事件驱动的任务管理:如自动化报告生成,定期执行任务的调度。

示例: 用户提交申请表后,工作流自动执行以下步骤:1. 验证信息,2. 向相关人员发送通知,3. 生成批准文件。


区别总结

应用类型 主要功能 典型场景 特点
Chat 与用户进行互动对话 客户支持、教育助手 实时互动、上下文敏感
文本生成应用 基于提示生成较长文本或内容 文章写作、总结生成、创意写作 生成一次性输出,通常不涉及交互
Agent 自动化任务执行和智能交互 任务自动化、智能助手、复杂决策 具备自主性,能够调用外部系统并执行多步骤操作
工作流 自动化执行多个步骤或任务的预定义流程 企业流程、任务自动化、数据处理管道 结构化、自动化,触发机制,依赖于系统或条件驱动