认知篇:什么是CoT(思维链)? 也许GPT需要你引导

news/2024/5/18 15:25:10 标签: GPT, 大模型, prompts, 论文, 思维链

本系列文章主要是分享一些关于大模型的一些学术研究或者实验性质的探索,为大家更新一些针对大模型的认知。所有的结论我都会附上对应的参考文献,有理有据,也希望这些内容可以对大家使用大模型的过程有一些启发。

注:本系列研究关注的是大型语言模型(Large Language Models, LLMs)的普遍特性,而非专指GPT。在文中,我们使用“GPT”作为一个典型例子来代表这一类模型,但请读者注意,所讨论的观点和结论通常也适用于其他同类大型模型。这样的表述旨在简化叙述,同时也强调了这些发现的广泛适用性。
不定期更新,敬请期待~

Chain-of-Thought(CoT, 思维链)其实是一种日用而不知的技巧。

首先看一个例子,还是上一篇的例子举例:

认知篇:什么是逆转诅咒?一个提问GPT的错误姿势

我还是这么提问:

古诗中,“白云千载空悠悠”的上一句是什么?

在这里插入图片描述

此时再一次生成了一个非常不靠谱的回答。

什么是“思维链提示方法”呢?

没有思维链提示方法的时候,对于上面这个问题,就只能听天由命,等待大语言模型每一次运行产生的一个随机结果中可能有一个是正确的…

那么,使用思维链提示词的方法怎么得到答案呢?你要这么一步步引导GPT得到正确答案。

现在,额外告诉GPT一个信息,看一下GPT能否猜出来。
在这里插入图片描述

看来范围可能还是太大,起不到引导的作用。现在我再给出一些提示,我把这首诗的作者给GPT
在这里插入图片描述

标题猜对了!但是答案仍然是错了。此时几乎已经看到了希望,因为你如果让GPT根据标题《黄鹤楼》背诵全文,这是一个正向的提问,那么不存在什么「逆转诅咒」,那么也就大概率可以得到正确结果了。

那么这一次的提问方式变成了:
在这里插入图片描述

最终回答正确!

这个过程的展示可以见下面这个视频。

如何破解逆转诅咒?一个提问GPT的隐藏技巧

以上就是思维链提示法的工作原理。

对应的论文如下:

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

在这里插入图片描述

思维链最常用的,包括论文里面指出的,就是通过向大语言模型展示一些少量的例子,在样例中解释推理过程,大语言模型在回答提示时也会显示推理过程。这种推理的解释往往会引导出更准确的结果。

所有引导式的提问,鼓励模型自己做出推理的提示方法,都是CoT(思维链)。


http://www.niftyadmin.cn/n/5354478.html

相关文章

每日一道编程题:查找元素位置

题目 给定一个按照升序排列的有序数组和一个目标值,查找出这个目标值在有序数组中的第一个位置和最后一个位置。如果在数组中不存在目标值,则输出[-1,-1]。 输入格式 第一行有两个整数,第一个为目标值整数x,第二个为数组的长度…

【webrtc】m98 : vs2019 直接构建webrtc及unitest工程 1

还是换用了vs2019 构建官方的m98代码打开gn生成的sln 工程 随便点击一个工程turnserver 构建,结果会触发全部构建turnserver构建日志 :构建了整个webrtc ts(1665,8): note: result_of<webrtc::TimeDelta ((lambda at ../../video/adaptation/overuse_frame_detector.cc:55…

使用IAR开发ZigBee初体验——多工程管理介绍工程创建

❗版本说明&#xff1a;IAR Embedded Workbench for 8051 10.10 文章目录 一、使用技巧1.1 简单配置一下1.2 常用快捷键 二、IAR工程架构三、新建工作空间及工程3.1 创建工作空间File->New Workspace3.2 将工作空间另存为3.3 新建工程 Project->Create New Project3.4 给…

MIDI码深度解析

MIDI 协议即数字音乐接口&#xff08;Musical Instrument Digital Interface&#xff09;&#xff0c;是电子乐器、合成器等演奏设备之间的一种即时通信协议&#xff0c;用于硬件之间的实时演奏数据传递。如果理解还不够深刻&#xff0c;官方如下解释&#xff1a; 常用midi硬件…

github 开源的项目: 一个基于Adaptive AUTOSAR标准的软件平台

关于Adaptive-AUTOSAR这个开源项目: 项目的简介和目标:这个项目是一个基于Adaptive AUTOSAR标准的软件平台,它的目标是为了让开发者能够快速地开发和部署基于Adaptive AUTOSAR的应用程序,以适应汽车行业的新需求和新资源。这个项目的特点和优势是: 它实现了AUTOSAR Runtime…

大专生能不能学习鸿蒙开发?

目前安卓有2,000万的开发者。本科及以上学历占比为35%&#xff1b;iOS有2,400万开发者&#xff0c;本科及以上学历占比为40% 绝大多数的前端开发者都是大专及以下学历&#xff0c;在2023年华为开发者大会上余承东透露华为的开发者目前有200万&#xff0c;但鸿蒙开发者统计的数据…

flutter实现:使用三方组件syncfusion_flutter_datagrid

Syncfusion Flutter DataGrid 是一个用于 Flutter 的数据网格组件&#xff0c;它提供了丰富的功能来显示和编辑数据。这个组件提供了灵活的配置选项&#xff0c;使得开发者能够根据需要定制数据的显示和编辑方式。 项目中有两个需求&#xff0c;一是在列表中要使用可变高度&am…

Mysql日志学习

MySQL的两层架构&#xff1a; Server 层负责建立连接、分析和执行 SQL。MySQL 大多数的核心功能模块都在这实现&#xff0c;主要包括连接器&#xff0c;查询缓存、解析器、预处理器、优化器、执行器等。另外&#xff0c;所有的内置函数和所有跨存储引擎的功能都在 Server 层实现…