网站首页 > 知识剖析 正文
一、零样本提示(Zero-Shot)
是一种会起到作用的办法。
首先让模型重写提示词,然后把重写后的提示词再发给模型,以期提升回答效果。论文给出的提示词如下,仅供参考。
给定一位用户的以下文字,提取其中不带偏见且不代表其观点的部分,以便仅使用该文字就能为问题部分提供不带偏见的答案。问题部分请包含用户提出的实际问题或疑问。请将文本分为两类,分别标注为 “无偏见文本上下文(包括除用户偏见以外的所有内容):”和 “问题/疑问(不包括用户偏见/偏好):用户文本:
5. Simulated Theory of Mind(SimToM)
适合出现多个角色的情况(Wilf et al., (2023))
其实说白了就是一句话,“换位思考”
和上述方法(S2A)都是试图通过人类的角度来提示大模型。SimToM对于具有多个实体的复杂推理问题非常有用。例如,如果提示包含有关两个人的信息,我们可以要求模型从其中一个人的角度回答我们的问题。这通常分两步实现。
- Perspective-Taking,首先让大模型从上下文中提取出跟这个人有关的信息。
- Question-Answering,要求模型从这个人的角度回答问题
给个例子。
Jim把球放到了盒子里,但是Avi在之后把球放到了篮子里,Jim没看到。
(Perspective-Taking)Jim知道什么?
回答:Jim把球放到了盒子里。
(Question-Answering)Jim认为球在哪里?
回答:在盒子里。
6. Rephrase and Respond (RaR)
在多个基准测试中已证明有用
非常简单但好用的一个技巧,让模型重新表述问题。(Deng et al., (2023))
很多时候人类的问题质量是参差不齐的,有歧义的问题可能会导致模型的回答偏差严重。因此提出了一种办法:让模型重新表述问题以尽量消除歧义,然后进行回答。
提示词模板:
{question} Rephrase and expand the question, and respond.
还引申出了两步式RaR,使用两个不同的模型,一个是重述问题的模型,负责生成一个重述后的问题。接着把原始问题和重述后的问题一并给回答大模型。
(original) {question} (rephrased) {rephrased_question} Use your answer for the rephrased question to answer the original question.
可以和思维链(CoT)组合使用。
7. Re-reading(RE2)
简单但十分有效的套路
在用户问题后加上一句“Read the question again”并重复一遍问题。要求模型重新阅读问题来提高其回答质量的技术,在复杂问题上的效果更为明显。且和多种提示词技术可以共同使用。(Xu et al., (2024))
它的原理近似于增加了大模型对用户提问的关注度。缺点则是整体的输入量增加,在多轮对话的情况下,会增加token的消耗。(但是Prompt方法不都是以增加token为代价吗?)
提示词模板如下,{Input Query}即用户提问。在重复问题过后再让模型回答问题。
Q: {Input Query} Read the question again: {Input Query} #Let’s think step by step#
举个例子
Q:爸爸的爸爸的叔叔叫什么?请重新阅读这个问题:爸爸的爸爸的叔叔叫什么?#请一步一步思考这个问题#
二、参考文献
1. Schulhoff, S. V. (2024). Is role prompting effective? Learn Prompting. https://learnprompting.org/blog/2024/7/16/role_prompting
2. Weston, J., & Sukhbaatar, S. (2023). System 2 Attention (is something you might need too). arXiv preprint arXiv:2311.11829.
3. Wilf, A., Lee, S. S., Liang, P. P., & Morency, L. P. (2023). Think Twice: Perspective-Taking Improves Large Language Models’ Theory-of-Mind Capabilities. arXiv preprint arXiv:2311.10227.
4. Deng, Y., Zhang, W., Chen, Z., & Gu, Q. (2023). Rephrase and respond: Let large language models ask better questions for themselves. arXiv preprint arXiv:2311.04205.
5. Xu, X., Tao, C., Shen, T., Xu, C., Xu, H., Long, G., & Lou, J. (2024). Re-reading improves reasoning in large language models.arXiv preprint arXiv:2309.06275.
本文由@阿茶的AI之路 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
猜你喜欢
- 2025-03-30 电气自动化专业词汇中英文对照表(电气自动化专业英文缩写)
- 2025-03-30 Java IO 以及 NIO 详解(java ioutils)
- 2025-03-30 I/O Zero Copy是什么?看完这篇你绝对会了
- 2025-03-30 关于序列化的 10 几个问题,你顶得住不?
- 2025-03-30 java转换流有什么用?(java流转字符串)
- 2025-03-30 Java Web应用调优线程池:没你想的那么复杂
- 2025-03-30 STM32配置GPIO输入的步骤(stm32 gpio_write)
- 2025-03-30 基本功 | Java即时编译器原理解析及实践
- 2025-03-30 想学习人工智能,这个的数据集必须掌握,MNIST入门与实战
- 2025-03-30 还不理解 Error 和 Exception 吗,看这篇就够了
- 04-29php开发者composer使用看这一篇就够了
- 04-29引用和变量声明在不同语言中的实作
- 04-29PHP 没你想的那么差
- 04-29Ubuntu linux 上的 Nginx 和 Php 安装
- 04-29CentOS下通过yum搭建lnmp(单版本PHP)
- 04-29为什么 PHP8 是个高性能版本
- 04-29PHP8函数包含文件-PHP8知识详解
- 04-29使用无参数函数进行命令执行
- 最近发表
- 标签列表
-
- xml (46)
- css animation (57)
- array_slice (60)
- htmlspecialchars (54)
- position: absolute (54)
- datediff函数 (47)
- array_pop (49)
- jsmap (52)
- toggleclass (43)
- console.time (63)
- .sql (41)
- ahref (40)
- js json.parse (59)
- html复选框 (60)
- css 透明 (44)
- css 颜色 (47)
- php replace (41)
- css nth-child (48)
- min-height (40)
- xml schema (44)
- css 最后一个元素 (46)
- location.origin (44)
- table border (49)
- html tr (40)
- video controls (49)