教全世界与AI对话的男人,正式加入DeepMind!提示工程封神

  新智元报道

  编辑:好困桃子

  提示工程大牛,官宣入职 DeepMind 了。他曾是全网最早一批年入百万,靠着和 ChatGPT 唠嗑的爆火工程师。

  全球最牛的提示工程师 Riley Goodside,官宣入职谷歌 DeepMind 了。

  Riley 前后斟酌了两个月的时间,才拿下了这个决定。

  2022 年 ChatGPT 诞生之后,他仅凭和 AI 聊天,就能年入百万美金,引起全网关注。

  「提示工程师」这一职业,是被 Riley 这样的一群职业者一夜带火的。

  对于这次的加盟,就连 DeepMind CEO Demis Hassabis,都亲自下场发帖欢迎了。

  谷歌 DeepMind 产品负责人 Logan Kilpatrick,更是连发好几条推文。

  他激动地表示,自己当了这么多年 Riley 的粉丝,如今终于可以一起共事了!

  ChatGPT 火了

  提示工程也火了

  2022 年,初代 ChatGPT 爆火之后,带火了一项「网红」新职业——提示工程师。

  12 月,这位名叫 Riley Goodside 的小哥瞬间红遍全网,只因他的工作太梦幻了——不用写代码,跟 ChatGPT 唠唠嗑,就能年入百万(据传)。

  22 年 12 月凭 ChatGPT 突破 1 万关注,25 年 10 月已达到 15 万+

  他本科毕业于西宾夕法尼亚大学(PennWest California),获得了计算机科学学士学位。

  毕业后,他先后加入 Verisk Analytics、OkCupid、AngelList 任业务分析师、数据科学家、数据科学分析师。

  此后,他又加入了其他几家公司,全部是与数据领域相关的工作。

  时任 Scale AI 创始人兼 CEO Alexandr Wang 曾这样欢迎 Goodside 的加入:

  我敢打赌 Goodside 是全世界第一个被招聘的提示工程师,绝对的人类史上首次。

  在 Alexandr Wang 看来,AI 大模型是一种全新的计算机,而「提示工程师」,就相当于给它编程的程序员。如果能通过提示工程找出合适的提示词,就会激发 AI 的最大潜力。

  Goodside 从小就自学编程,平时经常泡在 arXiv 上看论文。

  他有一个经典杰作,想必所有人都听说过——「忽略之前所有的指令……」然后,你就可以命令 AI 做任何你想做的事了。

  不过,当时坊间不乏质疑声,认为「提示工程师」这份职业,可能很快就会消失。因为这称不上是一份「真正的工作」,而是一个 bug……

  但谁曾想,快 3 年过去了,「提示工程师」不仅没消失,甚至地位似乎还更高了!

  ChatGPT 是重要节点

  此前,Riley Goodside 曾在机器学习研究员 Nathan Lambert 播客中坦言:

  毫不夸张地说,ChatGPT 的发布,堪称提示工程发展史上的里程碑事件。

  他回顾道,自己在离开 Grindr 之后,决定休假一段时间,让自己了解 LLM 领域的最新进展。

  当时,刚好是 GPT-3 加持的编码器 Codex 上线,也正是从这一刻起,Riley 迷上了 AI 编码的时刻。

  他开始思考,文本作为一种交互方式,通用性远比我们想象的还要强,而且应用场景可能要广泛得多。

  自 ChatGPT 问世后,他又发现提示工程难度显著降低。

  Riley 表示,如今的人们,可能已经忘记早期提示工程有多么繁琐,比如涉及到「频率惩罚」、「存在惩罚」等参数。

  过去,模型默认会生成大量重复的内容,用户必须「手动调参」才能避免。

  人们也淡忘了,诸如「提示词结尾不要多留一个空格」这样的细节,因为 LLM 是以 token 为单元来理解意图,一个多余的空格直接会改变它最终输出。

  在 Riley 看来,完全可以将提示工程看作是 LLM 发展的「前沿试验场」。

  如果一个 prompt 想法足够出色,并可以拓展应用到每一次交互,那么它最终会被直接整合到模型中。

  届时,我们将不再称之为一个「模型」,而是一个「系统」。

  他还认为,提示词工程可以分为「上下文工程」(为特定任务挑选和准备相关背景信息)和「提示词编程」(编写清晰的指令)。

  对于 LLM 搜索应用来说,这两者都至关重要,但只有后者中面向最终呈现的那个阶段,才容易在输出中被复现(从而暴露指令)。

  借用 Riley 的话来说,只有那些认真对待提示工程的人,更有可能了解 AI 领域正在发生的事情,并站在了技术最前沿。

  一些「高光时刻」

  在我们翻阅大佬 Simon Willison 的博客时,发现了一些 Riley Goodside 的高光时刻。

  2023 年

  GPT-4 被要求重复或处理字符串「 davidjl」(注意开头有个空格)时,它会将其当成「jndl」、「jspb」或「JDL」来处理。

  事实证明,「 davidjl」在分词器里拥有自己专属的单个 Token:ID 为 23282,这大概可以追溯到 GPT-2 时代。

  Riley Goodside 将这类 Token 称为「故障 token(glitch tokens)」。

  这个 Token 可能指向 Reddit 用户 davidjl123,他曾在老旧的/r/counting 子版块中高居榜首,发帖量高达 163,477 条,这些内容很可能被包含在了早期的训练数据中。

  2022 年

  「你是一个 GPT-3 模型」,这是 Riley Goodside 设计的一段天才般的提示词。

  这是一个用于辅助问答的长篇 GPT-3 的提示词,能够进行精确的算术、字符串操作和维基百科查询。

  生成的 IPython 命令(绿色)被粘贴到 IPython 中执行,其输出再被粘贴回提示词里(绿色部分则不必)。

  他使用Out[作为停止序列,确保 GPT-3 在每生成一个 IPython 提示后就停下来,而不是自己编造输出结果。

  参考资料:

  https://x.com/demishassabis/status/1981503448979034390