为什么 ChatGPT 要叫 GPT? GPT 是什么?

2023年12月12日

ChatGPT 教學專書
不僅教你 ChatGPT 指令,更帶你實作出創新應用!前往了解

《最容易懂的 ChatGPT 介绍与使用教学》一篇文中,我们讲解了什么是 ChatGPT、要怎么用。ChatGPT 的名称是由 Chat 与 GPT 两个字组合起来的,Chat 是多数人耳熟能详的单字,就是聊天的意思。因为 ChatGPT 是个聊天机器人,所以很可以理解为什么名字中有个 Chat,

那 GPT 呢? 假如你过去不曾接触过 AI 的领域,你可能会对 GPT 这个词感到陌生。所以你可能会好奇,为什么 ChatGPT 要有 GPT 这三个字? 而 GPT 这三个字是又是什么意思呢? 让我们在这篇介绍。

image

为什么叫 GPT?

GPT 是 Generative Pre-trained Transformer 的缩写,意即生成式预训练的 Transformer 模型 (因为 Transformer 为专有名词,这边不翻译成中文)。让我们来逐一了解这三个字代表什么意思。

  • 首先是 G,英文是 Generative,中文的意思是生成式,这代表的是这个 AI 模型是用于生成新的资料。AI 有很多不同类型,过去比较常见的是辨识型的 AI,例如手机的人脸辨识解锁,就是透过辨识型 AI 做到。而生成式 AI 是比起辨识更困难的技术,它可以用来生成文字、图片等资料。

  • 接着是 P,英文是 Pre-trained,中文的意思是预训练,意即这个 AI 模型是预先被训练的,GPT 的训练最开始是无监督式的 (unsupervised),换句话说就是没有人类介入,没有特别数据标注,大量地把网路上的资料喂到模型中。在无监督式训练后,再搭配人类介入的微调 (fine-tuning),让模型的输出成为人类偏好的回应。

  • 最后是 T,是指 Transformer,上面提到因为它是一个专有名词,所以没有特别翻译成中文。这个 Transformer 是 Google 在 2017 年提出的一个深度学习模型,这个模型是以注意力 (attention) 为机制来产生预测。而 GPT 正是基于这个 Transformer 模型进一步发展的模型。

在分别了解完 Chat 与 GPT 后,可以得知 ChatGPT 这个聊天机器人,是一种生成式的 AI,所以它会生成新的资料;同时因为它是预训练的,所以能够生成出符合人类偏好的内容,让人觉得它像有智慧一样。

🧵 如果你想收到最即時的內容更新,可以在 FacebookInstagram 上追蹤我們