為什麼 ChatGPT 要叫 GPT? GPT 是什麼?
2023年9月15日
在《如何使用 ChatGPT?最容易懂的 ChatGPT 介紹與教學》一篇文中,我們講解了什麼是 ChatGPT、要怎麼用。ChatGPT 的名稱是由 Chat 與 GPT 兩個字組合起來的,Chat 是多數人耳熟能詳的單字,就是聊天的意思。因為 ChatGPT 是個聊天機器人,所以很可以理解為什麼名字中有個 Chat,
那 GPT 呢? 假如你過去不曾接觸過 AI 的領域,你可能會對 GPT 這個詞感到陌生。所以你可能會好奇,為什麼 ChatGPT 要有 GPT 這三個字? 而 GPT 這三個字是又是什麼意思呢? 讓我們在這篇介紹。
為什麼叫 GPT?
GPT 是 Generative Pre-trained Transformer 的縮寫,意即生成式預訓練的 Transformer 模型 (因為 Transformer 為專有名詞,這邊不翻譯成中文)。讓我們來逐一了解這三個字代表什麼意思。
首先是 G,英文是 Generative,中文的意思是生成式,這代表的是這個 AI 模型是用於生成新的資料。AI 有很多不同類型,過去比較常見的是辨識型的 AI,例如手機的人臉辨識解鎖,就是透過辨識型 AI 做到。而生成式 AI 是比起辨識更困難的技術,它可以用來生成文字、圖片等資料。
接著是 P,英文是 Pre-trained,中文的意思是預訓練,意即這個 AI 模型是預先被訓練的,GPT 的訓練最開始是無監督式的 (unsupervised),換句話說就是沒有人類介入,沒有特別數據標注,大量地把網路上的資料餵到模型中。在無監督式訓練後,再搭配人類介入的微調 (fine-tuning),讓模型的輸出成為人類偏好的回應。
最後是 T,是指 Transformer,上面提到因為它是一個專有名詞,所以沒有特別翻譯成中文。這個 Transformer 是 Google 在 2017 年提出的一個深度學習模型,這個模型是以注意力 (attention) 為機制來產生預測。而 GPT 正是基於這個 Transformer 模型進一步發展的模型。
在分別了解完 Chat 與 GPT 後,可以得知 ChatGPT 這個聊天機器人,是一種生成式的 AI,所以它會生成新的資料;同時因為它是預訓練的,所以能夠生成出符合人類偏好的內容,讓人覺得它像有智慧一樣。