AI 代理是什麼?

2025年2月7日

ChatGPT 教學專書
不僅教你 ChatGPT 指令,更帶你實作出創新應用!前往了解

在 2024 年底,幾乎全世界在 AI 領域最有影響力的人,都認為 AI 代理 (AI Agents) 是 2025 年最值得關注的 AI 議題。

舉例來說,吳恩達教授在《AI, Agents and Applications》演講最開頭就提到,他認為如果他要選一個最重要、最值得關注的議題,那他會選 AI 代理。

他提到,雖然在社群中很多人都關注在底層的模型,但事實上 AI 代理帶來的幫助來得更大。舉例來說,他提到的一個研究指出,GPT-3.5 模型搭配 AI 代理的技術,在評測 (eval) 之下,表現比 GPT-4 來得更好。

又或者 LinkedIn 的創辦人,同時是多家領先 AI 公司的投資人 Reid Hoffman 在他的 2025 年 AI 趨勢預測中,基本上也是環繞著 AI 代理這個主題展開 (連結)。

因此,在這篇文章,我們會試著來談什麼是 AI 代理。在未來的內容,我們會更詳細談如何開發 AI 代理。

什麼是 AI 代理 (AI Agent)?

AI 代理這個詞早在 90 年代的人工智慧相關研究就出現了,而過去一年社群針對 AI 代理這個詞,還沒有一個收斂到很完整的定義。但大致上的定義都與 Google 在 《Agents》 白皮書所定義的,不會相差太遠。

該白皮書對代理的定義如下,AI 代理是可以在不須用人類介入的狀況下,根據指定目標,去完成相關任務 (原文是 Agents are autonomous and can act independently of human intervention, especially when provided with proper goals or objectives they are meant to achieve. Agents)。

這樣講起來很抽象,讓我們舉一個工程師會遇到的例子來具體說明。假如今天你被指派一個任務,在原本的程式碼庫當中,有很多很類似的重複程式碼,這讓整體維護性不佳,而你的任務是要解決這個問題。

在沒有任何 AI 助手的狀況下,你可能會這樣做

  • 先自己在程式碼庫中,把相似的程式碼一條條找出來
  • 接著根據這些共通性,分析可以如何進一步抽象化,把能重複用的地方抽成一個方法或函式
  • 接著先寫確保接下來要重構的程式碼,都有測試覆蓋,以免重構後出現預料外的問題
  • 接著用這個被抽出來的函式,去一個個重構原本的程式碼
  • 最後執行測試,確保重構後的程式碼都沒有問題 (如果有問題就回到上面重構的階段進行修改)

在有過去兩年有 ChatGPT 與 GitHub Copilot 等工具的幫助下,可能會變成這樣

  • 先自己在程式碼庫中,把相似的程式碼一條條找出來
  • 丟到 ChatGPT 或 GitHub Copilot,請 AI 幫忙抽出可以重複使用的方法或函式
  • 假如發現沒有測試覆蓋,請 ChatGPT 或 GitHub Copilot 先幫忙寫測試補上
  • 接著到不同檔案,每個檔案請 ChatGPT 或 GitHub Copilot 用被抽出的函式來重構
  • 最後執行測試,確保重構後的程式碼都沒有問題 (如果有問題就回到上面重構的階段進行修改)

那麼在有 AI 代理的狀況下,會有什麼不同呢?

  • 先找出一段要被重構的程式碼,然後跟 AI 代理說「現在程式碼庫有很多相似但不完全一樣的程式碼,請重構避免大量的重複」
  • 接著 AI 代理會掃過整個程式碼,把相似的程式碼都辨識出來
  • 接著 AI 代理會根據相似的程式碼,把重複的部分抽成共用的方法或函式
  • AI 代理自己先確保有測試,然後補上該補的測試
  • AI 代理根據重構的程式碼以及相關測試,在終端機先跑測試
  • 如果發現測試沒有通過,就回到修正剛剛抽出的共用方法或函式
  • 重複上述步驟到所有測試都跑過

可以看到,在 ChatGPT 與 GitHub Copilot 等工具的幫助下,工程師的開發速度能獲得很大的加成;但是在過程當中的每個步驟,工程師都還是需要介入,然後在每個步驟跟 ChatGPT 或 GitHub Copilot 持續互動,最終才能完成任務。

而在 AI 代理的模式下,工程師只需用給任務的目標 (這邊是完成重構),AI 代理就會根據目標去完成任務,在過程中不需要工程師額外的介入。

OpenAI 的 AI 分級

在大致理解完 AI 代理後,讓我們往後拉一個角度,從更宏觀的視角來看 AI 代理是什麼。從宏觀的角度看,AI 代理是通往通用人工智慧 (AGI) 路上的一個階段性里程碑。

大家可以試著想一想,理想中的通用人工智慧應該是什麼樣子? 而在 2022 年末起開始有的 ChatGPT、Claude 等 AI 聊天助手,與這個理想的樣貌還存在什麼差距?

事實上,OpenAI 的執行長 Sam Altman 在多個演講中有談到他們看待通用人工智慧的分類。這個分類有五個不同等級,每一個等級都會更接近通用人工智慧。

  • 等級 1 對話型 AI (conversational AI):是大家熟悉的 ChatGPT 或 Claude
  • 等級 2 推理型 AI (reasoning AI):在收到任務後,會先進行推理後才生成回答 (OpenAI 的 o1o3 模型即是這種類型的 AI,比起等級 1,能夠解決更複雜與困難的問題)
  • 等級 3 自動型 AI (autonomous AI):AI 代理即是這一個等級,比起前一個等級,能夠少去人類在中間的介入
  • 等級 4 創新型 AI (innovating AI):雖然等級 3 的 AI 代理在執行任務時不需用人為介入,但仍需要來自人類給設定的目標。但到了等級 4 的創新型 AI,就不只是聽命行事,而是能提出超越原本預期的創新
  • 等級 5 組織型 AI (organizational AI):等級 5 的 AI 則是能在組織層級運作,從策略制定到在負責系統中執,能夠順利完成橫跨團隊的任務。

可以看到 AI 代理是被歸類在等級 3,對比起等級 1 與 等級 2,不再需用人類在聊天對話框當中持續輸入,而會在過程中自主思考如何完成任務,然後再根據思考出的規劃,一步步執行,直到完成任務。

閱讀更多

在初步理解完 AI 代理後,相信你可能還有很多問題,例如從從技術架構的角度,該如何理解 AI 代理? 以及軟體工程師可以如何善用 AI 代理? 這些問題我們在 E+ 成長計畫的主題文都有更詳細談到,推薦感興趣的讀者閱讀

本文為 E+ 成長計畫的深度內容,截取段落開放免費閱讀。歡迎加入 E+ 成長計畫閱讀完整版本 (點此了解 E+ 的詳細介紹)。

🧵 如果你想收到最即時的內容更新,可以在 FacebookInstagram 上追蹤我們