AI 代理是什麼?｜ExplainThis

在 2024 年底，幾乎全世界在 AI 領域最有影響力的人，都認為 AI 代理 (AI Agents) 是 2025 年最值得關注的 AI 議題。

舉例來說，吳恩達教授在《AI, Agents and Applications》演講最開頭就提到，他認為如果他要選一個最重要、最值得關注的議題，那他會選 AI 代理。

他提到，雖然在社群中很多人都關注在底層的模型，但事實上 AI 代理帶來的幫助來得更大。舉例來說，他提到的一個研究指出，GPT-3.5 模型搭配 AI 代理的技術，在評測 (eval) 之下，表現比 GPT-4 來得更好。

又或者 LinkedIn 的創辦人，同時是多家領先 AI 公司的投資人 Reid Hoffman 在他的 2025 年 AI 趨勢預測中，基本上也是環繞著 AI 代理這個主題展開 (連結)。

因此，在這篇文章，我們會試著來談什麼是 AI 代理。在未來的內容，我們會更詳細談如何開發 AI 代理。

什麼是 AI 代理 (AI Agent)?

AI 代理這個詞早在 90 年代的人工智慧相關研究就出現了，而過去一年社群針對 AI 代理這個詞，還沒有一個收斂到很完整的定義。但大致上的定義都與 Google 在《Agents》白皮書所定義的，不會相差太遠。

該白皮書對代理的定義如下，AI 代理是可以在不須用人類介入的狀況下，根據指定目標，去完成相關任務 (原文是 Agents are autonomous and can act independently of human intervention, especially when provided with proper goals or objectives they are meant to achieve. Agents)。

這樣講起來很抽象，讓我們舉一個工程師會遇到的例子來具體說明。假如今天你被指派一個任務，在原本的程式碼庫當中，有很多很類似的重複程式碼，這讓整體維護性不佳，而你的任務是要解決這個問題。

在沒有任何 AI 助手的狀況下，你可能會這樣做

先自己在程式碼庫中，把相似的程式碼一條條找出來
接著根據這些共通性，分析可以如何進一步抽象化，把能重複用的地方抽成一個方法或函式
接著先寫確保接下來要重構的程式碼，都有測試覆蓋，以免重構後出現預料外的問題
接著用這個被抽出來的函式，去一個個重構原本的程式碼
最後執行測試，確保重構後的程式碼都沒有問題 (如果有問題就回到上面重構的階段進行修改)

在有過去兩年有 ChatGPT 與 GitHub Copilot 等工具的幫助下，可能會變成這樣

先自己在程式碼庫中，把相似的程式碼一條條找出來
丟到 ChatGPT 或 GitHub Copilot，請 AI 幫忙抽出可以重複使用的方法或函式
假如發現沒有測試覆蓋，請 ChatGPT 或 GitHub Copilot 先幫忙寫測試補上
接著到不同檔案，每個檔案請 ChatGPT 或 GitHub Copilot 用被抽出的函式來重構
最後執行測試，確保重構後的程式碼都沒有問題 (如果有問題就回到上面重構的階段進行修改)

那麼在有 AI 代理的狀況下，會有什麼不同呢?

先找出一段要被重構的程式碼，然後跟 AI 代理說「現在程式碼庫有很多相似但不完全一樣的程式碼，請重構避免大量的重複」
接著 AI 代理會掃過整個程式碼，把相似的程式碼都辨識出來
接著 AI 代理會根據相似的程式碼，把重複的部分抽成共用的方法或函式
AI 代理自己先確保有測試，然後補上該補的測試
AI 代理根據重構的程式碼以及相關測試，在終端機先跑測試
如果發現測試沒有通過，就回到修正剛剛抽出的共用方法或函式
重複上述步驟到所有測試都跑過

可以看到，在 ChatGPT 與 GitHub Copilot 等工具的幫助下，工程師的開發速度能獲得很大的加成；但是在過程當中的每個步驟，工程師都還是需要介入，然後在每個步驟跟 ChatGPT 或 GitHub Copilot 持續互動，最終才能完成任務。

而在 AI 代理的模式下，工程師只需用給任務的目標 (這邊是完成重構)，AI 代理就會根據目標去完成任務，在過程中不需要工程師額外的介入。

OpenAI 的 AI 分級

在大致理解完 AI 代理後，讓我們往後拉一個角度，從更宏觀的視角來看 AI 代理是什麼。從宏觀的角度看，AI 代理是通往通用人工智慧 (AGI) 路上的一個階段性里程碑。

大家可以試著想一想，理想中的通用人工智慧應該是什麼樣子? 而在 2022 年末起開始有的 ChatGPT、Claude 等 AI 聊天助手，與這個理想的樣貌還存在什麼差距?

事實上，OpenAI 的執行長 Sam Altman 在多個演講中有談到他們看待通用人工智慧的分類。這個分類有五個不同等級，每一個等級都會更接近通用人工智慧。

等級 1 對話型 AI (conversational AI)：是大家熟悉的 ChatGPT 或 Claude
等級 2 推理型 AI (reasoning AI)：在收到任務後，會先進行推理後才生成回答 (OpenAI 的 o1 與 o3 模型即是這種類型的 AI，比起等級 1，能夠解決更複雜與困難的問題)
等級 3 自動型 AI (autonomous AI)：AI 代理即是這一個等級，比起前一個等級，能夠少去人類在中間的介入
等級 4 創新型 AI (innovating AI)：雖然等級 3 的 AI 代理在執行任務時不需用人為介入，但仍需要來自人類給設定的目標。但到了等級 4 的創新型 AI，就不只是聽命行事，而是能提出超越原本預期的創新
等級 5 組織型 AI (organizational AI)：等級 5 的 AI 則是能在組織層級運作，從策略制定到在負責系統中執，能夠順利完成橫跨團隊的任務。

可以看到 AI 代理是被歸類在等級 3，對比起等級 1 與等級 2，不再需用人類在聊天對話框當中持續輸入，而會在過程中自主思考如何完成任務，然後再根據思考出的規劃，一步步執行，直到完成任務。

閱讀更多

在初步理解完 AI 代理後，相信你可能還有很多問題，例如從從技術架構的角度，該如何理解 AI 代理? 以及軟體工程師可以如何善用 AI 代理? 這些問題我們在 E+ 成長計畫的主題文都有更詳細談到，推薦感興趣的讀者閱讀

本文為 E+ 成長計畫的深度內容，截取段落開放免費閱讀。歡迎加入 E+ 成長計畫閱讀完整版本 (點此了解 E+ 的詳細介紹)。