網民怎麼玩 ChatGPT 多模態 GPT-4V (15 個你想不到的驚人應用)
2023年12月12日
ChatGPT 教學專書
不僅教你 ChatGPT 指令,更帶你實作出創新應用!前往了解
生成式 AI 應用的一大突破,是 ChatGPT 開始支援多模態 (multi-modal),換句話說 ChatGPT 現在可以看、可以聽,也可以說了。在社群上,大家會用 GPT-4V 來稱呼可以讀圖片的 GPT (V 代表 Vision,也就是視覺的意思)。
舉例來說,下面的截圖是美國有個網友,分享他上傳一個超複雜的停車告示牌照片,加上要停車的時間,ChatGPT 就直接幫忙判斷現在能不能免費停車、可以免費停多久。
該網友評論「我從此不會再拿到違規停車罰單了」,只能說多模態真的開啟非常多應用的可能性呀!
這邊幫大家彙整網路上已經有的 GPT-4V 應用,只能說非常驚人:
實用
ChatGPT 幫你看懂複雜的路邊標示 [推文]
ChatGPT 解析圖片中以二進制(binary)方式編碼的的秘密訊息 [推文]
用 ChatGPT 分析生態規劃圖 [推文]
連人都看不懂的 recaptha 驗證,來看看 ChatGPT 表現怎麼樣 [推文] (目前看起來還沒有辨識的很好)
ChatGPT 透過圖片分析道路安全 [推文]
工作與學習
ChatGPT 能看懂白板的內容,幫你完成帶有邏輯的程式碼 [推文]
完成 iPhone 計算機 UI 介面與邏輯程式碼 [推文]
ChatGPT 根據照片與提供更好的教學建議 [推文]
上傳算式圖,ChatGPT 幫忙算出答案 [推文](小時候用計算機就覺得很厲害了…現在小學生直接用 ChatGPT 😂)