網民怎麼玩 ChatGPT 多模態 GPT-4V (15 個你想不到的驚人應用)

2023年12月12日

ChatGPT 教學專書
不僅教你 ChatGPT 指令,更帶你實作出創新應用!前往了解
image

生成式 AI 應用的一大突破,是 ChatGPT 開始支援多模態 (multi-modal),換句話說 ChatGPT 現在可以看、可以聽,也可以說了。在社群上,大家會用 GPT-4V 來稱呼可以讀圖片的 GPT (V 代表 Vision,也就是視覺的意思)。

舉例來說,下面的截圖是美國有個網友,分享他上傳一個超複雜的停車告示牌照片,加上要停車的時間,ChatGPT 就直接幫忙判斷現在能不能免費停車、可以免費停多久。

image

該網友評論「我從此不會再拿到違規停車罰單了」,只能說多模態真的開啟非常多應用的可能性呀!

這邊幫大家彙整網路上已經有的 GPT-4V 應用,只能說非常驚人:

實用

  • ChatGPT 幫你看懂複雜的路邊標示 [推文]

  • ChatGPT 解析圖片中以二進制(binary)方式編碼的的秘密訊息 [推文]

  • 用 ChatGPT 分析生態規劃圖 [推文]

  • 連人都看不懂的 recaptha 驗證,來看看 ChatGPT 表現怎麼樣 [推文] (目前看起來還沒有辨識的很好)

  • ChatGPT 透過圖片分析道路安全 [推文]

工作與學習

  • ChatGPT 能看懂白板的內容,幫你完成帶有邏輯的程式碼 [推文]

  • 完成 iPhone 計算機 UI 介面與邏輯程式碼 [推文]

  • ChatGPT 根據照片與提供更好的教學建議 [推文]

  • 上傳算式圖,ChatGPT 幫忙算出答案 [推文](小時候用計算機就覺得很厲害了…現在小學生直接用 ChatGPT 😂)

ChatGPT 解數學題
ChatGPT 解數學題
圖片來源:https://twitter.com/petergyang/status/1707119323729580416/photo/1

有趣

  • 威利躲哪裡去了?來讓 ChatGPT 幫你找找看 [推文]

  • 迷因圖太難懂了?別擔心 ChatGPT 耐心的解釋給你聽 [推文]

ChatGPT 解釋迷因圖
ChatGPT 解釋迷因圖
圖片來源:https://twitter.com/skirano/status/1706874309124194707/photo/1
  • ChatGPT 辨識出有毒的蘑菇,還可以演繹吃下蘑菇後產生幻覺 [推文] 追加請它生成他看到幻覺圖片的指令 [推文]

  • 草寫字難以理解?ChatGPT 幫你讀懂![推文]

  • 辨識漫畫角色?就算背對著也沒問題![推文]

  • 讀出照片上 T 恤上的字,分辨鬍子和短髮 🤯 [推文]

🧵 如果你想收到最即時的內容更新,可以在 FacebookInstagram 上追蹤我們