時間:05/19/2024 00:00
瀏覽: 8514
AI 產業本週由 OpenAI 新推出 GPT-4o,為多模態模型深入人們日常應用搶頭香,也讓……
新模型 GPT-4o 可接受文字、圖像、音訊的任意輸入組合,即時產生文字、音訊、圖像的任意輸出組合,大大改善 ChatGPT 體驗,尤其與 ChatGPT 互動更像真人交談,帶有屬於人類的情緒和口氣,有時保有耐性,偶而展現俏皮的一面,呈現更自然的人機互動。
從
OpenAI 公布多個使用案例,以及開發者或一般網友初步測試下,支援 GPT-4o 的 ChatGPT 性能令人驚豔:
1. 透過手機鏡頭和 ChatGPT,彷彿讓視障朋友也能看見這個世界。
2. 兩個 ChatGPT 互相交談,透過手機鏡頭分享看到的人事物。
3. 線上教育平台可汗學院(Khan Academy)創辦人 Sal Khan 及兒子 Imran Khan 參與測試,ChatGPT 讀取螢幕顯示的數學題目下,教 Imran Khan 一步步解出正弦 sin(α)。
4. 利用 Mac 版 ChatGPT App,ChatGPT 也能參與視訊會議,提出想法一同討論,最後摘要重點。
5. 面試前,有 ChatGPT 一起做準備,它可給予一些建議。
6. ChatGPT 在發表會現場化身口譯員,流利地翻譯義大利語和英語。
7. 透過 Mac 版 ChatGPT App 和純粹 Breakout 遊戲截圖,就能讓 ChatGPT 生成遊戲程式碼。
8. 手機用 CahtGPT,20 秒就能建立 3D 模型的 STL 檔案。
9. 透過手機鏡頭和 ChatGPT,辨識紙上書寫體文字,雖然有少數幾個字辨識錯誤,體驗仍出色。
10. 支援 GPT-4o 的 ChatGPT 解讀表情的能力更細緻,已達到人類水準。
图片翻摄自网路,版权归原作者所有。如有侵权请联系我们,我们将及时处理。