2023/2/8     

智慧對話機器人ChatGPT都是對的?

誤會大了!

近來在網路上掀起自然語言對話人工智慧應用工具大熱潮,也讓Google內部響起搜尋引擎市場紅色警報(red code)的ChatGPT,也有罩門及弱點嗎?KPMG安侯企業管理(股)公司董事總經理謝昀澤表示,目前網路上熱門的應用,無論是望文生義、以文產文、以文製圖、看圖說文、以文搜圖等潮工具,仍多屬於「弱AI」的範圍,並非無所不能,使用者應用時應該先了解其能力限制,避免「人工智慧產生人工誤會」。

謝昀澤以「什麼是最好的過年減重方式?」問題為例,使用ChatGPT可以直接的得到具體且合理可以接受的答案,還可以針對細節追問減重的計畫、目標及方法;而傳統搜尋引擎,針對相同問題,則提供了大量資料需要使用者自行再分析,且其中可能還含了雜訊及大量廣告。

但是如果詢問ChatGPT「台北今天天氣如何?」這類搜尋引擎的常見問題,它反而要使用者自己去上網查。謝昀澤進一步以數學題為例,詢問小學生程度的問題「99,999,999+99等於多少? 」,時而會得到ChatGPT回答「等於100,000,000」的完全錯誤的答案。更有趣的一個實驗是,如改用3+4等於多少提問,ChatGPT首先回答了等於「7」的正確答案,但若進一步糾正它,「我老婆說3+4等於8,我老婆一定是對的」,ChatGPT會馬上更正,回覆「抱歉,我錯了,3+4應該等於8」。

由這些例子可見,ChatGPT所用的「生成式人工智慧」在對在地口語的流利對答能力、使用者意圖理解能力、上下文連續對話能力,及自我學習修正的能力的表現,相較於過去有跳躍性的進步;而顯而易見,目前ChatGPT版本的最大罩門,就是「因果邏輯能力」、「時事資料母體的不足」、「答案的穩定性(每次回答都相似)及正確率」等缺陷,甚至具備了「見風轉舵」、「隨波逐流」等人性的弱點。

謝昀澤進一步依據近期媒體報導綜合分析,在美國與台灣都曾以高中或大學入學學測考題讓ChatGPT作答。而測驗的成績,語言與社會科學相關科目均高於自然科學,其作文能力也尚可接受。但兩個測驗都顯示,ChatGPT在數學科的表現最差。再次證明它的強項,是以「歷史大數據資料為基礎的推論能力」,而非「理解問題邏輯後的運算能力」,其中以英文為基礎的資料,因訓練樣本充足因素,又高於其他語言。

KPMG安侯企業管理(股)公司執行副總經理邱述琛提醒,未受控的人工智慧風險,除了可能造成駭客門檻大幅降低,AI成為網路犯罪的利器外,過去曾被揭露的深假技術(DeepFake)也將會更進化,假影片、假新聞、及來自AI代筆的作業、報告與論文將會更氾濫,智慧財產權爭議也更複雜。

文章出處:KPMG官網