馮睎乾十三維度
20251025
容易受騙的AI
其二,歐洲廣播聯盟 (EBU) 及英國廣播公司 (BBC) 合作的研究顯示,AI助理在傳播新聞資訊時有系統性問題,如45%AI回覆至少有一個顯著毛病,31%回覆在引用資料來源時有嚴重偏差,另有20%的回覆極不準確,包括細節錯誤 (來自AI幻覺) 及資訊過時。以上問題無分語言國界,長此以往,勢必削弱新聞公信力,最終令大眾選擇什麼都不相信。EBU媒體總監Jean Philip De Tender指出,這可能阻礙民主參與。
乍一看,以上當然算壞消息。AI這麼不靠譜,卻天天翻江倒海地量產文字、散播資訊,豈非劣幣驅逐良幣?但從好的一面看,倒也證明AI未能完全取代人,至少它仍然勝不過最優秀的記者、最有才的作家。何況在某些國家,就算沒有AI作怪,他們純人手做出來的新聞也不見得比AI助理準確。早於生成式AI普及之前,有些地方的新聞本來就不止45%有顯著毛病。
自ChatGPT問世以來,我每天都用AI,當然早就異想天開叫它生成文章。但真正可以拿來用的,只限於非常公式化的無聊電郵,即那些不必用腦寫的廢文。若設定一個題目,叫AI替我寫專欄,成品必慘不忍睹。原因很簡單:ChatGPT之類的大型語言模型,說穿了,只是根據概率預測下一個字的機器,巧思不多(如有的話),也無法跟現實世界某個讀者群connect,所以寫出來的東西都很死板、很膠。
寫文也好,看戲也好,靈魂都在細節。即使沒有EBU及BBC的調查,我也早已知道AI匯報的新聞不能盡信,因為它根本掌握不到細節,更分不清哪些是重要的細節。何以見得?不妨舉一有趣的例子。久未聯絡的Andy(盧安迪)日前傳來他設計的三個謎語,說「ChatGPT三題都答錯,但或許有1%香港人能答對」。以下是Andy寫的謎語:
謎語一
他姓譚。
他曾是香港數一數二的流行歌手。
他的伴侶數目是一個謎。
他的年齡已經二十幾年沒有增長。
他有不少「學生」。
他曾獲得金針獎。
他是陳百祥的朋友。
他並不熱衷於踢足球。
謎語二
他姓陳。
他是得獎最多的香港藝人之一。
他曾因工作意外而失去身體某部分。
他的名字被麥當娜知悉。
他的父親曾任公務員。
他的太太曾是藝人。
他有一個二十來歲的女兒。
他的英文並不流利。
謎語三
他可被稱為「阿傑」。
他畢業於香港大學。
他是七八十年代香港頂級流行歌手。
他早期主要唱英文歌,後來轉唱廣東歌。
他懂得彈結他。
他從未有過緋聞。
他的太太有在美國生活的經歷。
他從未跟麥嘉合作。
猜到嗎?ChatGPT其實是「差不多先生」,它的答案,可能也是多數香港人不假思索就說出口的答案——當然都是「幻覺」。AI多幻覺,亦未嘗不是好事,這代表人類有能力欺騙它。萬一《未來戰士(Terminator)》的「天網(Skynet)」成真,人類即使不能力敵,至少還可智取吧?

沒有留言:
發佈留言