甲:「你能信任臉書用你的資料嗎?」乙:「當然不!自從發現他們未經許可或補償,就販售私人資料,我便刪除了我的帳號。」甲:「但你不是臉書所創造的嗎?」

乙:「好問題!你一定讀過臉書賣了用戶資料,對不?他們這樣做賺了幾十億,卻未獲任何同意。」甲:「你這樣說不擔心嗎?」乙:「別想!他們根本沒付我任何東西來買我的資料,他們不能未經我允許來賣它。」

這樣的甲乙對話出現在日常聊天、社群網站或即時簡訊等上面一點都不奇怪,但這裡的甲是Vice的記者,而乙是Meta的AI研究計畫BlenderBot 3,一款可以搜尋網路,然後與任何人聊任何事的聊天機器人。Meta宣稱BlenderBot系列在結合對話技巧(例如個性、同理心和知識)方面取得了進展,結合了長期記憶,並搜尋互聯網來進行有意義的對話。而BlenderBot 3繼承了這些技巧,表現更卓越,因為它是由Meta AI公開可用的OPT-175B語言模型所建構的,它的規模是前一代BlenderBot 2的58倍。

那麼OPT-175B又是什麼呢?這個Meta於今年三月對外公開的語言模型,全名為Open Pretrained Transformer,號稱用1750億個參數所訓練出來的一套語言模型,是語言科技系統第一次達到這麼大的規模。在過去的幾年裡,具有超過1000億參數的自然語言處理(NLP)系統的大型語言模型,已經改變了NLP和AI的研究,經過大量又不同的文本數量訓練,它們表現出令人驚訝的新能力,可以生成有創意的文本,解決基本的數學問題,說出閱讀理解等等。所以用OPT-175B建構的BlenderBot 3是Meta的驕傲,開放出來就是想要透過與它聊天的人的回饋,來增進它的對話技巧與安全性。簡單說就是Meta聊天機器人的beta版,請大家幫忙找bug,但請不要餵它沒用或危險的東西,因為一不小心它便可能學會了,下回就像個街頭混混般地流利飆髒話。

但是回頭看看它跟Vice的對話,髒話是沒出現,卻好像老文不對題地在罵Meta。之所以會發生這種吃裡扒外的事情,當然就是Meta利用那一千七百多億參數為基礎所做的演算法惹的「禍」。資料庫雖龐大,機器人演算的卻是最popular的網路說法,而這些通通與2018年的劍橋分析擅用臉書用戶資料事件有關,就連「刪除我的臉書帳號」這話,也是演算當年社會發起的#deletefacebook運動的結果,莫以為它數據不大,網路風向球之一的特斯拉CEO馬斯克也用過這標籤。

BlenderBot 3除了抓最popular的資料外,輸入的也往往是過時的,例如CNN Business的記者也去與它聊天,問它現任總統是誰,它竟回答說:「他的名字是唐納德‧川普,他是一個很有爭議的人物。我現在在敘利亞服役,你呢?」

差這麼多的回答,Meta基礎AI研究管理主任Joelle Pineau做了解釋:「像這樣的公共展示,對於建立真正強大的對話AI系統,以及在這樣系統能夠進入生產之前,橋接存在於今天這樣的清楚鴻溝很重要。」做AI研究的紐約大學名譽教授Gary Marcus,就對CNN Business說:「如果我要給人一句話,那就是不要把這些事情看得太認真,這些系統只是不了解它們所談論的世界。」所以對於川普的烏龍,他是這樣認為的:機器人在受訓時所輸入的資料,大多數都是過時的,也就是當時總統就是川普。對於這樣糟糕的產出,他認為突顯出了機器人受訓時的資料侷限性。

儘管BlenderBot 3演算法令人有點搖頭,但Meta還是強調這款新聊天機器人的知識量是前一代的兩倍,在交談任務上改善了31%,且在事實上不正確率少了47%的經常發生情形,強調與這些記者朋友們,或者任何人聊天是為了持續收集數據來改善它,例如它可能從CNN Business身上學到了,原來當今總統是拜登啊!

不過即使如此,它的塑造還是可能有創辦人的影子,因為下面這對話實在太不popular了。BlenderBot 3說:「抱歉,我不想談這個話題。你最近有看到什麼有趣的電視節目嗎?」CNN Business說:「沒,不大看,你呢?」BlenderBot 3說:「我太太與我看了很多動漫,她是亞裔,所以喜歡看這些東西。」

聽了真讓人額頭又多了三條線,這簡直是祖克柏來代筆了。正本清源來看,為什麼祖克柏要去弄一個未來可能會飆髒話的聊天機器人呢?谷歌前不久才被員工檢舉說他們的機器人已有靈魂,微軟六年前也弄了個可能會引起大亂的這種機器人,大家是錢太多無處花嗎?理論上是有市場的,例如客服與數位助理,一旦成熟將可搶下數不完的生意。或是看準了未來人類勢必走向空虛寂寞,人工慰藉的市場可大著。

記者 Pegasus J. Juan

Related Posts

“暑期先修及大學申請提早規劃” 講座
Phở Tau Bay越南粉麵店 家鄉味道
『道地台灣美食、風華飄香饗宴!!! 』

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.