Google於週二(5/14)舉辦年度新品發表會Google I/O,主題當然離不開AI,尤其主題演講中講了121次AI。但講的再多,可能也莫過於所推出的一個功能實用,TalkBack可以對盲人描述所出現的圖像。

TalkBack運用內建在裝置上,無需連網的大型語言模型(LLM)平台最小版本Gemini Nano的資源,可以為低視力與全盲者,創建物體的聽覺描述。例如在對一件衣服的描述時,TalkBack說:「這是一件黑白連身裙的特寫,這件衣服很短,帶有衣領和長袖,腰部用一個大弓綁起來。」

Google表示,TalkBack用戶每天遇到九十張左右的未標記圖像,使用LLM,該系統將能夠提供內容的洞悉。該平台於今年底會提供給Android用戶,如果它運作得如同發表會上所示範的那樣,相信將會改變低視力與全盲者的輔助器具市場。

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.