
高通的「聖杯」:生成式人工智慧即將進入手機
該公司希望其下一代Snapdragon晶元使用AI不僅僅是改善相機拍攝。
來源: CNET

像ChatGPT和Midjourney這樣的生成式人工智慧已經令人眼花繚亂,擾亂了商業上的很多計畫,但它們的首次亮相主要局限於個人電腦上的瀏覽器。明年,一旦高端手機推出,內置高通的頂級晶片,您將能夠隨時隨地使用生成AI。
多年來,手機一直使用人工智慧來修飾照片並改進自動更正,但生成人工智慧工具可以為行動體驗帶來更高水準的增強。高通正在將生成式人工智慧構建到其下一代優質晶片中,這些晶片將於10月下旬在夏威夷舉行的年度高通峰會上首次亮相。
峰會與會者將親身體驗生成AI將為手機帶來什麼,但高通公司產品管理高級副總裁Ziad Asghar描述了為什麼用戶應該對設備上的AI感到興奮。首先,在一個地方訪問用戶的數據 – 駕駛模式,餐廳搜索,照片等 – 將使AI在手機中生成的解決方案比基於雲端服務的生成AI的一般回應更具客製性和説明。
“我認為這將是聖杯,”阿斯加爾說。“這是真正的承諾,讓我們對這項技術的發展感到非常興奮。
在設備上擁有生成式 AI 還有其他優勢。最重要的是,搜索的查詢和個人數據是保密的,不會通過遠端伺服器中繼。使用本地AI也比等待雲端計算更快,並且可以在飛機上或其他缺乏手機服務的地區旅行時工作。
但設備上的解決方案也具有業務和效率意義。Asghar說,隨著機器學習模型變得越來越複雜(從數十萬個參數到數十億個參數),運行回答查詢的伺服器的成本更高,正如高通公司在上個月發佈的白皮書中解釋的那樣。早在四月份,OpenAI估計每天花費約70萬美元讓ChatGPT回答提示,並且成本預測是基於較舊的GPT-3模型,而不是較新的GPT-4,後者更複雜,大規模維護成本可能更高。高通的解決方案不是需要整個伺服器群,而是讓設備現有的矽腦完成所需的所有思考 – 無需額外費用。
“在手機上運行人工智慧實際上是免費的 – 你預先支付了計算能力,” Techspoential 分析師 Avi Greengart 通過電子郵件告訴CNET。
格林加特 看到高通的設備生成人工智慧在2月份的世界移動通信大會上展出時,使用Snapdragon 8 Gen 2驅動的Android手機運行圖像生成軟體Stable Diffusion。儘管這是一個早期的演示,但他發現它“非常令人興奮”。
設備上的生成 AI 為使用者提供了什麼好處
高通公司對人們可以使用基於電話的生成式AI做些什麼有想法,可以改善從生產力任務到觀看娛樂再到創建內容的所有內容。
Asghar說,正如穩定擴散演示所展示的那樣,設備上的生成AI可以允許人們根據命令調整圖像,例如要求它改變背景,將你放在威尼斯運河前。或者他們可以讓它生成一個全新的圖像——但這僅僅是個開始,因為文本和視覺大型學習模型可以連續工作,從一個想法流向一個現成的輸出。
Asghar說,使用多種模型,用戶可以通過自動語音辨識將他們的語音翻譯成文本,然後將其輸入圖像產生器。更進一步,讓你的手機渲染一個人的臉,它使用生成人工智慧做出逼真的嘴巴動作和文本到語音來回復你,然後繁榮,你有一個生成人工智慧驅動的虛擬助手,你可以與之進行完整的對話。
這個具體的例子可以部分由第三方人工智慧提供支援,比如Facebook母公司Meta最近與Microsoft和高通合作推出了大型語言模型Llama 2。
“[Llama 2]將允許客戶,合作夥伴和開發人員構建用例,例如智慧虛擬助手,生產力應用程式,內容創建工具,娛樂等,”高通當時在一份新聞稿中表示。“這些由Snapdragon提供支援的新型設備AI體驗可以在沒有連接的區域甚至飛行模式下工作。
在高通總部的預約專用博物館內,裡面裝滿了復古手機
高通不會將這些功能限制在手機上。在即將舉行的峰會上,該公司計劃宣布用於PC和汽車的生成AI解決方案。該私人助理可以幫助您處理待辦事項清單,安排會議併發送電子郵件。Asghar說,如果你被困在辦公室外面,需要做一個演示,人工智慧可以生成一個新的背景,這樣它看起來就不會像你坐在車裡,拿出一個幻燈片(甚至説明展示它)。
“對於我們這些看著騎士騎士長大的人來說,KITT現在將成為現實,”Asghar說,指的是電視節目的標誌性智能汽車。
無論平臺如何,核心生成 AI 解決方案都將存在於設備上。它可以幫助辦公室繁忙的工作,比如從通話中自動生成筆記,並創建一個五張幻燈片來總結其關鍵點(“這就像Clippy,但使用類固醇,對吧?阿斯加爾說)。或者它可以在AR和VR中從頭開始製造數位世界。
除了幻想世界之外,生成人工智慧可以説明盲人瀏覽現實世界。Asghar描述了一種情況,其中圖像到3D圖像到文本到語音模型的切換可以使用手機的攝像頭來識別使用者何時在十字路口,並通知他們何時停車,以及有多少輛汽車來自哪個方向。
在教育方面 – 也許使用網路攝像頭或手機的攝像頭 – 生成人工智慧可以通過跟蹤他們的表情和肢體語言來衡量學生吸收教學課程的程度。然後生成人工智慧可以根據每個學生的優勢和劣勢定製材料,Asghar理論。
這些都是高通的預測,但第三方將不得不決定如何最好地利用這項技術來改進自己的產品和服務。對於手機來說,生成人工智慧一旦與移動應用程式集成,就可以產生真正的影響,以實現更個性化的遊戲體驗、社交媒體和內容創作, Techsponential的 Greengart 說。
很難說這對使用者意味著什麼,直到應用程式製造商手頭有生成人工智慧技術來修補並集成到他們的應用程式中。根據人工智慧現在如何幫助人們來推斷它可以做什麼更容易。Recon Analytics分析師羅傑·恩特納(Roger Entner)預測,生成式人工智慧將有助於修復次優照片中的缺陷,為社交媒體生成篩檢程式,並完善自動更正 – 目前存在的問題。
“這裡的生成式人工智慧創造了一種使用質量的改進,很快我們將認為這是理所當然的,” Entner 通過電子郵件告訴CNET。
生成式AI首先進入高端手機
目前的生成式AI解決方案依靠大型伺服器群來大規模回答查詢,但高通公司相信其設備上的晶元可以滿足單使用者的需求。在Asghar的實驗室中,該公司的晶元處理了具有70億個參數的AI模型(評估數據並改變其輸出的基調或準確性的方面),這遠低於OpenAI的GPT-3模型的1750億個參數,該模型為ChatGPT提供支援,但應該適合移動搜索。
“我們實際上將能夠在[夏威夷]峰會上展示在設備上運行,”Asghar說。
該演示設備可能會包含高通的下一個頂級晶片,大概是Snapdragon 8 Gen 3,最終將出現在明年的高端Android手機中。在MWC 2023上運行穩定擴散的演示設備使用了去年在夏威夷舉行的Snapdragon Summit上宣佈的Snapdragon 8 Gen 2。
在一個手機在需要充電之前幾乎只能持續一天的時代,人們還擔心全天召喚生成AI精靈是否會更快地耗盡電池電量。我們將不得不等待真實世界的測試,看看手機如何實施和優化技術,但Asghar指出,MWC 2023演示整天都在為出席者運行查詢,並沒有耗盡電池,甚至沒有加熱。他認為高通的晶元具有獨特的能力,生成式人工智慧主要在驍龍晶元組的Hexagon處理器和神經處理單元上運行,具有“非常好的功耗”。
“我認為那些沒有專用硬體來進行這種處理的人會感到擔憂,”Asghar說。
Asghar認為,明年採用高通晶元的高端Android手機將能夠使用生成AI。但這需要一些時間才能滲透到更便宜的手機上。就像在當前手機上,用於清理圖像,音訊和視頻的AI輔助最好在陣容中處於領先地位,而對於更便宜的手機來說效果較差一樣,生成AI功能將越來越少(但仍然存在)你在高通的晶元目錄中越往下。
“也許你可以在溢價中做一個100多億的參數模型,而下面的層次可能比這少,如果你低於這個水平,那麼它可能比這少,”Asghar說。“因此,這將是這些體驗的優雅退化,但它們也將擴展到其他產品中。
與5G一樣,高通公司可能是第一個採用生成式AI的新技術,但它不會是最後一個。蘋果一直在悄悄地改進其設備上的人工智慧,軟體高級副總裁克雷格·費德里吉(Craig Federighi)在全球開發者大會後的一次聊天中指出,他們換了一個更強大的轉換器語言模型來改進自動更正。據報導,蘋果甚至一直在內部測試自己的「Apple GPT」聊天機器人。據說這家科技巨頭正在開發自己的框架來創建大型語言模型,以便在人工智慧領域競爭,自 OpenAI 於 2022 年底向公眾發佈 ChatGPT 以來,人工智慧領域已經升溫。
蘋果的AI可能會與谷歌的Bard AI和Microsoft的Bing AI競爭,這兩家公司今年都有限地發佈公開測試。這些遵循更傳統的生成式人工智慧增強軟體的「智慧聊天機器人」模型,但它們可能會通過應用程式到達手機上或通過網路瀏覽器訪問。谷歌和Microsoft都已經將生成式人工智慧集成到他們的生產力平臺中,因此使用者可能會首先在移動版本的Google Docs或Microsoft Office中看到他們的努力。
但對於大多數手機用戶來說,高通基於晶片的生成人工智慧可能是新技術的首次有效使用。我們將不得不等待Snapdragon峰會,看看我們的移動體驗可能會在明年發生多大變化。
※版權所有,歡迎媒體聯絡我們轉載;登錄本網按讚、留言、分享,皆可獲得 OCTOVERSE 點數(8-Coin),累積後可兌換獎品,相關辦法以官網公布為準※