目前,無論是需要超強(qiáng)硬件支撐的AI迭代與訓(xùn)練,還是運(yùn)行要求相對(duì)較低、需求相對(duì)分散的AI推理,均在超算中心內(nèi)進(jìn)行,采用云生成然后發(fā)送到端的形式運(yùn)作。
但隨著AIGC內(nèi)容愈加豐富,從文本發(fā)展到圖像、視頻等多模態(tài)內(nèi)容,上述模式引發(fā)了一系列的問題,例如網(wǎng)絡(luò)帶寬成本高昂、時(shí)延較為嚴(yán)重等,進(jìn)而影響到AI大模型的商業(yè)化進(jìn)程與用戶使用體驗(yàn)。
而作為算力體系的重要一環(huán),邊緣算力具有低時(shí)延、安全性高等優(yōu)勢(shì)。因此,智能模組的重要性開始凸顯。
智能模組則為邊緣算力的最佳載體,有機(jī)構(gòu)稱其為AI的“毛細(xì)血管”。智能模組是指融入了算力或通用處理芯片的通訊模組,已經(jīng)應(yīng)用于車機(jī)、消費(fèi)等多個(gè)領(lǐng)域。目前,已有廠商嘗試相關(guān)方案:
3月2日,高通中國公眾號(hào)發(fā)布了全球首個(gè)運(yùn)行于安卓手機(jī)上的Stable Diffusion終端側(cè)演示。此前,Stable Diffusion只能在云端計(jì)算集群內(nèi)運(yùn)行。
3月23日,華為推出“智能搜圖”功能,基于多模態(tài)大模型技術(shù),在手機(jī)端側(cè)對(duì)模型進(jìn)行小型化處理。
華為與高通一定程度上驗(yàn)證了高性能邊緣AI的可行性,通過模型壓縮疊加聯(lián)網(wǎng)智能的方式有望在邊緣端實(shí)現(xiàn)AI大模型的體驗(yàn)。在兩者的示范效應(yīng)下,智能物聯(lián)網(wǎng)模組相關(guān)企業(yè)有望獲得發(fā)展。