12月11日,量子位智庫發(fā)布《2024年度AI十大趨勢報告》,該報告不僅深入剖析AI這一前沿科技如何迭代技術(shù)能力、重塑商業(yè)版圖、引領(lǐng)產(chǎn)業(yè)升級,還敏銳洞察變革趨勢,對未來路徑進行前瞻性展望。
《2024年度AI十大趨勢報告》年度十大趨勢:
1.大模型創(chuàng)新:架構(gòu)優(yōu)化加速涌現(xiàn),融合迭代大勢所趨
2.Scaling Law泛化:推理能力成皇冠明珠,倒逼計算和數(shù)據(jù)變革
3.AGI探索:視頻生成點燃世界模型,空間智能統(tǒng)一虛擬和現(xiàn)實
4.AI應(yīng)用格局:第一輪洗牌結(jié)束,聚焦20賽道5大場景
5.AI應(yīng)用競爭:多領(lǐng)域競速運營大于技術(shù),AI助手兵家必爭
6.AI應(yīng)用增長:AI+X賦能類產(chǎn)品大干快上,原生AI爆款難求
7.AI產(chǎn)品趨勢:多模態(tài)上馬,Agent席卷一切,高度個性化呼之欲出
8.AI智變千行百業(yè):左手變革生產(chǎn)力,右手重塑行業(yè)生態(tài)
9.AI行業(yè)滲透率:數(shù)據(jù)基礎(chǔ)決定初速度,用戶需求成為加速度
10.AI創(chuàng)投:投融資馬太效應(yīng)明顯,國家隊出手頻率提升。
技術(shù)視角大模型創(chuàng)新:架構(gòu)優(yōu)化加速涌現(xiàn),融合迭代大勢所趨
2017年《Attention Is All You Need》論文發(fā)表,Transformer架構(gòu)問世,并逐漸成為自然語言處理領(lǐng)域主流技術(shù)范式。但Transformer并非完美無缺,產(chǎn)學(xué)研界也一直存在一種聲音:架構(gòu)領(lǐng)域需要新的突破,來構(gòu)建強大且高效的新一代基礎(chǔ)大模型。誰將革新甚至顛覆Transformer,取而代之一2023年以來,大量創(chuàng)新大模型架構(gòu)涌現(xiàn),嘗試在保留Transformer優(yōu)勢的同時解決其算力開銷太高的問題,有望在性能與效率上實現(xiàn)突破,對Transformer的絕對統(tǒng)治地位形成有力挑戰(zhàn)。
類循環(huán)神經(jīng)網(wǎng)絡(luò)模型(以RWKV為代表)
狀態(tài)空間模型(以Mamba為代表)
層次化卷積模型(以UniRepLKNet為代表)
多尺度保持機制模型(以RetNet為代表)
液體神經(jīng)網(wǎng)絡(luò)模型(以LFM為代表)……
多種有代表性的技術(shù)路徑,在不同程度保留Transformer架構(gòu)優(yōu)勢的基礎(chǔ)上,結(jié)合RNN、CNN等思想所做出的創(chuàng)新發(fā)展,這也使得大模型架構(gòu)呈現(xiàn)出日益明顯的混合趨勢, 更多創(chuàng)新架構(gòu)具備 “博采眾家之長”的特點。
Scaling Law泛化:推理能力成皇冠明珠,倒逼計算和數(shù)據(jù)變革
技術(shù)層面,另一個備受關(guān)注的重點是Scaling Law的泛化。第一代Scaling Law指引模型開發(fā)者們在參數(shù)量、數(shù)據(jù)集和計算量之間尋找模型性能的最優(yōu)解,引發(fā)了大家對算力、數(shù)據(jù)等資源分配的思考。
量子位智庫觀察到,參數(shù)量與計算量的膨脹帶動我國萬卡集群以及高性能網(wǎng)絡(luò)的建設(shè)和發(fā)展;同時數(shù)據(jù)耗盡危機中,合理善用合成數(shù)據(jù)成為較優(yōu)選擇。
此外,OpenAI o1無疑是今年受矚目的模型之一,在它身上體現(xiàn)了推理能力的大幅提升。以o1為代表的新Scaling Law,促使大模型追求更高的推理能力。
橫向?qū)Ρ華pple Intelligence Foundation、Gemma 2、Llama 3.1、Qwen2訓(xùn)練方法可以看到,后訓(xùn)練的比重正在不斷增加,模仿學(xué)習(xí)+強化學(xué)習(xí)成為典型AI發(fā)展路徑范式。
AGI探索:視頻生成點燃世界模型,空間智能統(tǒng)一虛擬和現(xiàn)實
2024年,AI技術(shù)在多元方向持續(xù)突破,視頻生成、世界模型、具身智能和空間智能等技術(shù)推動了人類對AGI的探索。
視頻生成方面,擴散模型在多任務(wù)中取得顯著成果,已成為視頻?成的主流技術(shù)路徑。尤以DiT(Diffusion Transformer)模型最受矚目。
在世界模型領(lǐng)域,研究者們致力于開發(fā)能夠模擬和理解真實世界的模型,核心在于通過學(xué)習(xí)大量數(shù)據(jù),使模型能夠自然涌現(xiàn)新的行為和決策能力。
與世界模型密不可分的還有具身智能。今年起,具身智能逐漸從概念走向落地,玩家們紛紛推出??的?款?形機器?,同時開始在靈巧?自由度、控制精度和感知技術(shù)上發(fā)力,持續(xù)攻克技術(shù)難題。
而空間智能,則是一個與世界模型和具身智能都緊密相關(guān)的概念。空間智能指的是機器在三維空間和時間中感知、推理和?動的能?,其野望在于將空間計算操控虛擬世界的本領(lǐng)和具?智能觸達(dá)現(xiàn)實世界的能?結(jié)合起來。
產(chǎn)品視角AI應(yīng)用格局:第一輪洗牌結(jié)束,聚焦20賽道5大場景
為了更好地從數(shù)據(jù)維度觀察國內(nèi)產(chǎn)品的現(xiàn)狀,量子位智庫選取了400余款具有代表意義的產(chǎn)品進行研究。
從細(xì)分賽道來看,這400款產(chǎn)品可以具體劃分為20個品類——AI智能助手、AI陪伴、AI相機、AI寫作、綜合類套件、AI修圖、AI視頻、AI教育、AI音樂/音效、AI設(shè)計、AI生圖、AI搜索、AI圖示、AI總結(jié)和AI翻譯,各賽道已分別產(chǎn)生代表產(chǎn)品進而再細(xì)分,并呈現(xiàn)出不同的發(fā)展特點。
其中,AI智能助?是表現(xiàn)最突出的AI原?類產(chǎn)品,也是國內(nèi)?模型?研?商技術(shù)實?的最直觀體現(xiàn)。目前來看,AI智能助手賽道內(nèi)部已經(jīng)出現(xiàn)了明顯的梯隊劃分,豆包取得了斷層式領(lǐng)先。
AI陪伴雖然廣受關(guān)注,但目前整體增長乏力,星野、貓箱等Top產(chǎn)品和Killer APP之間仍有相當(dāng)距離。
AI搜索則已經(jīng)成為新的業(yè)務(wù)布局重點,既包括秘塔AI搜索等原生AI搜索,也包括類似納米搜索、夸克瀏覽器的AI加強搜索和知乎直達(dá)、小紅書達(dá)芬奇等業(yè)務(wù)AI搜索。
如果以具體使用場景劃分,可以分為:重在整體效率提升的全使用場景、整體數(shù)據(jù)表現(xiàn)最優(yōu)的工作提效、2025年有望顯著突破的創(chuàng)意生成、面臨嚴(yán)峻合規(guī)挑戰(zhàn)的休閑娛樂和日常生活等。
AI應(yīng)用競爭:多領(lǐng)域競速運營大于技術(shù),AI助手兵家必爭
為了更好地還原國內(nèi)AI產(chǎn)品的現(xiàn)狀,量子位智庫從用戶規(guī)模、新增速度、用戶活躍和用戶粘性四??度進行了數(shù)據(jù)統(tǒng)計。
目前,APP端和Web端均尚未出現(xiàn)比肩互聯(lián)?時代現(xiàn)象級破圈之作的產(chǎn)品,且整體來看和海外同類型產(chǎn)品相差5倍以上。
在APP端,?前還沒有產(chǎn)品能夠拿出全維度的亮眼表現(xiàn),市場缺乏誕生殺手級產(chǎn)品的場景。
截?2024年10?,共56款產(chǎn)品的歷史下載量超百萬,8款產(chǎn)品歷史下載量超千萬,夸克和豆包的歷史總下載量已過億。
而從單月新增來看,夸克、豆包和Kimi智能助手月增長可達(dá)到千萬級,10款產(chǎn)品可達(dá)百萬級;DAU方面,夸克DAU超過2600萬,豆包、Kimi、天天跳繩和文小言DAU超百萬;用戶粘性方面,夸克和叨叨三日留存率超過30%。
在Web端,AI智能助?賽道外的所有賽道都基本處于停滯狀態(tài),AI搜索、AI寫作、AI?圖等賽道甚?出現(xiàn)了頭部產(chǎn)品數(shù)據(jù)下滑、或是下滑后回升乏力的情況。
用戶規(guī)模方面,月總訪問量超千萬的共7款產(chǎn)品,包括夸克、騰訊文檔、百度文庫、Kimi智能助手、文心一言、豆包和通義。
而在用戶活躍度上,共3款產(chǎn)品——夸克、Notion和百度文庫的MAU超過千萬,19款產(chǎn)品MAU超過百萬。僅有14款產(chǎn)品人均每月訪問超過5次,13款產(chǎn)品平均訪問時長超過10分鐘。
在數(shù)據(jù)統(tǒng)計基礎(chǔ)上,‘量子位智庫AI 100’通過綜合100和原生100兩張榜單提名了國內(nèi)優(yōu)秀的AI產(chǎn)品。
AI應(yīng)用增長:AI+X賦能類產(chǎn)品大干快上,原生AI爆款難求
當(dāng)前,AI產(chǎn)品可被劃分為以AI為底層設(shè)計邏輯的AI原?類產(chǎn)品、在原有互聯(lián)?產(chǎn)品上深度嵌?AI功能的AI+X產(chǎn)品、基于外接API微創(chuàng)新的套殼類產(chǎn)品和將多個產(chǎn)品/模型API集中拼湊的集合站類產(chǎn)品。
從數(shù)據(jù)來看,由于和業(yè)務(wù)流程融合得更為緊密、需求識別明確等原因,AI+X類產(chǎn)品?前的整體數(shù)據(jù)表現(xiàn)顯著優(yōu)于AI原生類產(chǎn)品,并以辦公軟件和內(nèi)容平臺為重點布局領(lǐng)域。
對辦公軟件??,續(xù)寫、改寫、命題寫作等不同程度的AI寫作功能,以及針對論?、?說等不同題材的AI總結(jié)功能基本成為標(biāo)配。
其中,主要業(yè)務(wù)為提供模板及參考內(nèi)容的素材庫類產(chǎn)品和編輯器形態(tài)的辦公軟件表現(xiàn)更為突出,代表產(chǎn)品為百度?庫和WPS AI。由于AI?成效果會直接影響產(chǎn)品的核?使?體驗,此類產(chǎn)品相對更強調(diào)具體功能的精準(zhǔn)度。
而在內(nèi)容平臺中,AIGC?多從三個?向共同發(fā)?:基于平臺內(nèi)容的AI搜索、?于帶動UGC的AI?成功能及模板,還有?檻進?步降低的內(nèi)容創(chuàng)作?具。
基于此,量子位智庫對AI原生類產(chǎn)品提出了場景融合、簡化用戶體驗、品牌信任和推廣三大建議。
AI產(chǎn)品趨勢:多模態(tài)上馬,Agent席卷一切,高度個性化呼之欲出
隨著?模型對圖像和視頻信息的處理能?快速提升,預(yù)計2025年將開始出現(xiàn)更為綜合性的多模態(tài)交互,AI能夠通過物聯(lián)?、特定信息等多種感知通道進?協(xié)同。
多模態(tài)輸?和輸出使AI交互性更強、交互頻次更?,適?場景也更加豐富,AI產(chǎn)品整體水平顯著提升。
Agent作為融合感知、分析、決策和執(zhí)?能?的智能體,能夠根據(jù)?戶歷史行為和偏好,主動提供建議、提醒并個性化執(zhí)?能?,為用戶提供?度個性化的任務(wù)。其交互的主動性和?動化遠(yuǎn)超現(xiàn)有工具。
從技術(shù)和配套設(shè)施兩方面發(fā)展來看,從2025年開始,AI Agent即將?泛投?使?。量子位智庫認(rèn)為,AI Agent有望帶來獨屬于AI 2.0時代的交互?式、產(chǎn)品形態(tài)和商業(yè)模式。
行業(yè)視角AI智變千行百業(yè):左手變革生產(chǎn)力,右手重塑行業(yè)生態(tài)
過去的一年里,量子位智庫發(fā)布多篇深度報告,持續(xù)追蹤AI技術(shù)在千行百業(yè)的落地情況及發(fā)展?jié)摿Α?/p>
當(dāng)前,AI在行業(yè)應(yīng)用中呈現(xiàn)AI+和AI原生兩大情境。
在AI+情境中,AI多以生產(chǎn)力工具角色出現(xiàn),滲透行業(yè)各環(huán)節(jié);在AI原生情境中,行業(yè)則從?開始就基于AI技術(shù)發(fā)展。
量子位智庫在《2024年度AI十大趨勢報告》中分析了AI在智能駕駛、具身智能、智能硬件、游戲、影視、營銷、教育、醫(yī)療8個場景的落地效果和行業(yè)特點。
總而言之,AI對行業(yè)的變革和滲透值得高度關(guān)注,但僅有先后早晚、程度輕重之分,而沒有有無之爭。
AI行業(yè)滲透率:數(shù)據(jù)基礎(chǔ)決定初速度,用戶需求成為加速度
報告中,量子位智庫將AI滲透行業(yè)的關(guān)鍵歸納為3類情景、9大因素,以解碼行業(yè)發(fā)展背后不變的規(guī)律。
以下圖所示的8個代表行業(yè)為例:
AI創(chuàng)投:投融資馬太效應(yīng)明顯,國家隊出手頻率提升
回顧2024年,放眼世界,AI仍舊是最強吸金賽道。
據(jù)統(tǒng)計,國內(nèi)AI行業(yè)融資總金額增加,但事件數(shù)同比下降,反應(yīng)了機構(gòu)更加謹(jǐn)慎的理性態(tài)度;同時馬太效應(yīng)越發(fā)明顯,資本更青睞熱點賽道和高成熟度賽道。
在各細(xì)分賽道中,智能駕駛獨占鰲頭,投資事件數(shù)量和金額總數(shù)遠(yuǎn)超其他賽道,且多家企業(yè)的成功IPO為市場注入了巨大信心與活力。
AI+教育、AI+游戲、AI+醫(yī)療等賽道也迎來了投資總額的增長,調(diào)研統(tǒng)計結(jié)果顯示,機構(gòu)對技術(shù)難度更高、壁壘更強、更晚達(dá)到TPF(Technology-Product Fit)的賽道展現(xiàn)出更強興趣。