主持人:這個(gè)世界跟人工智能的關(guān)系越來越深刻,尤其身處世界人工智能大會(huì)的現(xiàn)場,你會(huì)明顯感受到人工智能世界何等豐富,發(fā)展有多發(fā)展。今天我們要找一個(gè)專門切入點(diǎn)叫“算力”。
我們都知道,數(shù)據(jù)、算法、算力是敲開AI大門的三把鑰匙,如果說數(shù)據(jù)是其中生產(chǎn)資料的話,生產(chǎn)力就是算力,生產(chǎn)關(guān)系就是其中一些算法。我們今天具體要來說一下跟算力有關(guān),我們演播室請(qǐng)來三位嘉賓,分別是未盡研究創(chuàng)始人周健工,申萬宏源證券研究董事總經(jīng)理、TMT部門總監(jiān)及首席分析師劉洋,還有聯(lián)想集團(tuán)副總裁、ISG中國服務(wù)器事業(yè)部總經(jīng)理陳振寬。我們和三位嘉賓一起,圍繞算力深入探討。
AI有驚喜,算力引焦慮
【資料圖】
主持人:算力是推進(jìn)AI往前發(fā)展的重要?jiǎng)幽苤?。大家都知道各大平臺(tái)現(xiàn)在都在出各種各樣大模型,大模型需要訓(xùn)練,到應(yīng)用階段對(duì)算力的要求更是無窮無盡的,所以,算力發(fā)展的現(xiàn)狀怎樣、未來趨勢如何,算力的缺口有多大、有什么樣的解決方案,就是我們今天要和各位嘉賓一起聊到的。
先想和各位嘉賓聊一聊,您覺得據(jù)您觀察現(xiàn)在人工智能世界到底發(fā)展到什么樣的程度,給你的驚喜是什么?
周健工:我覺得AI最大驚喜就是在一些完成任務(wù)上,比如說對(duì)話,我們一直在說圖靈測試,這是我第一個(gè)感受。第二個(gè)感受大家都在談通用人工智能,以前覺得是相當(dāng)科幻的概念,現(xiàn)在我記得GPT4出來之后,微軟科學(xué)家做了一個(gè)測試,那篇論文業(yè)內(nèi)大家看得很多了,標(biāo)題是通用人工智能的火花。我覺得這個(gè)比喻比較貼切,我們看到一個(gè)火花但是還是處于通用人工智能比較早期階段。
陳振寬:ChatGPT現(xiàn)在用的是ChatGPT3.5的技術(shù),大概是1750億的參數(shù),大家可能有一些相關(guān)資料顯示,人的大腦神經(jīng)元大概是在800億到1000億之間,大腦皮層神經(jīng)元在100億級(jí)別。在800億到1000億這樣一個(gè)參數(shù)實(shí)際上跟人的神經(jīng)元數(shù)量是非常相似的,所以也是大參數(shù)、大模型。到了1750億級(jí)別的時(shí)候,人工智能不止是我們訓(xùn)練它,它根據(jù)我們訓(xùn)練去學(xué)習(xí)、去成長,更重要是它會(huì)自己學(xué)習(xí)、自己進(jìn)化。所以,在今天深層次AI技術(shù)爆發(fā)的時(shí)候,大家發(fā)現(xiàn)一下子大門打開了。
劉洋:AI的整個(gè)復(fù)雜度大了很多。小模型精度很高,通用性、智能性弱一些;大模型有可能精度不用那么高,但是智能性高很多。所以對(duì)我們來講,最大的痛苦不光是橫向擴(kuò)的很多,關(guān)鍵是可能性多了,究竟是用大模型還是小模型,用以前的還是組合的,或是垂類的。這些問題都會(huì)讓我們焦慮,需要用的東西太多了。所以我覺得人工智能2C、2B的應(yīng)用,帶來今天算力焦慮這個(gè)話題,其實(shí)都會(huì)變得比較復(fù)雜,這是我們目前已經(jīng)看到的情況。
主持人:如果應(yīng)用到了讓每一個(gè)人都便捷的程度,現(xiàn)有算力背后能不能支持,這中間還有什么缺口?在過去一段時(shí)間大模型發(fā)展過程當(dāng)中,如何突破算力落差的瓶頸?
周健工:其實(shí)大模型是每18個(gè)月是它的規(guī)模是增長35倍,但是摩爾定律是每18個(gè)月增長2倍,這是一個(gè)速度上的落差。第二,我們也看到國外有些大型企業(yè)不同業(yè)務(wù)部門之間,也在爭搶算力,從這一點(diǎn)上說中國也存在。
主持人:算力落差就是因?yàn)樾酒洳顔??今年英偉達(dá)生意很好供不應(yīng)求,買不到芯片是不是意味著差距就特別明顯?
陳振寬:這一定是其中一個(gè)影響因素,但我看到另外一個(gè)因素。剛才講到,我們的大參數(shù)里面跟人的神經(jīng)元數(shù)量一樣,但這個(gè)算力所消耗的功耗跟人的大腦所消耗的功耗,完全不是一個(gè)數(shù)量級(jí)。要支撐這么大的算力,功耗的要求是非常高的。我們需要研究,當(dāng)我們的算力不斷增長的時(shí)候怎么解決功耗的問題,如何實(shí)現(xiàn)碳達(dá)峰要求。所以在技術(shù)上,我們可能要考慮是否能夠從現(xiàn)在風(fēng)冷的散熱變成液冷散熱,是不是能夠有一些更好條件來支撐我們算力不斷增長,但是功耗仍然控制在我們的星球所能承受范圍之內(nèi)。這是我們未來要考慮的另外一個(gè)因素,即除了做算力競賽以外,可能還要考慮如何在節(jié)能減排方面有更好更優(yōu)方案。這個(gè)方面做得好了,我相信即便有落差,我們總有一天也能迎頭趕上。
算力發(fā)展仍在“熱身階段”
主持人:我們目前算力市場整體發(fā)展到什么程度,夠用嗎?
周健工:我只能大面講,陳總是專家。我自己覺得總量上,中國和國外國家不相上下,在普通算力、智能算力、超算總量上不相上下。甚至有一些中國還占優(yōu)勢,比如說智能算力。但是在這一輪跟大模型和人工智能相關(guān)算力上,中國是存在比較大的落差。另外一塊當(dāng)然從企業(yè)做數(shù)據(jù)中心、云計(jì)算這一塊,中國企業(yè)跟國際頭部有比較明顯的差距。第三方面,我們現(xiàn)在處在一個(gè)模型訓(xùn)練算力比較緊缺,但是將來如果是生成人工智能發(fā)展普及比較快,將來會(huì)更多是應(yīng)用更廣,對(duì)推理需求是更高的,其實(shí)對(duì)算力時(shí)延要求更高。所以我們希望到那時(shí)候,整個(gè)算力發(fā)展能滿足這些需求。
主持人:陳總作為專業(yè)人士作為聯(lián)想專業(yè)人士,您是如何來解讀算力目前缺口大還是未來缺口大?
陳振寬:我們把人工智能的算力當(dāng)成一種賽事的話,這個(gè)比賽才剛開始。今天很多企業(yè)在這場賽事里面參賽,實(shí)際上都是早期階段做了基礎(chǔ)準(zhǔn)備?,F(xiàn)在在熱身或者是剛進(jìn)入熱身階段的企業(yè),它們?cè)诖竽P偷耐度肷弦呀?jīng)是按照百億人民幣投入的。但是要真正去訓(xùn)練好大模型,這還有很多工作要做,我相信這是要持續(xù)進(jìn)行投入的地方。
以聯(lián)想來說,我們自己不會(huì)參與到大模型賽道,不會(huì)去做去訓(xùn)練大模型,但是我們?yōu)樗写罱ê陀?xùn)練大模型的企業(yè)去提供基礎(chǔ)設(shè)施和服務(wù),比如說提供GPU服務(wù)器,人工智能服務(wù)器。以前,如果不是人工智能服務(wù)器,一個(gè)通用服務(wù)器的研發(fā)投入大概是兩千萬人民幣,但是做GPU、人工智能服務(wù)器投入是需要通用計(jì)算五倍,是按億作為計(jì)算的。除了更加復(fù)雜以外,里面還要考慮剛才提到的散熱、更快聯(lián)接速度等很多要素。所以在技術(shù)上的投入是非常龐大的。另外,在未來訓(xùn)練完以后要開始做推理,推理用于各種場景無處不在,邊緣甚至個(gè)人,這個(gè)對(duì)算力要求仍然會(huì)持續(xù)增加。所以,如何在這樣的場景中持續(xù)進(jìn)行優(yōu)化,以更加普慧的能力去提供未來整體人工智能相關(guān)的產(chǎn)業(yè)理論服務(wù),這是我們持續(xù)要考慮的地方。
所以,路還很長。
主持人:我剛才咨詢了微軟投OpenAI開發(fā)出的ChatGPT,其實(shí)背后微軟數(shù)據(jù)中心建設(shè)就跟聯(lián)想有很大關(guān)系。具體情況是怎樣的?
陳振寬:聯(lián)想是一家全球化走得比較早、做得也比較成功的一家中國企業(yè),我們海外業(yè)務(wù)占了差不多3/4左右。微軟是我們海外客戶的一個(gè)代表。我們還有很多微軟這樣非常優(yōu)秀的客戶。我們?cè)谌虼蟾庞?個(gè)生產(chǎn)制造基地,有10個(gè)研發(fā)中心。我們也希望,能夠在未來積極參與到國內(nèi)人工智能的服務(wù)當(dāng)中,服務(wù)好我們的客戶。
主持人:從資本市場來看,這個(gè)細(xì)分的行業(yè)當(dāng)中再細(xì)分有哪些投資機(jī)會(huì)?。
劉洋:一方面很明顯我們的機(jī)架里面包括服務(wù)器要升級(jí),其中AI滲透率我感覺會(huì)慢慢達(dá)到50%是有可能,價(jià)格量價(jià)齊升。還有很多工程設(shè)計(jì)問題,液冷、風(fēng)冷、散熱等等各種各樣的,以及相關(guān)的光器件、光模塊。其實(shí)我們還有一些市場還沒有特別注意。比如說很有可能我們現(xiàn)在超算數(shù)據(jù)中心里面,專門針對(duì)科學(xué)或者一些蛋白質(zhì)分子生成或者是氣象預(yù)測,這種東西是由于以前算力不具備,我們就沒有辦法衍生,但是可以大大提升科研和學(xué)術(shù)的下限,把很多很難測的東西變成可能。總之我現(xiàn)在覺得,至少是AI芯片、服務(wù)器,光器件、光模塊,封裝測試技術(shù)和芯片架構(gòu),相應(yīng)的一些AI應(yīng)用都會(huì)有很大機(jī)會(huì)?,F(xiàn)在市場基本上是注意到了AI服務(wù)器、芯片和光器件,后面還有一些沒有特別注意,而且周期和機(jī)會(huì)可能會(huì)反復(fù)來襲。
普慧算力建設(shè)正當(dāng)時(shí)
主持人:中國算力基礎(chǔ)設(shè)施,在全球競賽建設(shè)當(dāng)中是處于一個(gè)什么樣的位置?
陳振寬:聯(lián)想是一個(gè)服務(wù)提供商,是這個(gè)賽道上面幫助做大模型搭建算力提供商。從我們自身來看,聯(lián)想今天在全球的服務(wù)器廠商當(dāng)中現(xiàn)在是全球前三,前兩名是兩個(gè)美國企業(yè),中國企業(yè)排在全球市場也排最前面。我們也希望,未來能夠更好地投身在國內(nèi)所有的人工智能算力建設(shè)過程中,能夠更多賦能我們國內(nèi)企業(yè),能夠給他們提供更大的助力。
主持人:提到賦能更多企業(yè),我注意到聯(lián)想提供一個(gè)普慧算力新的主張。普慧算力具體指什么?
陳振寬:普慧算力把它解讀拆開來一個(gè)是普適(Inclusive),一個(gè)是智慧(Intelligent),在普適里面我們提出三個(gè)A。一個(gè)是(Affordable)人人可得,一個(gè)是(Available)人人可用,一個(gè)是(Adaptable)人人適用,這是普適的意思。另外對(duì)于智慧來說,我們對(duì)智慧的理解應(yīng)該是說他能夠去自己去適應(yīng)(Self-adapting),自己的學(xué)習(xí)(Self-learning),自己的進(jìn)化(Self-evolving),所以這是三個(gè)S,三個(gè)A,三個(gè)S,我們對(duì)普慧算力的解讀。我們希望,普慧算力最要能幫助到我們國家產(chǎn)業(yè)升級(jí),其次幫助我們各個(gè)企業(yè)去實(shí)現(xiàn)數(shù)智化轉(zhuǎn)型,最終惠及到每一個(gè)人。
主持人:周總,您覺得未來對(duì)于民眾來說普慧算力需求有多大?
周健工:我覺得很大,我自己有一個(gè)觀點(diǎn),我認(rèn)為將來現(xiàn)在往手機(jī)端部署,消費(fèi)級(jí)GPU也可以去跑一個(gè)模型了,自己手機(jī)就下載了。其實(shí)我覺得將來很可能手機(jī)上每一個(gè)APP都是一個(gè)模型。我們可以走著瞧。包括現(xiàn)在設(shè)備端芯片,整個(gè)架構(gòu)芯片,都是圍繞生命智能、人工智能的部署在發(fā)生。普慧的意義,就是每一個(gè)人都可以用。
主持人:如何實(shí)現(xiàn)真正的實(shí)惠?
陳振寬:我相信這是一個(gè)要持續(xù)要去做的工作。今天單位的算力成本,在五年前、十年前看是無法想像的,但是今天通過科技的發(fā)展確實(shí)達(dá)到了。我們對(duì)未來的展望,一定會(huì)跟隨技術(shù)的進(jìn)化,技術(shù)的迭代,技術(shù)的創(chuàng)新。我們相信,最終到每一個(gè)人看算力就好像你在使用電力一樣時(shí),你不會(huì)感覺到他的存在,甚至也不會(huì)為支付這個(gè)電的成本感覺到你有巨大支出存在,以后算力也一樣。
關(guān)鍵詞: