4月21日上午,由中國(guó)通信工業(yè)協(xié)會(huì)數(shù)據(jù)中心委員會(huì)指導(dǎo),中國(guó)IDC圈與世紀(jì)互聯(lián)等共同主辦,以“同頻共振”為主題的“2021年中國(guó)IDC行業(yè)Discovery大會(huì)”在北京盛大開(kāi)幕?,F(xiàn)場(chǎng)匯集了數(shù)百名來(lái)自數(shù)據(jù)中心上下游產(chǎn)業(yè)的專家、學(xué)者以及從業(yè)人士,共同探討、分享數(shù)據(jù)中心的發(fā)展及未來(lái)。大會(huì)同期在線上多個(gè)渠道開(kāi)通了現(xiàn)場(chǎng)直播,共有數(shù)十萬(wàn)觀眾觀看了本次大會(huì)。
會(huì)上,中國(guó)信通院云大所副所長(zhǎng)魏凱向與會(huì)者分享了《新數(shù)據(jù)中心時(shí)代下的數(shù)據(jù)生產(chǎn)要素》。
魏凱:尊敬的吳部長(zhǎng),金理事長(zhǎng),陳升董事長(zhǎng),大家好,這個(gè)會(huì)的主題非常好,叫同頻共振。我今天講的數(shù)據(jù)中心內(nèi)容就講講在數(shù)據(jù)中心上層,要如何共振,我們新基建其實(shí)既有底層數(shù)據(jù)中心的基礎(chǔ)設(shè)施建設(shè),也有新技術(shù)基礎(chǔ)設(shè)施。在國(guó)家發(fā)改委的政策里頭,實(shí)際上把云計(jì)算,一體化大數(shù)據(jù)中心,還有人工智能、區(qū)塊鏈都納入到了新基建范疇,我們要同頻共振,就是要探討上層的應(yīng)用和數(shù)據(jù)中心怎么互動(dòng)。
從去年到今年中央一系列的文件把數(shù)據(jù)作為生產(chǎn)要素提出來(lái)以后,給我們開(kāi)辟了幾乎是無(wú)限的增長(zhǎng)空間,這在全球是受創(chuàng)的,意義是非凡的,確實(shí)是洞悉了整個(gè)人類歷史發(fā)展軌跡。從農(nóng)耕時(shí)代、工業(yè)時(shí)代,到信息時(shí)代,其實(shí)主要依賴的增長(zhǎng)技術(shù)和核心資源,以及基礎(chǔ)設(shè)施都有巨大的變化,可以說(shuō)是翻天覆地的變化,未來(lái)其實(shí)是非??善诘?。
我們現(xiàn)在都在驚呼數(shù)據(jù)太大、太多了,增長(zhǎng)太快了,實(shí)際上我這里要跟大家分享的圖非常有沖擊力,我們還在珠穆朗瑪峰的山腳下,今年是2021年,全球數(shù)據(jù)存儲(chǔ)量大概是50ZB,根據(jù)全球合作咨詢公司、智庫(kù)的預(yù)測(cè),到2035年我們?nèi)驍?shù)據(jù)量是2100多ZB,指數(shù)增長(zhǎng)在右側(cè)越來(lái)越快,越來(lái)越大,我們很習(xí)慣看線性增長(zhǎng)。我們正在進(jìn)入數(shù)據(jù)洪流的時(shí)代,5G核工業(yè)互聯(lián)網(wǎng)給我們開(kāi)辟了這樣一個(gè)空間。數(shù)據(jù)中心產(chǎn)業(yè)里的同仁都非常幸福,因?yàn)槟銈冇羞@么大的增長(zhǎng)空間。
回顧我們國(guó)家對(duì)于數(shù)據(jù)的認(rèn)識(shí),對(duì)于數(shù)據(jù)戰(zhàn)略的布局,我們做了政策性的梳理,大概三個(gè)階段。
第一個(gè)階段是2014年左右,這個(gè)也是受了國(guó)際上很多知名企業(yè)和互聯(lián)網(wǎng)行業(yè)的啟發(fā),原來(lái)最早數(shù)據(jù)不認(rèn)為是一種要素,因?yàn)樵诤芏嗥髽I(yè)看來(lái)我們還要存儲(chǔ),按照國(guó)家的要求要把數(shù)據(jù)存3個(gè)月,這是一個(gè)負(fù)擔(dān)。但是在互聯(lián)網(wǎng)行業(yè)啟發(fā)下,這些數(shù)據(jù)可以用來(lái)做行為分析,用戶精準(zhǔn)畫(huà)像,發(fā)現(xiàn)數(shù)據(jù)是有價(jià)值的,之前很多人說(shuō)數(shù)據(jù)是“數(shù)據(jù)廢棄”,變成了“數(shù)據(jù)資源”“數(shù)據(jù)資產(chǎn)”,我們也有推動(dòng)大數(shù)據(jù)發(fā)展的行動(dòng)綱要,這是頂層戰(zhàn)略,明確國(guó)家要從政務(wù)、民生、經(jīng)濟(jì),向數(shù)據(jù)要生產(chǎn)力,這是第一個(gè)起步階段,但是這個(gè)時(shí)候其實(shí)大家對(duì)于這個(gè)的懷疑還是非常強(qiáng)烈的,就是數(shù)據(jù)到底能發(fā)揮什么價(jià)值。
在2017—2020年是一個(gè)新的階段,這個(gè)時(shí)候很多是自發(fā)的,企業(yè)內(nèi)生的,尤其是金融行業(yè),像運(yùn)營(yíng)商都發(fā)現(xiàn)其實(shí)數(shù)據(jù)驅(qū)動(dòng)已經(jīng)是他們不得不做的事情,如果沒(méi)有數(shù)據(jù)驅(qū)動(dòng)就像開(kāi)車(chē)沒(méi)有導(dǎo)航一樣,這是自發(fā)的行為,這時(shí)候國(guó)家出臺(tái)了很多政策。
2020年以后又不一樣了,國(guó)家把它作為基礎(chǔ)要素提升,甚至跟土地要素并列,這是一個(gè)新的命題,又給我們開(kāi)創(chuàng)了一個(gè)新的空間,再上了一個(gè)新臺(tái)階,全社會(huì)對(duì)這個(gè)事情的認(rèn)知又上了一個(gè)新的高度,我覺(jué)得未來(lái)空間非常大。
這里跟大家分享一下我們搞數(shù)據(jù)的人,從前重視什么,以后重視什么。
從前,搞大數(shù)據(jù)的人都在解決企業(yè)內(nèi)部怎么高效存儲(chǔ)好自己的數(shù)據(jù)的問(wèn)題,怎么更快的處理數(shù)據(jù),怎么能夠快速得到分析的結(jié)果。我們有很多技術(shù),ES、Spark、Hadoop,怎么高速運(yùn)算這些數(shù)據(jù)。
現(xiàn)在甚至以后,其實(shí)反過(guò)來(lái)大家又開(kāi)始討論隨著技術(shù)越來(lái)越多,管理成本越來(lái)越高,并不是技術(shù)成本,而是企業(yè)內(nèi)部的山頭林立,在座有很多金融界的朋友,數(shù)據(jù)治理是非常痛苦的事情。今天在組織內(nèi)部大家非常重視數(shù)據(jù)的更加智能,數(shù)據(jù)要良好的治理。因?yàn)閿?shù)據(jù)不再是簡(jiǎn)單的放在數(shù)據(jù)庫(kù)里就能產(chǎn)生價(jià)值的,而是要高質(zhì)量的融合起來(lái),真正讓它成為閉環(huán)里面一個(gè)不得不做的要素,所以現(xiàn)在正在討論的是數(shù)據(jù)湖,智能化數(shù)據(jù)治理系統(tǒng)等等這些,這是單一機(jī)構(gòu)內(nèi)部的,我覺(jué)得這個(gè)問(wèn)題還好解決,正在走上一個(gè)良性的軌道,從追求快到追求高質(zhì)量的發(fā)展,這是單一機(jī)構(gòu)內(nèi)部的。
更加棘手的問(wèn)題是組織之間的,未來(lái)的空間在產(chǎn)業(yè)數(shù)字化,產(chǎn)業(yè)數(shù)字化實(shí)際上是跟產(chǎn)業(yè)互聯(lián)網(wǎng)是同義詞,產(chǎn)業(yè)互聯(lián)網(wǎng)不是個(gè)二元結(jié)構(gòu),消費(fèi)互聯(lián)網(wǎng)是二元結(jié)構(gòu)。產(chǎn)業(yè)互聯(lián)網(wǎng),一個(gè)汽車(chē)兩千個(gè)零部件,誰(shuí)也不能吃掉誰(shuí),所以我們要尊重企業(yè)的存在,產(chǎn)業(yè)鏈的存在。合作的時(shí)候其實(shí)數(shù)據(jù)就很難誰(shuí)給誰(shuí),到底是我把數(shù)據(jù)給你還是你把數(shù)據(jù)給我,從前我們很少碰到這樣的問(wèn)題,數(shù)據(jù)跨機(jī)構(gòu)融合。
以前我們?cè)谡剶?shù)據(jù)跨機(jī)構(gòu)的時(shí)候,我們更多是要保護(hù),隔離,鎖在保險(xiǎn)柜里保密。今后為了做產(chǎn)業(yè)互聯(lián)網(wǎng),跟社會(huì)上的上下游要打通,政企打通,企業(yè)之間打通,所以關(guān)鍵詞變成了開(kāi)放、融合。所以在大的政策里,可以看到我們不但在提數(shù)據(jù)要素變成生產(chǎn)要素,更再提數(shù)據(jù)要素市場(chǎng)化,“十四五”規(guī)劃里面有一大段專門(mén)提怎么把數(shù)據(jù)變成市場(chǎng)化要素,就是要開(kāi)放、融合,在保證數(shù)據(jù)安全的前提下促進(jìn)數(shù)據(jù)在不同主體之間連通,合作,所以又有了隱私計(jì)算、區(qū)塊鏈。
陳升董事長(zhǎng)也是這方面的思想家,其實(shí)都是在解決數(shù)據(jù)跨機(jī)構(gòu)之間可信共享的問(wèn)題,這是我們數(shù)據(jù)領(lǐng)域的人在考慮的問(wèn)題,我覺(jué)得這些都跟數(shù)據(jù)中心的底座有非常強(qiáng)的關(guān)系,它意味著我們以后的計(jì)算模型其實(shí)是從數(shù)據(jù)運(yùn)行到IO運(yùn)行,到網(wǎng)絡(luò)密集型的任務(wù),這是一個(gè)變化。
我們?cè)倏慈斯ぶ悄?,怎么挖掘?shù)據(jù)可能不能靠人,得靠機(jī)器建模。人工建模非常費(fèi)勁,甚至我們很難掌握這個(gè)領(lǐng)域的知識(shí),所以最近幾年對(duì)于數(shù)據(jù)的處理,大量依靠機(jī)器。機(jī)器在數(shù)據(jù)里面訓(xùn)練、學(xué)習(xí),得到隱藏的模型,這個(gè)模型有很多時(shí)候人看不懂,但是沒(méi)關(guān)系,能產(chǎn)生實(shí)效,比如說(shuō)語(yǔ)音翻譯,準(zhǔn)確率達(dá)到99%,但是解釋不了這個(gè)原因,但是這個(gè)不妨礙我們機(jī)器很多事情做得很好。
人工智能最近幾年也進(jìn)入了一個(gè)新的發(fā)展階段,以前大家可能覺(jué)得人工智能是靠大量的數(shù)據(jù)堆起來(lái)的,現(xiàn)在除了數(shù)據(jù)量要拉大,拼算力的時(shí)代也開(kāi)始了。最近我們做了一個(gè)分析、統(tǒng)計(jì),在90年代到2010年的階段,人工智能要訓(xùn)練一個(gè)模型,它消耗的算力需求,每?jī)赡攴环?,這還是一個(gè)比較均衡的,比較線性的增長(zhǎng)趨勢(shì)。到了2015年以后,到現(xiàn)在,人工智能要訓(xùn)練一個(gè)模型其實(shí)大概平均每3.4個(gè)月翻一番,就是算力的需求。去年有一個(gè)非常重磅級(jí)的人工智能訓(xùn)練模型Open AI的GPT-3文本訓(xùn)練,寫(xiě)的文章根本看不出來(lái)是機(jī)器寫(xiě)的還是人寫(xiě)的。以前一億參數(shù)就搞定了,去年用的GPT-3模型里用的是1750多億,數(shù)據(jù)量從40G到45T,翻了一千倍,神經(jīng)網(wǎng)絡(luò)層數(shù)從48層到了96層,這預(yù)示著人工智能未來(lái)的發(fā)展回歸到了最底層的依賴,還是落到數(shù)據(jù)中心里面,未來(lái)誰(shuí)能玩得起,只有數(shù)據(jù)中心玩家能玩得起,未來(lái)是拼算力的時(shí)代,這是人工智能對(duì)數(shù)據(jù)中心的改變。
人工智能模型是什么模型?是計(jì)算密集型的,是CPU密集型的任務(wù),現(xiàn)在有很多既要求CPU密集又要求IO密集,所以我們要有網(wǎng)絡(luò)來(lái)高速互聯(lián),對(duì)數(shù)據(jù)中心要求也很高,所以我們提智算中心。云計(jì)算是數(shù)據(jù)中心資源最多的行業(yè),增長(zhǎng)非??欤磥?lái)我們?cè)旱恼J(rèn)識(shí),其實(shí)云計(jì)算未來(lái)空間非常大,我們現(xiàn)在上云率還是非常低,大概30%多,云已經(jīng)從粗放到精細(xì),從IaaS到SaaS的轉(zhuǎn)變,未來(lái)預(yù)估IaaS比較大,SaaS比較小,未來(lái)產(chǎn)值可能是倒三角,SaaS產(chǎn)值會(huì)非常大,包括邊緣這些發(fā)展非???。
無(wú)論是大數(shù)據(jù)、云計(jì)算還是未來(lái)數(shù)據(jù)中心的發(fā)展、人工智能的發(fā)展,底層都是要靠數(shù)據(jù)中心提供強(qiáng)大算力。像三峽集團(tuán)給我們提供電力一樣,我們中國(guó)現(xiàn)在數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展如火如荼,但是什么事情一平均立馬就拉下來(lái)了。我們按照人均算力來(lái)說(shuō),我們屬于中等,在波蘭后面。人均算力460GFLOPS,前面國(guó)家都是西方發(fā)達(dá)國(guó)家,我們?nèi)司懔Σ罹嗪苓h(yuǎn)的,表示我們未來(lái)發(fā)展空間非常大。
在上層應(yīng)用的驅(qū)動(dòng)下,數(shù)據(jù)中心進(jìn)行了新一輪發(fā)展,根據(jù)我們?cè)旱慕y(tǒng)計(jì),去年我們數(shù)據(jù)中心機(jī)架數(shù)是314萬(wàn)架,2020年我們預(yù)計(jì)會(huì)到440萬(wàn)架,翻到8倍,增速30%以上,給這個(gè)產(chǎn)業(yè)增加了很多錢(qián),包括液冷,無(wú)損網(wǎng)絡(luò),很多新技術(shù)在開(kāi)始投資,這一波新基建的數(shù)據(jù)中心建設(shè)不是傳統(tǒng)的,相對(duì)老行業(yè)數(shù)據(jù)中心本身就新,但是這一輪數(shù)據(jù)中心的建設(shè)是數(shù)據(jù)中心里面本身就新,新模式的發(fā)展,包括產(chǎn)業(yè)生態(tài)的合作。
我們看到基礎(chǔ)運(yùn)營(yíng)商還有第三方數(shù)據(jù)中心,還有第三方數(shù)據(jù)中心和服務(wù)商的合作模式也越來(lái)越豐富了,產(chǎn)業(yè)鏈協(xié)同也是一個(gè)新的開(kāi)始。
我們?cè)航衲暧袀€(gè)課題,給我們的任務(wù),就是讓我們貫通云、大數(shù)據(jù)、人工智能、數(shù)據(jù)中心來(lái)看算力基礎(chǔ)設(shè)施的變革、轉(zhuǎn)型,未來(lái)算力基礎(chǔ)設(shè)施將怎么走,跟網(wǎng)絡(luò)怎么耦合,現(xiàn)在我們都在提云邊協(xié)同,算網(wǎng)融合,數(shù)網(wǎng)協(xié)同這些新的概念,我們未來(lái)怎么發(fā)展,我覺(jué)得需要跟業(yè)界的同行共同探討,特別是在碳達(dá)峰,碳中和的大背景下,以前是攤大餅的模式,未來(lái)我們要走更精細(xì)的模式,我們?cè)趺茨軌驑?gòu)建一個(gè)融合這么多數(shù)據(jù)中心形態(tài)的,包括邊緣,包括智算中心、數(shù)據(jù)中心、超算中心,傳統(tǒng)機(jī)房、云機(jī)房這些怎么形成一個(gè)非常好的一體化的算力基礎(chǔ)設(shè)施,真正讓算力成為像電力一樣的,打開(kāi)水龍頭計(jì)算能力就來(lái)了這樣一個(gè)美好的未來(lái),當(dāng)然它要適應(yīng)我們現(xiàn)在很多的場(chǎng)景,包括5G、車(chē)載、物聯(lián)網(wǎng)這些場(chǎng)景,空間非常非常大,我也特別希望能夠跟各位數(shù)據(jù)中心的專家能夠多學(xué)習(xí)、多探討,共同促進(jìn)這個(gè)產(chǎn)業(yè)的發(fā)展,我就分享這么多,謝謝大家。