青云科技(qingcloud.com)總裁林源在 AI 算力發(fā)布會和采訪中闡述了AI將給應(yīng)用和算力帶來的變化,他認(rèn)為“AI領(lǐng)域一定會出現(xiàn)巨頭,但不是一家獨(dú)立的公司,而是一個小的生態(tài)。”
每一次科技創(chuàng)新都給生產(chǎn)生活方式帶來變革,正如移動互聯(lián)網(wǎng)開啟萬物互聯(lián),云計算讓企業(yè)IT遷徙上云,每一次科技創(chuàng)新都給生產(chǎn)生活方式帶來變革。得益于AI高效的生產(chǎn)力與簡單的交互方式,青云科技總裁林源認(rèn)為,新一波AI浪潮在帶來生產(chǎn)力變革的同時,還將帶來商業(yè)模式、應(yīng)用門檻、底層架構(gòu)等眾多變革,產(chǎn)生大量新市場機(jī)會。
他表示,相較于過去十年,AI驅(qū)動應(yīng)用呈現(xiàn)四大變化:首先,移動互聯(lián)網(wǎng)、數(shù)字化的服務(wù)應(yīng)用場景,轉(zhuǎn)變?yōu)樗袘?yīng)用都要擁抱AI或被AI改造,企業(yè)數(shù)智化取代數(shù)字化;第二,從以CPU為核心變?yōu)橐訥PU為核心驅(qū)動應(yīng)用的創(chuàng)新,“未來的時代一定是一個以GPU為核心的時代”;第三,由于AI訓(xùn)練成本極高,未來AI應(yīng)用由延遲敏感型轉(zhuǎn)變?yōu)橐猿杀久舾行蜑橹鳎瑢?yīng)的算力將從延遲低的東部沿海,向價格更便宜的西部地區(qū)發(fā)展,未來算力分布更加分散;第四,支撐的應(yīng)用類型變化,由傳統(tǒng)應(yīng)用和云原生應(yīng)用,轉(zhuǎn)變?yōu)樵圃鷳?yīng)用+AI應(yīng)用,客戶業(yè)務(wù)更復(fù)雜,業(yè)態(tài)更豐富,對技術(shù)和平臺的挑戰(zhàn)越來越多。
過去半年中,隨著大模型產(chǎn)品的爆發(fā),AI帶來的變革已經(jīng)逐漸凸顯,其中作為AI應(yīng)用承載的算力格局變化尤為明顯。
中國信通院發(fā)布的《中國綜合算力指數(shù)(2023年)》顯示,截至2023年6月底,我國算力總規(guī)模達(dá)到197EFLOPS,其中智能算力規(guī)模占整體算力規(guī)模的比例提高到25.4%,智能算力規(guī)模同比增長達(dá)45%,比算力規(guī)模整體增速高15個百分點(diǎn)。
AI熱潮下,眾多智算中心項目如雨后春筍般落地開工,國家信息中心與相關(guān)部門聯(lián)合發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》顯示,目前全國有超過30個城市正在建設(shè)或提出建設(shè)智算中心。
在建設(shè)如火如荼的同時,智算中心也存在隱憂。林源指出,當(dāng)前智算中心面臨多方面挑戰(zhàn)。
對于智算中心的主要建設(shè)者地方政府、國資央企和地方AI集成商來說,首要挑戰(zhàn)是成本和技術(shù)。智算中心投資巨大,一臺最新的NVIDIA的服務(wù)器就要兩百萬,未來能否收回成本以及盈利,取決于運(yùn)營效率與平臺能力,前者降低成本,后者決定能賣給多少客戶。而相比于投資與建設(shè),智算中心的運(yùn)營更專業(yè)復(fù)雜,目前各中心運(yùn)營能力參差不齊,難以應(yīng)對。
他直言:“行業(yè)內(nèi)大家對于‘智算中心要怎么建?建成什么樣?未來要支撐什么業(yè)務(wù)?’并沒有想的很透徹。”因此造成了有智算功能的某計算中心建成后,由于只支持特定GPU,所以缺乏客戶,運(yùn)營不起來的情況。
新一波AI熱潮下,智能算力規(guī)模將迎來更加快速的增長,智算中心如何設(shè)計規(guī)劃,實(shí)現(xiàn)兼顧AI應(yīng)用、云原生應(yīng)用與傳統(tǒng)應(yīng)用需求,支持異構(gòu)CPU/GPU,高效運(yùn)營達(dá)到盈利?
青云的答案是青云AI算力調(diào)度平臺。
青云AI算力調(diào)度平臺是包括智算中心在內(nèi)的算力中心建設(shè)的新模式,讓算力中心像管理本地資源一樣管理AI基礎(chǔ)設(shè)施,實(shí)現(xiàn)多元算力統(tǒng)一調(diào)度、智能化算力管理,支持大模型訓(xùn)練場景,提供多種AIGC模型的一站式交付平臺,支撐行業(yè)應(yīng)用計算、高性能計算、AI計算等多種應(yīng)用模式。
青云AI算力調(diào)度平臺具備九大關(guān)鍵能力:多區(qū)多業(yè)務(wù)資源整合、混合組網(wǎng)、容器推理服務(wù)平臺、分布式調(diào)度與管理、算法開發(fā)支持、模型倉庫(MaaS)、AI訓(xùn)練平臺、靈活調(diào)度、高速并行存儲。
相較于市面上其他算力調(diào)度產(chǎn)品,苗慧表示,青云AI算力調(diào)度平臺在資源靈活調(diào)度方面更具優(yōu)勢。
原因在于,青云針對大規(guī)模計算集群研發(fā)了更優(yōu)化的調(diào)度算法,所有節(jié)點(diǎn)、服務(wù)器和存儲設(shè)備都有路徑標(biāo)簽,通過算法計算最短鏈路,盡可能調(diào)度同一個交換機(jī)內(nèi)的兩個節(jié)點(diǎn),減少數(shù)據(jù)的傳輸損耗。此外,青云在應(yīng)用環(huán)境上使用K8s和Slurm兩種調(diào)度平臺同時為客戶服務(wù),可以實(shí)現(xiàn)提交分布式計算任務(wù)時,相關(guān)卡、CPU、進(jìn)程等調(diào)度信息都能立刻獲取到,在顆粒度和運(yùn)維傳統(tǒng)機(jī)器等方面也有更多優(yōu)化。多措并舉,實(shí)現(xiàn)更好的算力調(diào)度,更好的資源利用。
“青云AI算力調(diào)度平臺的服務(wù)對象是現(xiàn)在和未來投入智算中心建設(shè)的企業(yè),算力中心現(xiàn)在的投資者和未來的運(yùn)營者。”
對算力中心來說,青云AI算力調(diào)度平臺使用效果如何,實(shí)踐案例最有說服力。
據(jù)林源介紹,青云AI算力調(diào)度平臺正式發(fā)布前,已經(jīng)在國家超級計算濟(jì)南中心(以下簡稱“濟(jì)南超算”)應(yīng)用,取得了良好效果。
濟(jì)南超算擁有超1000P算力,300P存儲,是一個多元異構(gòu)算力中心,包括HPC、智算和以CPU為主的云計算,既有NVIDIA GPU,也考慮到國產(chǎn)化兼容,擁有一部分國產(chǎn)GPU。自3年前起,濟(jì)南超算的整個調(diào)度平臺由青云科技獨(dú)家供應(yīng),運(yùn)營至今,平穩(wěn)支撐濟(jì)南超算來自高校的傳統(tǒng)科學(xué)計算、政務(wù)云和企業(yè)數(shù)字化應(yīng)用上云、智慧城市、AI等多類客戶群體業(yè)務(wù),助力濟(jì)南超算提高算力資源利用,目前已經(jīng)實(shí)現(xiàn)盈利。
用林源的話說,濟(jì)南超算案例說明“青云AI算力調(diào)度平臺具備所說的能力,我們干過,而且干成了。”
從對話的ChatGPT到生成照片的妙鴨相機(jī),AI已經(jīng)在多個領(lǐng)域展現(xiàn)了驚人的生產(chǎn)力與創(chuàng)造力,新一波AI大潮席卷而來,模型迭代迅速,智能算力建設(shè)與應(yīng)用落地加速,企業(yè)如何抓住市場新機(jī)遇,踏浪向前?
面對AI帶來的一系列變革,青云希望通過開放的、成熟的、可運(yùn)營的AI算力調(diào)度平臺,通過自營、合營乃至支撐第三方運(yùn)營的方式,與生態(tài)同盟一起貢獻(xiàn)“AI Cloud”,共同前行。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!