C114通信網  |  通信人家園

市場
2023/10/19 14:36

運營商數字化轉型:數據存儲的七宗“最”

C114通信網  

謊言1:5G時代的到來,推動運營商基礎業(yè)務大幅增收

5G的滲透率不斷提升,盡管DoU(平均每戶每月上網流量)增長了6倍,但是5G的繁榮并沒有為運營商帶來顯著的營收的提升。因為傳統基礎業(yè)務已經嚴重同質化,加上“提速降費”的要求,以“賣流量”為典型的傳統業(yè)務已經連續(xù)多年增量不增收,想通過傳統業(yè)務實現持續(xù)大幅度增長更是希望渺茫。

AI、云計算、大數據、物聯網、量子計算等新技術層出不窮,牽引運營商數字化轉型投資,但由于各運營商投資密度的不同,數字化轉型的進展也參差不齊。基于2022年全球運營商的營收數據,生成了兩種畫像,其一是“穩(wěn)健派”,仍以賣管道的傳統基礎業(yè)務為主,圍繞網絡開展1+N創(chuàng)新增收,數字化業(yè)務還未形成經濟效益,其整體營收增長乏力,數字化業(yè)務甚至出現負增長,例如美國AT&T、德國T-mobile、新加坡Singtel等;而另外一種“卓越派”,則已經開始享受數字化轉型投資的成果,多樣化的新興業(yè)務誕生,牽引業(yè)務主戰(zhàn)場從傳統ToC走向ToB,帶動整體營收高速增長,例如中國三大運營商、韓國KT、日本KDDI、泰國Ture等。

圖片 1.png

真相1:基礎業(yè)務增速慢,數字化轉型收入才是運營商增收最快引擎

2023年國務院印發(fā)了《數字中國建設整體布局規(guī)劃》,加速推進數字中國進程,目標2035年進入世界前列。而運營商作為數字中國建設的主力軍,一直處在數字化建設的最前沿。基于工信部發(fā)布的《2023 年上半年通信業(yè)經濟運行情況》以及2023H1中國運營商財報,“卓越派”運營商2023上半年的成績單如下:

圖片 2.png

1、傳統基礎業(yè)務增速疲軟:在全球運營商營收增幅停滯不前的大環(huán)境下,中國運營商整體營收實現增長,但其中,固網、移動、語音等基礎業(yè)務增速緩慢,僅有2~3%,遠低于運營商整體的營收增幅。

2、產業(yè)數字化收入增速快、占比提升:運營商數字化轉型收入保持雙位數增長,占整體收入比例也不斷提高,其中移動提升至29.3%,電信提升至29.2%,聯通提升至25%。這其中包含了以移動云盤為代表的ToC市場新業(yè)務,以IPTV為典型的家庭市場智慧家庭增值業(yè)務,以及ToB政企市場DICT、物聯網、專線,以及AI、云計算、視聯網等新興市場收入。

謊言2:“云改”浪潮襲來,運營商云化改造驅動業(yè)務與數據全部上云

運營商云化改造有兩個目標:1、對內實現降本增效,現網ICT基礎設施建設和運營厚重,需要用云化架構提升資源利用率,為ICT瘦身降本。2、對外賦能千行百業(yè),通過云服務的方式打造產業(yè)級服務體系,承擔整個社會數字化轉型的責任,助力數字經濟社會的數字化、數智化轉型。

云化落地過程中,CRM、Billing這類數據庫穩(wěn)態(tài)核心業(yè)務仍然保持在線下部署,滿足高性能低時延要求,但如開發(fā)測試、Web Server等敏態(tài)業(yè)務,對資源敏捷彈性的要求更高,應用生態(tài)貼近云原生,更適合在云端部署。那么問題來了,業(yè)務部署在云端后,數據是否也要跟著存放在云端呢?

真相2:捍衛(wèi)數據主權刻不容緩,關鍵數據匯聚線下才是云改的最佳選擇

全球各國紛紛打響“數據主權保衛(wèi)戰(zhàn)”,因為數據不僅已成為AI、大數據等新業(yè)務的生產資料,也是企業(yè)核心資產。“錢存自家金庫,還是分散到各地存放?”,這個問題要參考四個關鍵因素:

1、法規(guī)要求數據不出國:多國陸續(xù)出臺了數據保護法(歐盟GDPR、中國PIPL、巴西LGPD、南非POPI),明確數據不出國。如果企業(yè)違反了數據法規(guī),可能會招致巨額罰款及其他法律后果。2023年5月,由于懷疑社交媒體平臺Facebook將歐盟用戶數據傳輸到美國,歐盟針對其開出違反隱私法規(guī)的12億歐元“天價罰單”,并命令該公司在今年10月前停止將歐洲用戶的數據傳輸出國。無獨有偶,2022年歐盟也對AWS和中國企業(yè)TikTok開具過同類的罰單,歐盟GDPR因此也被稱為“史上最嚴苛數據保護法案”。

2、公有云數據主權模糊不清:2018年美國通過“CLOUD法案”挑戰(zhàn)數據主權,要求美國的企業(yè)提供公司控制的數據,無論數據存儲在何處。例如,美國政府要求微軟提供存儲于愛爾蘭的電子郵件。此方案遭到全球多國抵制,并表示需要通過主權云方式取代美國AWS、Azure、Google等云服務商。

3、公有云數據存放成本高:隨著應用數據量變大,云存儲服務的成本會逐漸超越自建存儲成本,以3年周期為例,數據存在本地的成本僅為云上成本的50%(本地$0.1/GB vs云上$0.22/GB),例如抖音、拼多多等企業(yè)都在數據規(guī);笥|發(fā)了云上數據的回遷,但高昂的云數據回遷費用,使得“上云容易,下云難”已經成為共性的痛點。

4、第三方公有云之間的數據不共享:每個云廠商的優(yōu)勢云服務領域各有千秋,例如AWS的容器、區(qū)塊鏈,Azure的Teams、office,但是各家公有云的數據壁壘意識很嚴重,數據無法流動和共享。沒有可共享的數據,各有所長的多云應用也用不起來。

圖片 3.png

綜上所述,運營商云化演進過程中,既要享受云應用帶來的便捷,又要考慮數據的安全和中長期使用成本。所以,符合云化演進的最優(yōu)架構應該是:應用在云端部署,本地同步改造;數據本地存放,按需脫敏上云。如此,安全、可靠、合規(guī)的專業(yè)存儲,就是數據本地存放的最佳“保險箱”。

謊言3:公有云創(chuàng)新高效,運營商將攜手第三方公有云實現“雙贏”

全球公有云廠商的都有自己的創(chuàng)新高地,例如AWS龐大的工具集、Azure的混合云交互、Google Cloud的AI與數據分析等。企業(yè)可通過“多云”組合使用來實現創(chuàng)新高效,根據統計全球89%企業(yè)有多云戰(zhàn)略規(guī)劃,企業(yè)正積極擁抱多云,在多云世界中加速創(chuàng)新。但是,與大部分企業(yè)直接長期使用公有云支撐業(yè)務演進不同,運營商主要依托本身的渠道優(yōu)勢,以第三方云服務轉售這種“賺快錢”的方式為主,例如Verizon、德電DT、Globe、True等運營商熱衷于轉售AWS的DevOps、大數據等云服務,同時也帶貨微軟的Teams、Office 365等主流的辦公協同云服務。

為什么運營商不青睞長期使用第三方云服務呢?

因為,大型運營商的目標是成為公有云提供商。TOP運營商依賴遙遙領先的5G網絡技術、成熟的大規(guī);A設施、國家政策的加持等優(yōu)勢,已經贏在“云服務”的起跑線上。以中國運營商為例,國資委在《中央企業(yè)深化專業(yè)工作會》上指出,運營商將是國家基礎設施的建設者,統一面向全社會提供資源。三大運營商依賴獨有“云網融合“能力,同時匹配國家“東數西算”戰(zhàn)略,承載國家云數據中心建設,通過自建公有云并以云服務ToB的方式賦能千行百業(yè),加速各行業(yè)數字化進程。

真相3:狂飆的運營商三朵云,已成為中國公有云的最大玩家

1、公有云投入持續(xù)加大:運營商云服務ToB業(yè)務的投入逐年升高,以國內某運營商為例,2023年產業(yè)數字化投入(含云服務)已占比總體投入的38%。

圖片 4.png

2、三朵云營收高增長,進入市場TOP5:中國運營商在自建公有云的高額投入,也得到了積極的市場回饋,云服務營收走向“正循環(huán)”。根據2023年H1財報,三大運營商公有云市場增長迅猛,其中天翼云收入459億¥,增長高達81%,與長期霸榜TOP1的阿里云收入497億¥接近,2023全年天翼云挑戰(zhàn) “千億”收入目標不動搖,有望搶奪中國公有云收入榜首。緊隨其后的移動云、聯通云營收增幅分別達到63%、36%,增速遠超行業(yè)平均水平(8%)。23年H1運營商三朵云全員入圍營收TOP5,進入中國公有云市場第一梯隊,成功接棒互聯網云,成為政務、教育、醫(yī)療等行業(yè)“央企國企上云項目”的公有云提供商。

WPS拼圖0.png

謊言4:數據將進入YB時代,傳統全棧服務器架構適用于構建數據底座

數據是云業(yè)務的基礎,隨著業(yè)務數字化轉型,數據正在指數級增長,5G和云化驅動運營商用戶話單量增長3倍,話單數量增長10倍。據 《數字中國發(fā)展報告》顯示,截至2022年底,我國數據存儲量達724.5EB,同比增長21.1%。運營商在打造符合云時代需求的數據中心過程中,這些海量數據的爆發(fā)增長讓數據的高效存儲成為一大難題。

我們發(fā)現,當前大規(guī)模云數據中心普遍采用服務器本地盤+分布式軟件的存儲方案,此方案的優(yōu)勢是輕量便捷,可幫助快速搭建系統,但隨著數據量的暴增,這種存算一體方案在大規(guī)模的云數據中心并不適用。例如,大規(guī)模云數據中心擁有海量服務器本地盤,但服務器對硬盤不具備專業(yè)管理能力,當硬盤出現問題后,會導致響應慢、即將失效等故障,使得上層分布式存儲軟件進行重構時會耗費大量的CPU算力,對業(yè)務影響不可控。再比如,為了保障可靠性,通常采用3副本存儲策略,即1份數據保存3份,存儲空間利用率僅有30%,機柜空間和能耗占用大。

真相4:云走向分層解耦,Diskless是大規(guī)模公有云系統的最優(yōu)架構

1、云數據中心架構已從封閉全棧走向開放合作。從技術趨勢來看,先進的公有云系統架構已由全棧走向分層解耦(例如AWS、Azure),與業(yè)界最優(yōu)的產品合作集成,分層建設,以開放的姿態(tài)找到業(yè)務的“最優(yōu)解”。

圖片 7.png

2、基于Diskless無盤架構的專業(yè)存儲,能夠更好減少對空間、能耗的占用,并簡化硬盤的管理運維。面向海量數據的IT基礎設施,如何實現存力和算力按需擴展,也成為了運營商IT創(chuàng)新的關鍵。為此,以新型存算分離理念的Diskless架構應運而生。Diskless架構支持資源池化,把原有的多級分層資源,徹底解耦池化和重組整合,實現了各類硬件的獨立擴展和靈活共享。例如,將服務器內數據盤拉遠,將硬盤集中到專業(yè)存儲中統一管理,通過專業(yè)存儲廠商對的原生硬盤亞健康管理、三級硬盤慢IO快速響應等技術,屏蔽底層硬盤故障,保持大規(guī)模數據中心海量硬盤的可靠穩(wěn)定,大幅降低運維難度。同時,再通過數據縮減、大比例EC等關鍵技術,提升存儲效率,幫助客戶提高資源利用率,降低機柜空間和設備功耗。

圖片 8.png

在中國,某頭部運營商已經將Diskless存算分離架構用于智算中心的建設實踐中,采用專業(yè)的存儲重構私有云、公有云的數據底座,應用于ToB自動駕駛、工業(yè)智造、AI繪畫等新興場景,整體性能提升2倍,機房占用率降低40%,并且屏蔽掉硬盤故障帶來的業(yè)務中斷,運維更為省心省力。

謊言5:大模型引爆性能需求,運營商算力強則AI強

AI大爆發(fā),運營商入局“百模大戰(zhàn)”。據OpenAI預測,未來50%的人類工作任務場景將被ChatGPT影響。運營商作為信息通信基礎設施的建設者和運營者,既為AI的發(fā)展提供基礎設施支撐,又將會是AI應用落地的先行者。運營商在全面擁抱AI新機遇時,會充分發(fā)揮其既有的數據優(yōu)勢、資源優(yōu)勢、行業(yè)使能經驗優(yōu)勢,全力打造領先的AI基礎設施,依托算網融合的能力,讓AI服務無所不達,從而引領產業(yè)發(fā)展。

圖片 9.png

廣義算力 =算力&&存力&&運力。運營商要抓住大模型的發(fā)展機遇,首先需要構建領先的AI基礎設施。大模型的參數和數據規(guī)模都呈指數級增長,除了對算力有極高的要求外,對存儲的擴展性、性能、時延等都提出更高要求。比如一個訓練批次前后的數據加載和保存階段,如果存取性能不足,會導致寶貴的計算資源空轉浪費。中國工程院院士倪光南指出“存力、算力、運力缺一不可,只有三者平衡配置、均衡發(fā)展,才能充分發(fā)揮算力的作用”?梢哉f,存力是算力價值的前提和基礎。

真相5:缺數據無AI,存力加持算力才能構筑AI最強底座

圖片 10.png

數據決定AI智能的高度。大模型要服務千行萬業(yè)智能化升級,數據質量、規(guī)模決定運營商AI的競爭力。作為數據的載體,AI存力為大模型注入源源不斷的數據“燃料”,加裝動力澎湃的數據“引擎”,提供堅實可信的數據“護盾”。

圖片 11.png

面向大模型場景,服務器存力不夠用,通用存力不好用,需要量身定制的AI專業(yè)存力。AI技術的發(fā)展先后經歷了傳統AI時代、深度學習時代和大模型時代,所需的存力系統也不斷演進。在傳統AI時代,研究者們嘗試使用符號和規(guī)則來實現人工智能,訓練規(guī)模有限且數據多為結構化數據,存儲方式為本地盤存儲形式。到了深度學習時代,深度神經網絡的訓練數據多為文本、圖片、音頻等單模態(tài)數據,隨著訓練復雜度和規(guī)模的提升,需要統一的數據資源池實現數據共享,此時對數據IO性能要求不高,主要以對象存儲為主。當前AI已發(fā)展到大模型時代,傳統以服務器集群搭建的對象存儲資源池已無法滿足需求,比如某智算中心集群運行65B大模型時,1PB對象存儲的讀寫帶寬僅為2.4~7.5GB/s,導致訓練經常掛死。面對萬億級參數、PB級訓練數據的大模型,存力系統需為此打造專業(yè)的AI存儲,通常需要構建“高性能層+大容量層”的AI存儲集群,這樣的存力系統業(yè)界稱之為“AI先進存力”。

圖片 12.png

構建AI先進存力才能釋放運營商最強“廣義算力”。大模型的持續(xù)創(chuàng)新突破,需要從數據的角度對AI全流程進行優(yōu)化,通過AI先進存力,將訓練數據、行業(yè)專有知識庫與大模型能力充分結合,實現以存強算,加速場景化大模型服務好千行萬業(yè)。首先,數據歸集階段要高效處理多地域、多分支收集PB級多樣化的原始數據;其次,在模型訓練階段需要對海量小文件的隨機讀取以及模型數據集快速保存;最后,在模型推理階段需要快速檢索增量源數據和向量數據。這些挑戰(zhàn)都需要創(chuàng)新的AI存儲解決方案,比如通過智能數據編織,實現跨系統、跨地域的全局統一數據視圖和調度;通過近存計算,卸載部分數據預處理能力,減少數據搬遷,縮短數據準備時間;通過全閃存分布式存儲,實現存儲節(jié)點千萬級每秒讀寫次數(IOPS,Input/Output Per Second)和數百GB/s帶寬,提升訓練效率;通過向量存儲,實現高性能向量檢索能力。

謊言6:“雙碳”成為硬指標,運營商依賴“降PUE”實現節(jié)能減排

據GSMA(Global System for Mobile communications Association)2023年最新報告,全球已有62家運營商(占行業(yè)整體收入61%)承諾在2030年實現快速減排的目標。在“碳達峰、碳中和”大背景下,綠色低碳已成為運營商數據中心的重要發(fā)展方向,而PUE(Power Usage Effectiveness)通常被認為是評價數據中心能源效率的最重要指標。

PUE的計算公式為“PUE值 = 數據中心總能耗/IT設備能耗”,PUE值越低,說明數據中心非IT設備能耗越少,數據中心越節(jié)能。數據中心的用能部分通常包括IT設備、制冷系統、供配電系統及其它,以PUE為1.5的數據中心為例,其IT設備耗能約占67%,制冷系統約占27%。制冷系統是IT設備之外的最大耗能源,因此優(yōu)化制冷系統,是降低PUE的主要途徑。

圖片 13.png

一個PUE=1.5的數據中心中各組成部分所消耗電能占比

PUE的重要性毋庸置疑,但PUE并不能全面真實地評價數據中心節(jié)能情況。例如,通過節(jié)能技術提升IT設備效率,大幅降低IT設備能耗,數據中心總能耗也會隨之降低,因二者并非簡單的線性關系,數據中心PUE反而會增大。“雙碳”的最終目的是實現節(jié)能減排,而不是唯PUE論。

真相6:雙管齊下,“降PUE+減功耗“組合拳實現最低能耗

IT設備是數據中心運行過程中最大的用電來源,因此,數據中心想要更進一步節(jié)能減排,減少IT設備功耗是繞不開的一環(huán)。其中,存儲的功耗在數據中心占比已超過30%,正在成為IT設備中功耗增長最快的設施。運營商數據中心想要實現綠色節(jié)能目標,更加需要:

1、從關注PUE降低走向關注存儲功耗降低

數據中心存儲1PB數據的年耗電量可達到30萬千瓦時,折合碳排放為235.5噸。全球數據量在2025年將達到180ZB(約為1.8億PB),是2020年的3倍;為了保存這些數據,存儲耗電量將大幅增長。到2030年,全球數據中心存儲碳排放量將輕松超過2019年全球碳排放量。因此,運營商數據中心要實現“雙碳”,除了降低PUE之外,更要關注如何降低存儲設備功耗。

2、從關注存儲最大功耗走向關注能效指標

運營商在進行存儲采購時,通常將設備最大功耗作為是否綠色節(jié)能的考核指標,但最大功耗是在設備滿負載運行時產生的,并非實際使用過程中的常態(tài),無法真實反映存儲能效。全球網絡存儲工業(yè)協會SNIA(Storage Networking Industry Association)發(fā)布的存儲能效測量規(guī)范,將容量/W、IOPS/W、帶寬/W作為能效指標,能真實反映設備在不同IO模型下的性能和功耗。該規(guī)范在2019年被ISO/IEC采納為國際標準,歐洲電信標準化協會ETSI、中國標準化研究院在2024年發(fā)布的存儲能效標準中也將沿用SNIA的能效指標。

關注能效指標,有利于存儲行業(yè)節(jié)能技術健康發(fā)展,運營商通過選擇高能效的存儲設備,可以實現相同容量、性能需求下每bit數據能耗最優(yōu),從而降低數據中心整體供電負擔和減少碳排放。

謊言7:數據是核心資產,網絡安全是運營商數據的護城河

當前,運營商基于防火墻、入侵檢測系統等一系列網絡安全產品,構建了感知預警、全面檢測、應急處置等一體化的網絡安全綜合防御體系。防范網絡的攻擊、侵入、破壞和非法使用以及意外事故,使網絡處于穩(wěn)定可靠運行的狀態(tài),保障網絡數據的完整性、保密性、以及可用性,從而守護數據安全。

然而,隨著AI技術的迭代飛躍,黑客技術、攻擊手法不斷提升,電信行業(yè)網絡安全事件頻發(fā)。例如:2019年俄羅斯電信公司Beeline被黑,870萬客戶數據泄露,并將其在網上出售;2020年泰國最大移動運營商AIS云泄露83億條互聯網記錄,數據被用于繪制用戶網絡活動圖。運營商強大的網絡防御體系在新形式的攻擊下并不能確保數據萬無一失。

真相7:網絡百密必有一疏,存儲是守護數據安全的最后防線

隨著AI、5G和物聯網等新興技術的崛起,ToB業(yè)務蓬勃發(fā)展。由于網絡暴露節(jié)點多,且需要傳送海量數據,網絡信息安全的邊界正在弱化,加上數據“投毒”日益猖獗,網絡層無法做到100%感知攔截。

從諾斯羅普·格魯曼縱深防御模型來看,病毒發(fā)起攻擊首先從網絡開始,當它沖破整個網絡的封鎖,也就是打破整個網絡安全界限以后,就會進入整個主機對應用的權限發(fā)起攻擊。一旦獲取到權限以后,目標就是最終的核心資產,即數據。由于勒索病毒善于偽裝、通過漏洞、釣魚、內鬼等方式入侵,潛伏周期長。即使網絡層可攔截99%的勒索病毒,也會存在1%的攻擊流入存儲層,數據就會存在安全風險。

圖片 14.png

諾斯羅普·格魯曼縱深防御模型

近幾年來,存儲的數據安全潛力不斷被發(fā)掘,如保護數據機密性的落盤加密方案,以及保護數據可用性和完整性的勒索檢測和恢復技術、WORM、安全快照、災備、歸檔等。落盤加密可以解決存儲介質被盜取后數據泄露的問題,防勒索方案則根據數據統計特征(如熵值變化、重刪壓縮率)的異常變化來判斷數據是否正在被大批加密。相對網絡和主機側的安全方案,存儲系統在保護AT REST(靜態(tài))狀態(tài)的數據時擁有獨到優(yōu)勢。

從數據產生,數據傳輸,數據存儲,數據備份,到數據銷毀,數據安全伴隨著數據的全生命周期。存儲是數據的最終歸宿,我們只有從歸宿出發(fā),協同網、存、算建立數據在哪里,安全輻射在哪里的成體系、全系統的數據安全方案,才能解決數據安全真正的痛點。

綜上,存儲作為數據的最終載體,是守護數據安全的最后一道防線。通過存儲硬件加軟件能力建立系統不可突破、數據不可改變、業(yè)務可恢復的數據保護能力,可確保數據“一直處于可用狀態(tài)”,避免發(fā)生數據安全問題時給企業(yè)帶來經濟、聲譽、司法、人員變動等多方面影響。

給作者點贊
0 VS 0
寫得不太好

免責聲明:本文僅代表作者個人觀點,與C114通信網無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯系我們 | 網站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網 版權所有 舉報電話:021-54451141