C114通信網(wǎng)  |  通信人家園

專題
2020/9/22 13:09

再次吹響號(hào)角,揚(yáng)帆更壯闊的征途——AMD EPYC 7Fx2系列處理器測(cè)試

太平洋電腦網(wǎng)  

2019年8月,AMD創(chuàng)新性地將7nm工藝與最高64核心的第二代EPYC產(chǎn)品帶入了企業(yè)級(jí)x86服務(wù)器市場(chǎng)。一年時(shí)間過去,對(duì)于AMD來說,第二代EPYC很好地完成了打開市場(chǎng)的任務(wù)。

但僅僅是打開市場(chǎng)卻并非第二代EPYC的全部使命。

一年時(shí)間,AMD股價(jià)從30.45美元增長(zhǎng)至85.55美元,漲幅180.95%

回望一年前的第二代AMD EPYC發(fā)布會(huì),所有受邀發(fā)言客戶均為頂級(jí)互聯(lián)網(wǎng)公司和其他擁有超大規(guī)模數(shù)據(jù)中心的大型客戶。顯然,彼時(shí)的AMD目標(biāo)十分明確:通過更高的核心數(shù)量來提升服務(wù)器大規(guī)模云化時(shí)的計(jì)算密度,進(jìn)而使超大規(guī)模數(shù)據(jù)中心具備更強(qiáng)的服務(wù)及運(yùn)營(yíng)能力。

GCP上的實(shí)例創(chuàng)建頁面,第二代AMD EPYC赫然在列

在AWS EC2上的c5a系列實(shí)例皆為第二代AMD EPYC平臺(tái)

而從GCP和AWS為代表的一眾頂級(jí)云服務(wù)提供商的接受度來看,第二代AMD EPYC已經(jīng)很好地完成了發(fā)布之初的既定目標(biāo),成功打入了超大規(guī)模云數(shù)據(jù)中心以及頂級(jí)CSP市場(chǎng)。

這證明了AMD在芯片設(shè)計(jì)和市場(chǎng)營(yíng)銷等方面的成功。但既然第二代AMD EPYC如此成功,何不進(jìn)一步發(fā)掘一下其潛力呢?

第二代AMD EPYC處理器家族迎來全新成員

從第二代AMD EPYC的產(chǎn)品線說開去

從第二代AMD EPYC產(chǎn)品列表來看,初期的EPYC 7002(第二代EPYC的產(chǎn)品編號(hào))包含22款產(chǎn)品,核心數(shù)量從8到64,在8核、16核、24核、32核、48核、64核等主流核心數(shù)量段位上均安排了3-5款產(chǎn)品;在核數(shù)相同時(shí),不同產(chǎn)品以頻率和L3緩存配置不同加以區(qū)分。

不過,相對(duì)于競(jìng)爭(zhēng)對(duì)手基數(shù)龐大的產(chǎn)品線,由22款產(chǎn)品組成的EPYC 7002序列仍舊稍顯單薄。雖然AMD內(nèi)部人士層表示,現(xiàn)階段的AMD并不會(huì)將一些核心數(shù)量和頻率的特化型號(hào)加入產(chǎn)品計(jì)劃之中;但這并不意味著Milan來臨之前,第二代AMD EPYC產(chǎn)品線會(huì)止步不前。

于是,AMD在2020年初在EPYC 7002系列之下發(fā)布了全新的7Fx2系列處理器。

頻率提升、緩存提升——7Fx2為更多企業(yè)用戶帶來新選擇

作為Milan發(fā)布之前,第二代AMD EPYC中的最后成員,7Fx2系列包含3款產(chǎn)品,分別是24核心的7F72、16核心的7F52和8核心的7F32。

從3款新處理器與相同核心數(shù)量的原有型號(hào)對(duì)比中我們可以發(fā)現(xiàn),三款新品除了在核心頻率上有所加強(qiáng)之外,最核心的變動(dòng)便在于CCD與核心的數(shù)量配比上。

而為了明晰其間的奧秘,我們有必要回顧Rome架構(gòu)的一些特性。

Rome架構(gòu)采用ChipLets方式進(jìn)行設(shè)計(jì),在完整的64核心CPU之中包含了9個(gè)Die。9個(gè)Die分別是位于中間位置,負(fù)責(zé)內(nèi)存控制和IO功能的IOD(IO Die);以及位于IOD周邊的8個(gè)CCD(Core Compute Die)。

每個(gè)CCD內(nèi)部包含兩個(gè)CCX(Core Compute CompleX)結(jié)構(gòu)。每個(gè)CCX包含4個(gè)Zen 2核心以及對(duì)應(yīng)的L1指令及數(shù)據(jù)緩存、L2緩存。而每個(gè)CCX之內(nèi)的4個(gè)核心則共享16MB的L3緩存。

在了解了這一結(jié)構(gòu)之后,7Fx2三款新品的由來便十分明確。

7F72包含6個(gè)CCD,每個(gè)CCD之中有4個(gè)核心被激活。而由于被激活的4個(gè)核心分別位于2個(gè)CCX之上,所以每2個(gè)核心便可共享該CCX之內(nèi)的全部16MB L3緩存。換句話說,7F72每核心擁有8MB L3緩存;整個(gè)CPU共有192MB L3緩存。

作為對(duì)比,原先的7402在物理結(jié)構(gòu)上則只包含4個(gè)CCD,而每個(gè)CCD上的核心也只能分配到4MB L3緩存。這一核心數(shù)量與緩存的配比與64核心的7742保持一致。

同樣的原理,7F32和7F52的核心與緩存配比則更為“奢華”,每個(gè)核心都可以用上其所在的CCX之上的全部16MB L3緩存。

當(dāng)然,除了每核心L3數(shù)量的大升級(jí)之外,7Fx2系列也在基礎(chǔ)頻率和Boost頻率上做了幅度不小的升級(jí)。

既然頻率獲得了提升、激活了更多的物理結(jié)構(gòu)(包含更多CCD和其上L3緩存),那么處理器的功耗也自然會(huì)上漲。于是,我們便可以看到,3款7Fx2新品的默認(rèn)TDP分別到了240W、240W和180W。

不過AMD相關(guān)人士表示,由于原先提供的散熱參考設(shè)計(jì)仍舊保有余量,因此能夠覆蓋7742級(jí)別處理器的散熱裝置和設(shè)計(jì)可以繼續(xù)在新的7Fx2系列上服役。

AMD EPYC 7Fx2,為誰而來?

在了解了7Fx2系列處理器的特性及其細(xì)節(jié)構(gòu)成之后,問題接踵而至。更新了特性的7Fx2系列處理器究竟面向怎樣的用戶和應(yīng)用場(chǎng)景?

從AMD的PPT上我們可以看清三款處理器的官方定位——每核心性能以及企業(yè)應(yīng)用環(huán)境中的領(lǐng)先價(jià)值。為了進(jìn)一步闡明釋意,AMD還附帶了7Fx2系列的三種典型應(yīng)用場(chǎng)景——超融合基礎(chǔ)設(shè)施、商業(yè)HPC應(yīng)用以及關(guān)系型數(shù)據(jù)庫。同時(shí),AMD還給出了其在商業(yè)市場(chǎng)中的最新進(jìn)展——HPE Nutanix超融合產(chǎn)品、IBM Cloud裸金屬云服務(wù)以及超微的SuperBlade系列刀片服務(wù)器。

在超大規(guī)模云化數(shù)據(jù)中心當(dāng)中,OS大部分來自開源項(xiàng)目或自研,軟件堆棧的成本相對(duì)較低。因此,在通用計(jì)算類的云服務(wù)場(chǎng)景中,客戶更關(guān)心每u所能提供的核心數(shù)量。畢竟,在EC2、Compute Engine等類似的服務(wù)中,實(shí)例是按照CPU的等級(jí)與核心數(shù)量來收費(fèi)的。

而在企業(yè)環(huán)境中,軟件堆棧大多來自商業(yè)授權(quán),按照運(yùn)行軟件的Socket數(shù)量、核心數(shù)量甚至線程數(shù)量來收費(fèi)。因此,在絕大部分商業(yè)應(yīng)用中,用戶關(guān)心的核心并非計(jì)算密度或核心數(shù)量,而是每個(gè)核心是否能夠提供更高性能。由此,企業(yè)用戶便可通過基礎(chǔ)架構(gòu)更新所帶來的核心性能提升來獲得軟件成本與基礎(chǔ)架構(gòu)成本之間的全新平衡,進(jìn)而降低商業(yè)應(yīng)用的總成本。

顯然,基于現(xiàn)有的Rome架構(gòu),繼續(xù)推高頻率和每核心緩存數(shù)量的EPYC 7Fx2系列,對(duì)于更多企業(yè)用戶來說,會(huì)更接近他們的“甜蜜點(diǎn)”。

之于AMD,雖然超大規(guī)模云化數(shù)據(jù)中心能夠?yàn)樽陨砥放坪虴PYC這一系列帶來足夠大的關(guān)注度和話題點(diǎn),但超大規(guī)模數(shù)據(jù)中心本身并非行業(yè)的主流。因此,已經(jīng)在這一市場(chǎng)斬獲頗豐并引發(fā)市場(chǎng)和用戶的足夠關(guān)注之后,順勢(shì)推出市場(chǎng)覆蓋面更廣的、面向普通企業(yè)級(jí)應(yīng)用的更多產(chǎn)品才是將關(guān)注轉(zhuǎn)化為收入的正確方法。

7Fx2系列產(chǎn)品所承擔(dān)的任務(wù)正是如此。

第二代AMD EPYC 7Fx2系列將面臨哪些競(jìng)爭(zhēng)?

基礎(chǔ)特性的升級(jí)讓AMD有更多本錢來滿足企業(yè)市場(chǎng)的需求,但這片市場(chǎng)也并非未被開墾的處女地。想要在這一市場(chǎng)獲得成功,AMD不僅要為用戶提供令人滿意的性能,更需為用戶帶來令人滿意的價(jià)格。

從目前已經(jīng)掌握的信息來看,按官方指導(dǎo)價(jià)格(美元),7F72定價(jià)2450,7F52定價(jià)3100,7F32定價(jià)2100。

卡位8核的競(jìng)爭(zhēng)對(duì)手,價(jià)格從2200美元到3400美元(去掉某些字母結(jié)尾的特化型號(hào))。但從產(chǎn)品序列的厚度來看,8核心產(chǎn)品并非競(jìng)爭(zhēng)對(duì)手企業(yè)級(jí)產(chǎn)品的主力關(guān)注領(lǐng)域。相反,有很多消費(fèi)級(jí)、工作站W(wǎng)產(chǎn)品則在這一領(lǐng)域多有布局。即便拋開所有Rome架構(gòu)的特性不談,單從價(jià)格來看,EPYC 7F32的2100美元定價(jià)便具備相當(dāng)?shù)奈Α?/p>

卡位16核的競(jìng)爭(zhēng)對(duì)手,價(jià)格從1400美元到3300美元;如果包含L結(jié)尾的超長(zhǎng)生命周期型號(hào)的話,價(jià)格區(qū)間也會(huì)上探到約4800美元左右。而從表格寬度和競(jìng)品數(shù)量來看,16核心已經(jīng)進(jìn)入了主力產(chǎn)品區(qū)間。在價(jià)格層面,7F52定價(jià)3100美元,在16核心產(chǎn)品之中也屬于高端產(chǎn)品。顯然,要在這一定位中有所斬獲,EPYC 7F72需要提供更強(qiáng)的性能;而這正是7F72所配備的256MB L3緩存、更高的頻率以及8通道內(nèi)存控制器的用武之地(當(dāng)然,這里我們也需要提出,AMD與競(jìng)品采用的緩存架構(gòu)不一樣,競(jìng)品的優(yōu)勢(shì)在于更大的L2,而Rome的優(yōu)勢(shì)則在于L3更大)。

而到了24核產(chǎn)品線,競(jìng)品的布局則可以用更加細(xì)密來形容,產(chǎn)品序列從Gold到Platium,價(jià)格范圍也從1400美元左右到7000美元左右。7F72定價(jià)2450美元,單看價(jià)格便知是瞄準(zhǔn)性價(jià)比而去的。

從AMD EPYC 7Fx2系列三款產(chǎn)品的價(jià)格層面,我們可以看出,雖然同屬一個(gè)系列,但在不同的定位中,其目標(biāo)細(xì)分卻是有所不同的。除了在8核層面具備絕對(duì)價(jià)格優(yōu)勢(shì)的7F32,剩下兩款7F52和7F72均會(huì)面對(duì)來自競(jìng)爭(zhēng)對(duì)手相似定位產(chǎn)品的阻力。

7F52和7F72能否在自身的定位中獲得比較優(yōu)勢(shì),性能表現(xiàn)是關(guān)鍵。而這也正是本篇評(píng)測(cè)所關(guān)注的重點(diǎn)。

AMD EPYC 7F72處理器雙路系統(tǒng)評(píng)測(cè)

測(cè)試說明:

本次測(cè)試通過遠(yuǎn)程接入AMD測(cè)試機(jī)房的形式來進(jìn)行。

系統(tǒng)配置:

AMD雙路服務(wù)器使用了兩顆AMD EPYC 7F72 24核處理器,支持超線程。如此,在系統(tǒng)中我們可以看到這臺(tái)服務(wù)器有96個(gè)邏輯CPU。在測(cè)試中,Numa Nodes設(shè)置為2。

CPU信息:

具體到NUMA節(jié)點(diǎn)的設(shè)置,我們使用numactl進(jìn)行了讀取:

可以看到兩個(gè)NUMA node均分了邏輯CPU和512GB的內(nèi)存。AMD雙路服務(wù)器以性能見長(zhǎng),在此我們通過實(shí)驗(yàn)對(duì)這臺(tái)服務(wù)器的性能進(jìn)行了全面的評(píng)估。測(cè)試環(huán)境及工具如下:

01、HPL Linpack 2.3測(cè)試

Linpack是目前流行的理論性能測(cè)試工具,用于測(cè)試系統(tǒng)的浮點(diǎn)運(yùn)算性能。在這一項(xiàng)目中我們使用更能突出系統(tǒng)并行計(jì)算能力的HPL Linpack 2.3來進(jìn)行測(cè)試。

測(cè)試中,關(guān)鍵參數(shù)的設(shè)置為P=4,Q=3,N= 239008, NB= 224。測(cè)試執(zhí)行了4056秒,最終結(jié)果為PASSED,這款A(yù)MD EPYC 7F72雙路服務(wù)器獲得了2171.3 Gflops的成績(jī)。

02、Sysbench 1.0.20

SysBench是一個(gè)模塊化的、跨平臺(tái)、多線程基準(zhǔn)測(cè)試工具,主要用于評(píng)估測(cè)試各種不同系統(tǒng)參數(shù)下的數(shù)據(jù)庫負(fù)載情況;其中包括CPU、磁盤IO、調(diào)度程序性能、內(nèi)存、POSIX線程性能、數(shù)據(jù)庫性能(OLTP)等數(shù)個(gè)基準(zhǔn)測(cè)試模塊。在這里我們主要選取CPU、內(nèi)存以及OLTP的測(cè)試結(jié)果。編譯器方面,我們使用的是LuaJIT 2.1.0 beta2。

CPU:

Sysbench CPU測(cè)試使用1,4,16,32,48,64,80,96及128線程分別對(duì)服務(wù)器壓測(cè)300s,并記錄雙路AMD EPYC 7F72的速度及延時(shí)數(shù)據(jù)。結(jié)果如下圖所示:

隨著壓力逐步上升,測(cè)試成績(jī)也被劃為三個(gè)階段,第一個(gè)階段壓力明顯偏小,CPU每秒鐘執(zhí)行的events數(shù)隨著壓力升高而升高,并且延時(shí)一直保持在2ms以內(nèi)。當(dāng)Threads超過48是,CPU測(cè)試成績(jī)趨近于35000,而延時(shí)小幅增長(zhǎng),但是仍然低于3ms。第三個(gè)階段,當(dāng)壓力超過系統(tǒng)的邏輯CPU數(shù)時(shí),延時(shí)明顯升高。Thread=96時(shí),CPU Speed為34885.8 events/s,同時(shí)延時(shí)(95%)為2.76ms。

內(nèi)存:

Sysbench內(nèi)存測(cè)試中我們使用了1,4,16,32,48,64,80,96,128幾種Threads幾種不同的壓力做4k寫測(cè)試,每種壓力測(cè)試10s。與CPU測(cè)試不同的是,這里我們展示的是內(nèi)存寫帶寬和最大延時(shí)。

當(dāng)Thread為1時(shí),此時(shí)負(fù)載完全是4k順序?qū),?nèi)存帶寬成績(jī)達(dá)到本次測(cè)試最大值13825.82 MiB/s,此時(shí)最大延時(shí)為0.07ms。

OLTP:

Sysbench的OLTP測(cè)試則是模擬一個(gè)數(shù)據(jù)庫的壓測(cè)環(huán)境,對(duì)服務(wù)器性能進(jìn)行全面評(píng)估。這項(xiàng)測(cè)試中我們將Sysbench的Table size分別設(shè)置為200000,500000,1000000,1500000,2000000;并使用32,48,64,80,96,128等幾種不同的Threads參數(shù)進(jìn)行組合測(cè)試。結(jié)果如下圖:

本次測(cè)試固定為100個(gè)Table,將單個(gè)Table的數(shù)據(jù)量作為測(cè)試數(shù)據(jù)量規(guī)模的主要變量,而并發(fā)線程數(shù)作為并發(fā)壓力的主要變量。從測(cè)試結(jié)果來看,在不同Table大小的情況下,線程數(shù)增加可以帶來性能成線性增加,并且始終保持著5ms以內(nèi)的低延時(shí),并在最大并發(fā)壓力128線程時(shí)取得最好的成績(jī),可以看出不同Table大小設(shè)置對(duì)于性能表現(xiàn)的影響并不大。顯然,這與測(cè)試環(huán)境本身配置的512GB大內(nèi)存有直接關(guān)系,如果MySQL的緩存被占滿,數(shù)據(jù)需要不斷下刷到SSD,屆時(shí)延時(shí)將會(huì)明顯升高。

峰值性能出現(xiàn)在Table大小為20W,線程數(shù)為128時(shí),此時(shí)峰值性能為47873.84 TPS,95% 延時(shí)為4.25ms。

03、TPCC基準(zhǔn)測(cè)試

此項(xiàng)測(cè)試中我們使用的數(shù)據(jù)庫是Oracle官方的MySQL 8.0,并使用Perconas的TPCC-MySQL工具進(jìn)行測(cè)試。

TPCC是TPC(Transaction Processing Performance Council)設(shè)計(jì)的一個(gè)OLTP基準(zhǔn)測(cè)試規(guī)范,TPCC模擬的是一個(gè)大型商品批發(fā)商的在線訂單處理系統(tǒng);這一大型商品批發(fā)商擁有 N 個(gè)位于不同區(qū)域的倉庫,每個(gè)倉庫負(fù)責(zé)為 10 個(gè)銷售點(diǎn)供貨,每個(gè)銷售點(diǎn)有 3000 個(gè)客戶,每個(gè)客戶平均一個(gè)訂單有 10 項(xiàng)產(chǎn)品。

TPCC 測(cè)試模型(source: http://www.tpc.org/)

TPCC測(cè)試涉及到了新訂單處理、更新客戶賬戶余額并反饋支付狀態(tài)、發(fā)貨、查詢客戶交易記錄及倉儲(chǔ)狀態(tài)等操作。其中每分鐘的新訂單量也被稱為TpmC,是TPCC測(cè)試最重要的指標(biāo)。

通過設(shè)置倉庫個(gè)數(shù)(N)的值及并發(fā)連接數(shù),可以調(diào)節(jié)TPCC測(cè)試的壓力。由于TPCC測(cè)試涉及的操作類型較多,所以應(yīng)用下發(fā)的I/O模型是個(gè)復(fù)雜的混合讀寫模型。因此,TPCC測(cè)試是一個(gè)對(duì)系統(tǒng)、CPU、內(nèi)存及存儲(chǔ)等組件綜合性能及穩(wěn)定性的評(píng)估方案。

TPC 不提供基準(zhǔn)測(cè)試程序的代碼,而只給出基準(zhǔn)程序的標(biāo)準(zhǔn)規(guī)范。目前,很多廠商和實(shí)驗(yàn)室給出了符合TPCC測(cè)試規(guī)范的應(yīng)用,本次我們測(cè)試使用的Percona TPCC-MySQL測(cè)試工具便是其中使用較為廣泛的一種。

此次TPCC測(cè)試我們共生成了10000個(gè)倉庫,整個(gè)數(shù)據(jù)庫超過1.1TB,如此的數(shù)據(jù)庫規(guī)?梢宰寜簻y(cè)短時(shí)間內(nèi)充滿系統(tǒng)Cache,讓系統(tǒng)性能趨于穩(wěn)定,避免大容量?jī)?nèi)存帶來的結(jié)果偏高的現(xiàn)象。測(cè)試中將使用32,48,64,80,96,128幾種不同的連接數(shù)對(duì)服務(wù)器進(jìn)行壓測(cè),每次壓測(cè)時(shí)間為30分鐘(每次測(cè)試之前我們都會(huì)重啟MySQL服務(wù),以規(guī)避上次測(cè)試的影響)。首先是不同連接數(shù)的TPCC測(cè)試結(jié)果:

可以看到當(dāng)Connection為48時(shí),AMD EPYC 7F72雙路系統(tǒng)的TPCC測(cè)試可以達(dá)到298951.875的TpmC的成績(jī)。具體到Connection為48的這項(xiàng)測(cè)試,結(jié)果如下圖:

可以看到TpmC值不足30萬的實(shí)踐主要集中在前10分鐘,而之后的測(cè)試結(jié)果處于30萬附近,且隨時(shí)間的推進(jìn),測(cè)試成績(jī)也趨于穩(wěn)定。

04、OracleDB TPCC

最后,我們選擇了商用數(shù)據(jù)庫中最主流的產(chǎn)品——OracleDB來測(cè)試AMD EPYC 7F72雙路系統(tǒng)的性能表現(xiàn)。

與之前使用的MySQL測(cè)試類似,通過設(shè)置倉庫個(gè)數(shù)(N)的值及并發(fā)連接數(shù),可以調(diào)節(jié)OracleDB的TPCC測(cè)試壓力。測(cè)試中我們分別設(shè)置了1000、5000和12000三種warehouse數(shù)量,測(cè)試其在48、96、144和192個(gè)連接情況下的性能表現(xiàn)。

從上面的測(cè)試結(jié)果當(dāng)中,我們可以看出無論warehouse數(shù)量多寡,峰值性能總是出現(xiàn)在96連接時(shí)。而在1000warehouse設(shè)置下,TPCC性能達(dá)到了峰值,為480,135 TpmC。

在不同的warehouse數(shù)量的設(shè)置當(dāng)中1000和5000的峰值性能表現(xiàn)較為接近;而當(dāng)warehouse數(shù)量來到12000時(shí),性能下降則比較明顯,并且不同連接數(shù)時(shí)的性能差異也在收窄,說明這一數(shù)量的warehouse已經(jīng)達(dá)到了雙路7F72系統(tǒng)的性能瓶頸。

AMD EPYC 7F52處理器雙路系統(tǒng)測(cè)試

在相同的系統(tǒng)環(huán)境下,我們通過更換處理器的方式進(jìn)行AMD EPYC 7F52雙路處理器的性能測(cè)試。NUMA Nodes同樣設(shè)置為2。

CPU信息:

系統(tǒng)環(huán)境如下:

01、HPL Linpack 2.3測(cè)試

Linpack是目前流行的理論性能測(cè)試工具,用于測(cè)試系統(tǒng)的浮點(diǎn)運(yùn)算性能。在這一項(xiàng)目中我們使用更能突出系統(tǒng)并行計(jì)算能力的HPL來進(jìn)行測(cè)試。其中關(guān)鍵參數(shù)P=4,Q=4,N= 239008, NB= 224.測(cè)試執(zhí)行了4056秒,最終結(jié)果為PASSED,這款A(yù)MD EPYC 7F52雙路服務(wù)器獲得了1616.8 Gflops的成績(jī)。

02、Sysbench 1.0.20

SysBench是一個(gè)模塊化的、跨平臺(tái)、多線程基準(zhǔn)測(cè)試工具,主要用于評(píng)估測(cè)試各種不同系統(tǒng)參數(shù)下的數(shù)據(jù)庫負(fù)載情況;其中包括CPU、磁盤IO、調(diào)度程序性能、內(nèi)存、POSIX線程性能、數(shù)據(jù)庫性能(OLTP)等數(shù)個(gè)基準(zhǔn)測(cè)試模塊。在這里我們主要選取CPU、內(nèi)存以及OLTP的測(cè)試結(jié)果。編譯器方面,我們使用的是LuaJIT 2.1.0 beta2。

CPU:

Sysbench CPU測(cè)試使用1,4,16,32,48,64,80,96及128線程分別對(duì)服務(wù)器壓測(cè)300s,并記錄雙路AMD EPYC 7F52的速度及延時(shí)數(shù)據(jù)。結(jié)果如下圖所示:

隨著壓力逐步上升,測(cè)試成績(jī)也被劃為三個(gè)階段,第一個(gè)階段壓力明顯偏小,CPU每秒鐘執(zhí)行的events數(shù)隨著壓力升高而升高,并且延時(shí)一直保持在2ms以內(nèi)。當(dāng)Threads數(shù)量超過64時(shí),CPU測(cè)試成績(jī)趨近于最高的24500左右,而延時(shí)小幅增長(zhǎng)至2.6ms左右。第三個(gè)階段,當(dāng)壓力超過系統(tǒng)的邏輯CPU數(shù),延時(shí)明顯升高。Thread=64時(shí),CPU Speed為24511.22 events/s,同時(shí)延時(shí)(95%)為2.61ms。

內(nèi)存:

Sysbench內(nèi)存測(cè)試中我們使用了1,4,16,32,48,64,80,96,128幾種Threads幾種不同的壓力做4k寫測(cè)試,每種壓力測(cè)試10秒。與CPU測(cè)試不同的是,這里我們展示的是內(nèi)存寫帶寬和最大延時(shí)。

當(dāng)Thread為1時(shí),此時(shí)負(fù)載完全是4k順序?qū),?nèi)存帶寬成績(jī)達(dá)到本次測(cè)試最大值14419.09 MiB/s,此時(shí)延時(shí)小于0.01ms(推測(cè)受限于sysbench報(bào)告的0.01ms,測(cè)試中看到的是0。)

OLTP:

Sysbench的OLTP測(cè)試則是模擬一個(gè)數(shù)據(jù)庫的壓測(cè)環(huán)境,對(duì)服務(wù)器性能進(jìn)行全面評(píng)估。這項(xiàng)測(cè)試中我們將Sysbench的Table size分別設(shè)置為200000,500000,1000000,1500000,2000000,并與32,48,64,80,96,128幾種不同的Threads參數(shù)進(jìn)行組合測(cè)試。結(jié)果如下圖:

從測(cè)試結(jié)果來看,在不同Table大小的情況下,128線程的設(shè)置均能夠取得最好的成績(jī),且不同Table大小設(shè)置對(duì)于性能表現(xiàn)的影響并不大。顯然,這與測(cè)試環(huán)境本身配置的512GB大內(nèi)存及強(qiáng)大的整體性能有直接關(guān)系;即便Table大小達(dá)到200W,仍然沒有達(dá)到服務(wù)器的性能上限。

測(cè)試中的峰值性能出現(xiàn)在Table大小為20W、線程數(shù)為128時(shí),此時(shí)峰值性能為33202.08 TPS。

03、MySQL 8測(cè)試:

此項(xiàng)測(cè)試中我們同樣使用了Oracle發(fā)布的MySQL 8,并使用Percona發(fā)布的TPCC-MySQL工具進(jìn)行測(cè)試。

此次TPCC測(cè)試我們共生成了10000個(gè)倉庫,整個(gè)數(shù)據(jù)庫超過1.1TB。

測(cè)試中將使用8,16,32,64,128幾種不同的連接數(shù)對(duì)服務(wù)器進(jìn)行壓測(cè),每次壓測(cè)時(shí)間為30分鐘(每次測(cè)試之前我們都會(huì)重啟MySQL服務(wù),以規(guī)避上次測(cè)試的影響)。首先是多次TPCC測(cè)試的結(jié)果:

可以看到當(dāng)Connection為64時(shí),AMD EPYC 7F52的TPCC測(cè)試可以達(dá)到峰值的243537.266 TpmC。在Connection為64時(shí),隨時(shí)間變化的性能曲線如下圖:

從上面的圖標(biāo)中,我們可以看到,隨著測(cè)試的進(jìn)行,系統(tǒng)在前13分鐘內(nèi)性能穩(wěn)步上升,并在第16分鐘時(shí)達(dá)到峰值。但隨著測(cè)試的繼續(xù)進(jìn)行,MySQL的緩存逐漸消耗殆盡,數(shù)據(jù)需要下刷到磁盤,系統(tǒng)性能會(huì)出現(xiàn)輕微波動(dòng)和緩慢下降,從測(cè)試看系統(tǒng)綜合性能最后仍會(huì)穩(wěn)定在24萬TpmC附近。

結(jié)語:

憑借優(yōu)秀的Rome架構(gòu),AMD終于再次向更主流的企業(yè)級(jí)市場(chǎng)發(fā)起了進(jìn)攻。

而與以往不同的是,此次蓄力而來的AMD帶著的是在超大規(guī)模處理器市場(chǎng)所積累的優(yōu)秀口碑、EPYC 7Fx2系列和眾多產(chǎn)品的優(yōu)秀性能以及Rome架構(gòu)本身的眾多先進(jìn)特性。與此同時(shí),AMD更為此次的EPYC 7Fx2系列產(chǎn)品規(guī)劃了優(yōu)異的性價(jià)比。

7Fx2系列雖是Rome系列的最后成員,但其為AMD所打開的企業(yè)級(jí)市場(chǎng)大門卻讓AMD和整個(gè)市場(chǎng)都可以在2020年市場(chǎng)和之后即將發(fā)布的Milan中期待更多。

AMD在企業(yè)級(jí)市場(chǎng)的再次崛起與其近年來帶給用戶的更多驚喜說明一個(gè)道理,盡管路長(zhǎng)且險(xiǎn),但未來仍未有定數(shù);技術(shù)不停歇,我們都應(yīng)保持期待。 

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141