
„Power10 Performance“ greitos pradžios vadovai
(Power10 QSG)
2021 m. lapkritis
Minimali atmintis
- Kiekviename procesoriaus lizde yra mažiausiai 8 iš 16 DIMM
- Mazge yra užpildyti mažiausiai 32 iš 64 DIMM modulių
- 4 mazgų sistemoje yra užpildyti mažiausiai 128 iš 256 DIMM
DDIMM kištuko taisyklės
- Atitikti minimalią leistiną atmintį (kiekvienas procesoriaus lizdas yra užpildytas mažiausiai 8 iš 16 DIMM)
- Visi DIMM moduliai, esantys kiekviename procesoriuje, turi būti vienodos talpos
- Funkcijų atnaujinimai bus siūlomi po 4 DDIMM, kurių visų talpa yra tokia pati.
- Vienintelis tinkamas DDIMM, prijungtų prie svetainių, prijungtų prie nurodyto procesoriaus modulio, skaičius yra 8 arba 12 arba 16.
Atminties našumas
- Sistemos našumas gerėja, nes atminties kiekis paskirstomas daugiau DDIMM lizdų. Pavyzdžiui,ampJei mazge reikia 1 TB, geriau turėti 64 x 32 GB DIMM, o ne 32 x 64 GB DIMM.
- Įjungus vienodo dydžio DIMM modulius, bus pasiektas didžiausias našumas
- Sistemos našumas gerėja, nes daugiau keturračių atitinka vienas kitą
- Sistemos našumas gerėja, nes daugiau procesorių DDIMM atitinka vienas kitą
- Sistemos našumas pagerėja kelių stalčių sistemoje, jei atminties talpa tarp stalčių yra subalansuota.
Atminties juostos plotis
| DDIMM talpa | Teorinis maksimalus dažnių juostos plotis |
| 32 GB, 64 GB (DDR4 @ 3200 Mbps) | 409 GB/s |
| 128 GB, 256 GB (DDR4 @ 2933 Mbps) | 375 GB/s |
Santrauka
- Siekiant geriausio įmanomo našumo, paprastai rekomenduojama atmintį įdiegti tolygiai visuose sistemos mazgų stalčiuose ir visuose sistemos procesoriaus lizduose. Atminties balansavimas tarp įdiegtų sistemos plokščių kortelių leidžia nuosekliai pasiekti atmintį ir paprastai užtikrina geresnį jūsų konfigūracijos našumą.
- Nors maksimalus atminties pralaidumas pasiekiamas užpildžius visus atminties lizdus, sprendžiant, kokio dydžio atminties funkciją naudoti pradinio sistemos užsakymo metu, reikėtų atsižvelgti į būsimos atminties papildymo planus.
P10 skaičiavimas ir MMA architektūra
- 2x pralaidumas suderintas su SIMD*
- 8 nepriklausomi Fixed & Float SIMD varikliai vienam branduoliui
- 4–32x matricos matematikos pagreitis*
- 4 512 bitų variklis viename branduolyje = 2048b rezultatai / ciklai
- Vieno, dvigubo ir sumažinto tikslumo matricinės matematikos išoriniai produktai.
- MMA architektūros palaikymas įdiegtas POWER ISA v3.1
- Palaiko SP, DP, BF16, HP, Int-16, Int-8 ir Int-4 tikslumo lygius.
P10 MMAApplications ir darbo krūvio integravimas
- ML ir HPC programas su tankiais tiesinės algebros skaičiavimais, matricų daugyba, konvoliucija, FFT galima pagreitinti naudojant MMA
- GCC versija >= 10 ir LLVM versija >=12 palaiko MMA per įtaisytuosius.
- OpenBLAS, IBM ESSL ir Eigen bibliotekos jau optimizuotos naudojant MMA instrukcijas, skirtas P10.
- Lengvas MMA integravimas įmonės programoms, ML sistemoms ir atviros bendruomenės paketams per aukščiau nurodytas BLAS bibliotekas.
„PowerPC Matrix-Multiply Assist“ integruotos funkcijos https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
„Matrix-Multiply Assist“ geriausios praktikos vadovas https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?Open
Virtualūs procesoriai
- Visų bendrinamų skaidinių turimų branduolių suma negali viršyti branduolių skaičiaus bendrame telkinyje
- Įsitikinkite, kad sukonfigūruotų virtualių procesorių skaičius bet kuriame bendrai naudojamame rėmelyje yra ne didesnis nei branduolių skaičius bendrame telkinyje
- Konfigūruokite virtualių procesorių skaičių bendram skaidiniui, kad išlaikytumėte didžiausią pajėgumų poreikį
- Sukonfigūruokite bendrinamo skaidinio turimų branduolių skaičių taip, kad būtų naudojamas vidutinis to skaidinio panaudojimas, kad būtų užtikrintas geresnis našumas
- Norėdami užtikrinti geresnį atminties ir procesoriaus giminingumą (išvengti nereikalingų virtualiojo procesoriaus išankstinių nuostatų), užtikrinkite, kad visų bendrinamų skaidinių turimų branduolių suma būtų artima bendrame telkinyje esančių branduolių skaičiui.
Procesoriaus suderinamumo režimas
- Yra 2 AIX procesoriaus suderinamumo režimai: POWER9 ir POWER9_base. Numatytasis yra POWER9_base režimas.
- „Linux“ galimi 2 procesoriaus suderinamumo režimai: POWER9 ir POWER10 režimai. Numatytasis yra POWER10 režimas.
- Po LPM skaidinių reikia įjungti maitinimo ciklą keičiant procesoriaus suderinamumo režimą
Procesoriaus lankstymo aplinkybės
- Dalijimosi skaidiniui, kuriame veikia AIX sistemoje Power9, numatytasis vpm_throughput_mode = 0, Power10 - numatytasis vpm_throughput_mode = 2. Jei darbo krūviuose yra ilgai vykdomų užduočių, tai gali padėti sumažinti pagrindinį naudojimą.
- Skirtam skaidiniui, kuriame veikia AIX, numatytasis vpm_throughput_mode = 0 tiek Power9, tiek Power10.
LPAR puslapio lentelės dydžio svarstymai
• Radix puslapio lentelė palaikoma nuo Power10, kuriame veikia Linux. Tai gali pagerinti darbo krūvio našumą.
Nuoroda:
Patarimai ir patarimai, kaip perkelti darbo krūvį į IBM POWER Systems: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualization geriausios praktikos vadovas: https://www.ibm.com/downloads/cas/JVGZA8RW
Įsitikinkite, kad OS lygis yra dabartinis
Fix Central pateikia naujausius AIX, IBM i, VIOS, Linux, HMC ir F/W naujinimus. Be to, FLRT įrankis pateikia rekomenduojamus lygius kiekvienam H/W modeliui. Naudokite šiuos įrankius, kad sistema būtų atnaujinta. Jei negalite pasiekti rekomenduojamo lygio, žr. skyrių „Žinoma problema“ Patarimai ir patarimai, kaip perkelti darbo krūvį į dokumentą „IBM POWER10 Processor-Based Systems“.
AIX procesoriaus naudojimas
Naudojant POWER10, AIX OS sistema yra optimizuota taip, kad būtų užtikrintas geriausias neapdorotas pralaidumas esant didesniam procesoriaus naudojimui, kai veikia su specialiais procesoriais. Kai veikia su bendrai naudojamais procesoriais, AIX OS sistema yra optimizuota taip, kad sumažintų procesoriaus naudojimą (pc). Jei klientui reikia dar labiau sumažinti procesoriaus naudojimą (pc), naudokite derinamą tvarkaraštį pm_throughput_mode, kad sureguliuotumėte darbo krūvį ir įvertintumėte neapdoroto pralaidumo naudą, palyginti su procesoriaus naudojimu.
NX GZIP
Paimti advanątagNX GZIP spartinimo POWER10 sistemose LPAR turi būti POWER9 suderinamumo režimu (ne POWER9_base režimu) arba POWER10 suderinamumo režimu.
IBM i
Įsitikinkite, kad IBM I operacinės sistemos lygis yra dabartinis. Fix Central pateikia naujausius IBM I, VIOS, HMC ir programinės įrangos naujinimus. https://www.ibm.com/support/fixcentral/
Firmware
Įsitikinkite, kad sistemos programinės įrangos lygis yra dabartinis. Fix Central pateikia naujausius IBM I, VIOS, HMC ir programinės įrangos naujinimus. https://www.ibm.com/support/fixcentral/
Atminties DIMM
Laikykitės tinkamų atminties papildinių taisyklių. Jei įmanoma, visiškai užpildykite atminties DIMM lizdus ir naudokite panašaus dydžio atminties DIMM.
Procesoriaus SMT lygis
Paimti visą avansątagAtsižvelgiant į Power10 procesorių našumą, klientams rekomenduojame naudoti numatytuosius IBM i procesoriaus kelių užduočių atlikimo nustatymus, kurie maksimaliai padidins SMT
LPAR konfigūracijos lygis.
Pertvaros išdėstymas
Esami FW lygiai užtikrina optimalų pertvarų išdėstymą. Tačiau jei CEC skaidiniuose atliekamos dažnos DLPAR operacijos, rekomenduojama naudoti DPO
optimizuoti vietą.
Virtualūs procesoriai – bendri ir skirti procesoriai
Norėdami užtikrinti optimalų skaidinio našumą, naudokite tam skirtus procesorius.
Energijos skalė
Norėdami gauti geriausią procesoriaus greitį, įsitikinkite, kad nustatytas didžiausias našumas (numatytasis IBM Power E1080). Šį nustatymą galima konfigūruoti ASMI.
Saugojimo ir tinklo įvestis/išvestis
VIOS suteikia lanksčias saugojimo ir tinklo funkcijas. Kad pasiektumėte geriausią įmanomą našumą, naudokite savąsias IBM i sąsajas I/O.
Išsamesnė informacija
Žr. nuorodą: IBM I on Power – našumo DUK https://www.ibm.com/downloads/cas/QWXA9XKN
Įmonės Linux operacinė sistema (OS) yra tvirtas pagrindas jūsų hibridinei debesų infrastruktūrai ir plečiamiems įmonės programinės įrangos sprendimams. Naujausi leidimai yra optimizuoti geriausioms savo klasėje „Power10 Enterprise“ sistemoms
Galia 10
- SLES15SP3, RHEL8.4 palaiko „Power10“ vietinį režimą
- Kompaso režimo palaikymas, leidžiantis klientams pereiti iš senesnės kartos maitinimo sistemų (P9 ir P8)
- Numatytasis Radix vertimo palaikymas Power10 režimu
- Žymus šifravimo našumo pagerėjimas
Linux + PowerVM
- PowerVM įmonės funkcijų palaikymas: LPM, bendri procesorių telkiniai, DLPAR
- Inovatyvūs sprendimai: SAP HANA ateities programų augimas su 4PB virtualia adresų erdve
- Sutrumpinkite duomenų įkėlimo laiką: virtualus PMEM palaikymas, skirtas SAP HANA
- Pasaulinės klasės palaikymas ir aptarnavimas
Palaikomi platinimai:
- Pradedant nuo Power9, PowerVM skaidiniuose palaikomos tik RedHat ir SUSE
- Išsami informacija apie platinimo palaikymo matricą, apimančią senesnės kartos HW
LPM palaikymas:
- Perkelkite „Linux“ loginius skaidinius iš senesnės kartos maitinimo sistemų su beveik nuliniu programų prastovos laiku
- Nuoroda: LPM vadovas ir susijusi informacija
Galios specifiniai paketai:
- PowerPC-utils paketas: yra IBM PowerPC LPAR priežiūros paslaugų. Galima įsigyti kaip platinimo dalį.
- „Advance Toolchain“, skirta „Linux on Power“: yra naujausių kompiliatorių ir vykdymo laiko bibliotekų.
Geriausia praktika :
- RHEL teikia iš anksto nustatytus derinimus kaip suderintos paslaugos dalį.
- Rekomenduojamus SAP programų OS nustatymus rasite naujausiose SAP pastabose. Paprastai sureguliuotas naudojamas RHEL, o užfiksuotas arba sapconf SLES
- Dažnį valdo PowerVM. Nuoroda: Energijos valdymas
- „Power8 Huge Dynamic DMA Window“ paleidimas padeda pagerinti I/O našumą.
- Starting Power9 24×7-Monitoring yra integruotas su perf įrankiu. Leidžia stebėti visą sistemą.
- Įsitikinkite, kad sistemos programinės įrangos lygis yra dabartinis.
- lparnumascore iš PowerPC-utils rodo dabartinį LPAR afiniteto balą. DPO gali būti naudojamas LPAR afiniteto balui pagerinti.
Daugiau skaitymų:
- SLES for Power ir kai kurios patrauklios funkcijos.
- Pradėkite naudotis „Linux on Power Systems“, „Linux on Power Systems“ serveriais
- Enterprise Linux bendruomenė
- „IBM Power“ sistemos palaiko įvairius tinklo adapterius, turinčius skirtingą greitį ir prievadų skaičių.
- Jei naudojate tuos pačius tinklo adapterius kaip ir ankstesnėje sistemoje, iš pradžių naujojoje sistemoje turėtų būti naudojamas tas pats derinimas.
- Dauguma Ethernet adapterių palaiko kelias priėmimo ir perdavimo eiles, kurių buferio dydį galima keisti, kad padidėtų maksimalus paketų skaičius.
- Numatytieji eilės parametrai skiriasi naudojant skirtingus adapterius ir gali būti neoptimalūs norint pasiekti maksimalų pranešimų greitį kliento-serverio modelyje.
- Papildomų eilių naudojimas padidins sistemos procesoriaus naudojimą; todėl reikia naudoti optimalų eilės nustatymą konkrečiam darbo krūviui.
Didesnio greičio adapterio svarstymai
- Didesnės spartos tinklams su 25 GigE ir 100 GigE tinklo adapteriais reikia kelių lygiagrečių gijų ir tvarkyklės atributų derinimo.
- Jei tai yra Gen4 adapteris, įsitikinkite, kad pritaikytas yra Gen4 lizde.
- Papildomos funkcijos, tokios kaip glaudinimas, šifravimas ir dubliavimas, gali padidinti delsą
Eilės parametrų keitimas AIX
Norėdami pakeisti priėmimo / siuntimo eilių skaičių AIX
- ifconfig enX atjunkite
- chdev -l entX -a eilės_rx= -a eilės_tx=
- chdev -l enX -a būsena=aukštyn
Eilės nustatymų keitimas sistemoje „Linux“.
Norėdami pakeisti eilių skaičių Linux ethtool -L ethX kartu
Eilės dydžio keitimas AIX
- ifconfig enX atjunkite
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a būsena=aukštyn
Eilės dydžio keitimas LinuxP: ethtool -G ethX rx tx
Virtualizacija
- Virtualizuotas tinklas palaikomas SRIOV, vNIC, vETH forma. Virtualizacija padidina delsą ir gali sumažinti pralaidumą, palyginti su vietine I / O.
- Be užpakalinės aparatinės įrangos, įsitikinkite, kad VIOS atminties ir procesoriaus pakanka, kad būtų užtikrintas reikalingas pralaidumas ir atsako laikas
- IBM PowerVM geriausia praktika gali būti labai naudinga nustatant VIOS dydį
- Jei naudojate tuos pačius saugojimo adapterius kaip ir ankstesnėje sistemoje, iš pradžių naujojoje sistemoje turėtų būti naudojamas tas pats derinimas. Jei pageidaujama papildomo našumo iš esamos sistemos, reikia atlikti įprastą derinimą.
- Jei saugyklos posistemiai naujesnėje sistemoje žymiai skiriasi nuo ankstesnės sistemos, toliau pateiktas svarstymų sąrašas gali neigiamai paveikti numanomą programų spartą.
- Pakeitus iš tiesioginės prijungtos saugyklos (DAS arba vidinio) į Storage Area Network (SAN) arba Network Attached Storage (NAS) (arba išorinę saugyklą), gali padidėti delsa.
- Papildomos funkcijos, tokios kaip glaudinimas, šifravimas ir dubliavimo panaikinimas, gali padidinti delsą.
- Sumažinus saugyklos LUN skaičių, gali sumažėti serverio ištekliai, reikalingi reikalingam pralaidumui palaikyti.
- Norėdami suprasti šį poveikį, žr. naujų įrenginių derinimo arba sąrankos vadovus.
- Virtualizacija padidina delsą ir gali sumažinti pralaidumą, palyginti su vietine I / O. Be užpakalinės įrangos, užtikrinkite VIOS atmintį ir procesorių
- Norint pereiti prie didesnio greičio virtualizuotų adapterių VIOS sistemoje, reikės pakoreguoti VIOS konfigūraciją procesoriuose ir atmintyje. IBM PowerVM geriausia praktika gali būti labai naudinga nustatant VIOS dydį.
Derinimo gairės – žr. IBM žinių centro AIX ir Linux gaires.
PCIe3 12 GB talpyklos RAID + SAS adapteris keturių prievadų 6 Gb x8 adapteris Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
IBM
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
PCIe3 x8 2 prievadų pluošto kanalo (32 Gb/s) adapteris
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
Papildomas AIX derinimas našumui užtikrinti:
- SCSI per Fibre Channel (MPIO): nustatykite kelių kelių algoritmą į round_robin kiekvienam diskui
- NVMe per Fibre Channel: rinkinys gali priskirti 7 kiekvienam NVMe per Fibre Channel dinaminiam valdikliui, sukurtam atradimo fazės metu
NVMe Adapter AIX derinimas našumui užtikrinti
Kiekvienam NVMe įrenginiui rinkinys gali būti priskirtas 8
IBM naujos kartos C/C++/Fortran kompiliatoriai, sujungiantys pažangius IBM optimizavimus su atvirojo kodo LLVM infrastruktūra
| LLVM Didesnė valiuta C/C++ kalbai Didesnis kūrimo greitis Bendrosios bendruomenės optimizavimas Įvairios LLVM pagrįstos komunalinės paslaugos |
IBM optimizavimas Visiškas Power architektūros išnaudojimas Pramonėje pirmaujantis pažangus optimizavimas Pasaulinės klasės palaikymas ir aptarnavimas |
Prieinamumas
- 60 dienų nemokama bandomoji versija: atsisiųskite iš Open XL produkto puslapio
- Gaukite pasaulinio lygio IBM paslaugas ir palaikymą naudodami lanksčias licencijavimo parinktis iš dviejų vamzdžių (AAS ir PA)
- Neterminuota licencija (įgaliotajam vartotojui arba lygiagrečiam naudotojui)
- Mėnesinė licencija (Virtual Process Core): tiksliniai debesies naudojimo atvejai, pvz., PowerVR egzemplioriuje
Rekomenduojamos našumo derinimo parinktys
| Optimizavimo lygis | Naudojimo rekomendacijos |
| -O2 ir -O3 | Tipiškas atspirties taškas |
| Nuorodos laiko optimizavimas: -flto (C/C++), -qlto (Fortran) | Darbo krūviams su daugybe mažų funkcijų iškvietimų |
| Profile valdomas optimizavimas: -fprofile-generuoti, -fprofile-naudoti (C/C++) -qprofile-generuoti, -qprofile- naudoti (Fortran) |
Darbo krūviams su daugybe šakų ir funkcijų iškvietimų |
Norėdami gauti daugiau informacijos, apsilankykite: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
Visas Power10 architektūros išnaudojimas su Open XL 17.1.0
- Nauja kompiliatoriaus parinktis „–mcpu=pwr10“, skirta generuoti kodą naudojant „Power10“ instrukcijas ir automatiškai suderinti „Power10“ optimizavimą
- Naujos įmontuotos funkcijos, leidžiančios atrakinti naujas Power10 funkcijas, pvz., Matrix Multiply Accelerator (MMA)
- „Power10“ buvo pridėtos naujos MASS SIMD ir vektorinės bibliotekos. Visos MASS bibliotekos funkcijos (SIMD, vektorinis, skaliarinis) suderintos su Power10 (taip pat Power9).
Pastaba: Programos, sudarytos naudojant ankstesnes XL kompiliatorių versijas (pvz., XL 16.1.0), skirtos veikti ankstesniuose „Power“ procesoriuose, veiks suderinamai su „Power10“.
Dvejetainis suderinamumas su AIX
Pastaba: XL C/C++, skirtas AIX 16.1.0, jau pristatė naują iškvietimą xlclang++, kuris naudoja Clang sąsają iš LLVM projekto ü C++ objektai, sukurti naudojant xlC
- AIX (remiantis paties IBM sąsaja) nėra dvejetainis suderinamas su C++ objektais, sukurtais naudojant xlclang++ 16.1.0, skirtą AIX
- C++ objektai, sukurti naudojant xlclang++ 16.1.0, skirtą AIX, bus dvejetainiu būdu suderinami su naujuoju Open XL C/C++, skirtu AIX 17.1.0
- C suderinamumas palaikomas visuose AIX kompiliatoriuose (ankstesnės XL versijos, skirtos AIX, Open XL C/C++, skirtos AIX 17.1.0)
- Fortran suderinamumas palaikomas tarp ankstesnės XLF versijos AIX ir Open XL Fortran, skirtos AIX 17.1.0
Prieinamumas
GCC kompiliatoriai yra prieinami visuose Enterprise Linux platinimuose ir toliau
AIX.
- Įdiegta GCC versija yra 8.4 RHEL 8 ir 7.4 SLES 15. Tikimasi, kad RHEL 9 pristatys GCC 11.2.
- Yra keletas būdų, kaip gauti pakankamai naujausią GCC versiją, kai numatytieji platinimo kompiliatoriai yra per seni, kad galėtų palaikyti Power10.
- Šiuo tikslu Red Hat palaiko GCC įrankių rinkinį [1].
- SUSE teikia kūrimo įrankių modulį. [2]
- IBM teikia naujausius kompiliatorius ir bibliotekas per Advance Toolchain. [3]
IBM Advance Toolchain
- „Advance Toolchain“ teikia energijai optimizuotas sistemos bibliotekas kartu su kompiliatoriais, derintuvais ir kitais įrankiais.
- Sukūrus kodą naudojant „Advance Toolchain“, galima sukurti labiausiai optimizuotą kodą naujausiuose procesoriuose.
Kalbos
- C (GCC), C++ (g++) ir Fortran (gfortran) kartu su kitais, tokiais kaip Go (GCC), D (GDC) ir Ada (gnat).
- Pagal numatytuosius nustatymus paprastai įdiegiami tik GCC, g++ ir gfortran.
- Golang kompiliatorius [4] yra tinkamiausia alternatyva kuriant Go programas naudojant Power.
Suderinamumas ir naujos „Power10“ funkcijos
- Su ankstesnėmis GCC versijomis sukurtos programos, skirtos POWER8 arba POWER9 procesoriams, veiks suderinamai su Power10 procesoriais.
- Rekomenduojama naudoti GCC 11.2 ar naujesnę versiją, kad būtų galima išnaudoti visas naujas Power ISA 3.1 funkcijas ir įdiegtas Power10 procesoriuose.
- GCC 11.2 suteikia prieigą prie „Power10“ procesorių teikiamos „Matrix Multiply Assist“ (MMA) funkcijos. [5]
- MMA programas galima kompiliuoti naudojant bet kurį GCC, LLVM ir Open XL kompiliatorių, jei naudojate pakankamai naujausias versijas.
IBM rekomenduojamos ir palaikomos kompiliatoriaus vėliavėlės [6]
| -O3 arba -Rytai | Agresyvus optimizavimas. -Rytai iš esmės atitinka -O3 -fast-math, kuri taip pat sušvelnina IEEE slankiojo kablelio aritmetikos apribojimus. |
| -mcpu=powern | Kompiliuokite naudodami maitinimo procesoriaus palaikomas instrukcijas. Pavyzdžiui,ample, norėdami naudotis instrukcijomis, pasiekiamomis tik Power10, pasirinkite -mcpu=power10. |
| - į | Neprivaloma. Atlikite „link-time“ optimizavimą. Tai optimizuoja funkcijų iškvietimų kodą, kai skambinančiojo ir iškviestos funkcijos yra skirtinguose kompiliavimo vienetuose, ir dažnai gali žymiai padidinti našumą. |
| -išvyniokite kilpas | Neprivaloma. Atlikite agresyvesnį kilpos korpusų dubliavimą, nei įprastai atliktų kompiliatorius. Paprastai turėtumėte tai praleisti, tačiau kai kuriuose koduose tai gali užtikrinti geresnį našumą. |
Pastaba:
Nors -mcpu=power10 palaikoma jau GCC 10.3 versijoje, pirmenybė teikiama GCC 11.2, nes ankstesni kompiliatoriai nepalaiko visų Power10 procesoriuose įdiegtų funkcijų. Be to, objektai, sukurti naudojant -mcpu=power10, neveiks POWER9 ar ankstesniuose procesoriuose! Tačiau yra būdų, kaip sukurti kodą, optimizuotą skirtingoms procesoriaus versijoms. [7] [1] Red Hat: GCC įrankių rinkinio naudojimas. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: kūrimo įrankių modulio supratimas. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Išplėstinė įrankių grandinė, skirta Linux, IBM Power Systems. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Eiti į kalbą. https://golang.org. [5] „Matrix-Multiply Assist“ geriausios praktikos vadovas. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] Naudojant GNU kompiliatoriaus kolekciją. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Tikslinis optimizavimas naudojant GNUIndirect funkcijų mechanizmą. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation su-gnu-netiesioginės funkcijos-mechanizmu.
„Java“ programos gali sklandžiai tobulėtitage naujų P10 ISA funkcijų operacinėse sistemose, veikiančiose P10 režimu, naudojant toliau nurodytas arba naujesnes Java vykdymo versijas:
Java 8
- IBM SDK 8 SR6 FP36
- IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1
Java 11
- IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
- IBM Semeru Runtime Open Edition 11.0.12.1: openj9-0.27.1
Java 17 (tvarkyklės dar gali būti nepasiekiamos)
- IBM Semeru Runtime Certified Edition 17: openj9-0.28
- IBM Semeru Runtime Open Edition 17: openj9-0.28
- OpenJDK 17
Našumo derinimo nuorodos:
IBM WebSphere Application Server Performance Cookbook
Puslapio dydis
Bendra rekomendacija daugumai „Oracle“ duomenų bazių AIX sistemoje yra naudoti 64 KB, o ne 16 MB puslapio dydį SGA. Paprastai 64 KB puslapiai duoda beveik tiek pat
našumo nauda kaip 16 MB puslapių be specialaus valdymo.
TNS klausytojas
Oracle 12.1 duomenų bazėje ir vėlesnėse versijose pagal numatytuosius nustatymus bus naudojama 64 4 puslapių tekstui, duomenims ir dėtuvėms. Tačiau TNSLISTENER jis vis tiek naudoja XNUMXk puslapių tekstui, duomenims ir krūvai. Į
įgalinti 64 XNUMX puslapių klausytojui, prieš pradėdamas klausytojo procesą, naudoja eksportavimo komandą. Atkreipkite dėmesį, kad veikia ASM aplinkoje, kurios klausytojas baigia
GRID_HOME, o ne ORACLE_HOME.
Komandos „strictly setenv“ dokumentacija pasikeitė 12.1 ar vėlesnėse versijose. -t arba -T buvo pašalintas -env arba -envs naudai. „Oracle Listener“ aplinkoje nustatykite ir eksportuokite:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (pridėkite komandą „Kopijuoti skaitydami“)
Bendrinama sintaksė
LDR_CNTRL=SHARED_SYMTAB=Y nustatymo nereikia konkrečiai nustatyti 11.2.0.4 ar vėlesnėse versijose. Kompiliatoriaus nuorodų parinktys pasirūpina šiuo nustatymu ir jų nebereikia specialiai nustatyti. Nerekomenduojama LDR_CNTRL=SHARED_SYMTAB=Y konkrečiai nustatyti 12c ar vėlesnėse versijose.
Virtualaus procesoriaus lankstymas
Tai labai svarbus parametras RAC aplinkoje, kai naudojami LPAR su įjungtu procesoriaus lankstymu. Jei šis parametras nėra pakoreguotas, yra didelė rizika, kad RAC mazgas bus pašalintas esant nedideliam duomenų bazės darbo krūviui. Scheda -p -o vpm_xvcpus=2
VIOS ir RAC sujungimas
Rekomenduojamas bent 10G (ty 10G eterneto adapterio) ryšys, kad būtų pakankamai pralaidumo klasterio laikui jautriam srautui. RAC klasterio srautas – jungiamasis srautas turėtų būti skirtas, o ne bendrinamas. Bendras sujungimas gali sukelti laiko uždelsimą, dėl kurio mazgas užstrigs / iškels.
Tinklo našumas
Tai ilgalaikis tinklo derinimo pasiūlymas, skirtas Oracle AIX, nors numatytasis nustatymas išlieka 0. TCP nustatymas rfc1323=1
Išsamesnė informacija
Žr. nuorodą: Dabartinių „Oracle“ duomenų bazės versijų, kuriose veikia AIX „Power Systems“, įskaitant POWER9, stabilumo ir našumo valdymas
https://www.ibm.com/support/pages/node/6355543
Generolas
- Naudokite SMT8 režimą
- Naudokite tam skirtus CPU LPAR
Db2 sandėlis
- Įsitikinkite, kad tarp visų mazgų yra didelės spartos privatus tinklas
- Apribokite MLN konfigūraciją iki vieno mazgo kiekviename lizde
CP4D
- Naudokite PCIe4 OCP mazgų tinklui
- Prieš OCP 4.8, nustatykite branduolio parametrą slub_max_order=0
Db2 geriausia praktika
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
Tinklas
- Pod tinklui naudokite privatų tinklą, pagrįstą vietiniu SRIOV, jei LPM nereikalingas, kitu atveju naudokite VNIC
- Programoms, kurioms reikalingas didelis pralaidumas arba mažas delsimas, apsvarstykite galimybę naudoti SR-IOV tinklo operatorių, kad priskirtumėte VF tiesiai prie pod.
- Paslaugoms, kurioms reikalingas trumpas laikas, sukonfigūruokite numatytuosius esamo maršruto skirtuosius laikus
- Sureguliuokite norimą OCP klasterio tinklo MTU dydį
Operacinė sistema
- Apsvarstykite galimybę padidinti u ribas atliekant „CoreOS“ po įdiegimo pakeitimus
- Žr. minimalius OCP diegimo reikalavimus, taikomus Power platform OCP4.8 diegimui Power
Diegimas
- Diegdami programas, atkreipkite dėmesį, kad vienas vCPU yra tolygus vienam fiziniam branduoliui, kai neįjungtas vienalaikis kelių gijų (SMT) arba hipersriegių apdorojimas. Kai SMT įjungtas, VCPU yra lygiavertis aparatinės įrangos gijai.
- Žr. minimalių darbuotojų ir pagrindinių mazgų dydžio gaires. Minimalūs išteklių reikalavimai
- Įtaisytajam konteinerio vaizdų registrui paskirkite atskirą dedikuotą saugyklą
- Naudokite toliau pateiktas dydžio gaires OCP pagrindinių katalogų pagrindiniams katalogams, į kuriuos OpenShift Container Platform komponentai įrašo duomenis.
Dokumentai / Ištekliai
![]() |
IBM Power10 našumas [pdfVartotojo vadovas Power10, Performance, Power10 Performance |




