Nvidia H100 tulee tuotantoon ja L40 “Ada Lovelace” saapuu palvelimille

Pelaajayleisölle suunnattujen ilmoitusten lisäksi Nvidia käytti hyväkseen GTC 2022:n avauspuheenvuoron viestiäkseen useita uutisia datakeskuksista ja autonomisista autoista. Yhtiö vahvisti, että Hopper H100 GPU tuli massatuotantoon päästäkseen markkinoille vuonna 2023, esitteli uuteen Ada Lovelace -mikroarkkitehtuuriin perustuvan palvelinratkaisun ja ravisteli autonomisten ajoneuvojen markkinoita Nvidia DRIVE Thorilla, ainesosalla, joka korvaa uuden Ada Lovelacen. Atlanin mikroarkkitehtuuri, tällä hetkellä kumottu ja alkaa vasta vuonna 2025.

GPU Hopper H100 alkaa tuotantoon

Kuluvan vuoden maaliskuussa kommunikoitu Nvidia H100, jota Hopper-mikroarkkitehtuuri tukee, lupasi muuttaa AI (tekoäly) -koulutuspalvelimien ja tiedon intensiivisen käytön markkinoita, ja se on täsmälleen 6 kertaa edeltäjäänsä vahvempi. A100, joissakin työkuormissa. Laaja-alainen käyttöönotto on suunniteltu vuonna 2023, ja Dellin ja Lenovon kaltaisten kumppaneiden järjestelmien odotetaan debytoivan vuoden ensimmäisellä puoliskolla. Ratkaisu on juuri siirtynyt massatuotantoon, mikä on olennainen askel määräaikojen noudattamisessa.

Nvidia Grace Hopper Superchip yhdistää Gracen keskusyksikön ja H100 GPU:n yhdeksi SoC:ksi, mikä varmistaa nopean tiedonsiirron NVLink C2C:n kautta (Kuva: Nvidia)

Tämä debyytti tehdään nurkkaan kolmessa vaiheessa, ja ensimmäinen käännetään lokakuussa 2022, kun ensimmäisten Nvidia DGX H100:een perustuvien H100-käyttöisten mallien ennakkomyynti alkaa mm. Dell Power Edge. Toinen vaihe alkaa näiden järjestelmien käyttöönotolla vuoden 2023 alussa, kun taas viimeinen vaihe on laaja saatavuus.

Myös koko Hopperin GPU-esityksen aikana valtava toi paljon enemmän dataa Grace Hopper -supersirulle, joka yhdistää H100:n Gracen ARM-arkkitehtuuriin perustuvaan keskusyksikköön. Käytettyjen ytimien vahvistettiin olevan ARM:n uusi Neoverse V2, joka tarjoaisi "paremman suorituskyvyn ydintä kohti kaikille markkinoilla oleville ilmaisille datakeskusresoluutioille", sanoo yhtiön toimitusjohtaja Jensen Huang.

NVLink C2C:n ja suuren kaistanleveyden muistojen ansiosta Nvidia Grace Hopper -supersiru olisi osoittanut hyveitä valtavissa tekoälymalleissa verrattuna H100:een yhdistettynä tavallisiin keskusyksikköihin (Kuva: Nvidia)

Myös joitain erittäin suosittuja kohtia korostettiin, kuten NVLink C2C:n käyttö keskusyksikön ja GPU:n väliseen tietoliikenteeseen 900 Gt/s nopeudella sekä valtava muistin kaistanleveys, joka SoC:lla on yhdistelmä-LPDDR5XRAM:n ansiosta. yhdistetty Graceen) ja HBM3 (joka tulee H100:n sisällä), mikä lisäisi valtavasti tehokkuutta opetettaessa jättimäisiä tekoälymalleja verrattuna palvelimeen, joka yhdistää Hopperin GPU:n tavalliseen keskusyksikköön.

Nvidia L40 kuljettaa Lovelacen palvelimille

Toinen esityksen aikana ilmoitetuista merkittävistä uutisista oli Nvidia L40, yhtiön uusi Ada Lovelace -mikroarkkitehtuuriin perustuva GPU palvelimille, täsmälleen sama, jota käytetään RTX 4000 -korteissa ja RTX 6000 Ada Generation -ratkaisu asiantuntijoille.

Versio on rakenteeltaan samanlainen kuin edellisen sukupolven korteissa, parannetulla telinejäähdytyksellä, ja sen tiedot ovat hyvin lähellä RTX 6000 Adan tietoja, mikä on luultavasti muunnelma, joka on kehitetty erityisesti jatkuvaan pilvikäyttöön ja raskaaseen käsittelyyn, kuten monimutkaiseen fyysiseen käsittelyyn. simulaatioita. ., fotorealistiset ympäristöt ja digitaaliset kaksoset: virtuaaliset kopiot elementeistä tai jopa alueista perusteellisten testien suorittamista varten ilman fyysisiä prototyyppejä.

Nvidia L40 tuo Ada Lovelace -mikroarkkitehtuurin palvelimille, mikä takaa erinomaisen suorituskyvyn ja muistikapasiteetin raskaille tehtäville, kuten tekoälypäätelmä ja digitaaliset kaksoset (Kuva: Nvidia)

Ydinmäärää tai käytettyä sirua ei löydetty, mutta tiedetään, että ainesosa on varustettu 48 Gt GDDR6 VRAM:lla, joka on varustettu vikakorjauksella (ECC), sen kulutusraja on 300 W, lähettää 4 DisplayPort 1.4 -porttia signaalia varten ja on virtalähteenä. 5-nastaisella PCIe CEM16 -liittimellä. Tämän lisäksi työasemasisarusta lukuun ottamatta on olemassa kolminkertaiset NVENC- ja NVDEC-kehykset videon koodaukseen ja dekoodaukseen "3 kertaa paljon nopeammin kuin edellinen sukupolvi".

Tämän lisäksi palvelimille suunniteltu L40 sisältää tiettyjä oheisturva- ja vastustusominaisuuksia, jotka ovat valmiita tällaisiin ympäristöihin, kuten turvallinen käynnistys Root of Trust -menettelyn kautta, mikä edellyttää salausavaimia, sekä NEBS-tason 3 sertifikaatti, joka vahvistaa GPU:n suorituskyvyn jopa äärimmäisissä ympäristöissä pitkiä aikoja ilman hoitoa.

Nvidia L40 on vapaasti seisova erikseen tai varustettuna täysin uudessa Nvidia OVX:ssä, massiivisessa telineessä, jossa on jopa 2 CPU:ta ja 8 L40:tä, jotka on yhdistetty ConnectX-7-verkkoprosessorin kautta nopeaa viestintää varten.

Nvidia Thor -siru saapuu vuonna 2025 autonomisiin autoihin

Paljon ammattimaisempia mainoksia täydennettiin uusilla tiedoilla Nvidia DRIVE -siruista, joita sovelletaan autonomisiin autoihin. Yllätys on vuonna 2021 ilmoitetun Atlanin peruuttaminen käytettäväksi vuodelle 2025 suunnitelluissa autoissa ja joka nyt korvataan GTC:ssä paljastetulla Nvidia DRIVE Thorilla. Saman peruutetun prosessorin kohdalla uutisista paljastettiin vähän yksityiskohtia, mutta lista sisältää kunnianhimoisia lupauksia.

Atlanin korvaava Nvidia DRIVE Thor väittää tuplaavansa peruutetun sirun suorituskyvyn käyttämällä ARM Poseidon AE -ytimiä ja ainutlaatuista arkkitehtuuria, jota ei tunneta GPU:lla (Kuva: Nvidia)

Gracen seuraajalla ARM-keskusyksiköllä ja Ada Lovelace -mikroarkkitehtuuriin perustuvalla GPU:lla varusteltu Nvidia DRIVE Atlan lupasi toimittaa 1000 TOPS:ia (biljoonaa operaatiota sekunnissa) algoritmien avulla, joiden tiedot ovat INT8-muodossa. Nvidia DRIVE Thor menee paljon pidemmälle vannomalla 2000 renderöintiä, mutta käyttämällä erittäin tarkkaa FP8-tietomuotoa. Kuten portaali osoittaa AnandTechVaikka korvaavan SoC:n kapasiteetti ei ole suoraan vertailukelpoinen, se edustaa silti kaksinkertaista laskelmaa 8 bitin tarkkuudella.

Tätä varten julkaisussa käytetään ainutlaatuista keskusyksikköä, joka on varustettu ARM Poseidon AE (Automotive Enhanced tai parannettu ajoneuvoille) -ytimillä, joka seuraa Grace-sirussa käytettyä Neoverse V2:ta, lukuun ottamatta ainutlaatuista GPU:ta, jonka arkkitehtuuri ei ole vielä julkistettiin - yhtiö ei kerro, olisiko käytetty tekniikka Lovelacen seuraaja vai joku muu tuntematon.

Nvidia väittää, että uusi Thor-siru pystyy korvaamaan useita autonomisissa autoissa käytettyjä siruja, mikä summaa kaiken tietojenkäsittelyn yhdessä prosessorissa (Kuva: Nvidia)

Yksi jännittävä näkökohta, jonka yritys lupasi uudelle ainesosalle, on se, että sen sijaan, että Thor luottaisi useisiin rinnakkaisprosessoreihin eri tehtäviin, se keskittäisi kaikki itse ajavien autojen väitteet yhdeksi prosessoriksi. Tämän lisäksi uutisilla varustettu PC voi osioida prosessoinnin ja suorittaa useita käyttöjärjestelmiä (Linux, QNX ja Android) samanaikaisesti.

On myös epäselvää, miksi DRIVE Atlan peruutettiin, sen lisäksi, että asiakkaiden kysyntä Nvidian palvelulle paremman tekoälyn päättelykykyä varten voisi olla yksi syy. Muutoksesta huolimatta suurin osa aikataulusta pidettiin: Nvidia DRIVE Thor alkaa vuonna 2025, vaikka ei ole tiedossa, milloin palvelun asiakastestaus alkaa.

Lähde: Nvidia, WCCFTech, AnandTech

Tommy Banks
Kuulemme mielellämme mielipiteesi

Jätä vastaus

TechnoBreak | Tarjoukset ja arvostelut
Logo
Ota rekisteröinti käyttöön asetuksissa - yleinen
Ostoskärry