Nvidia GeForce RTX 4090 ja 4080 julkaistiin jopa 4x paremmalla suorituskyvyllä

Paljon yli vuoden monien kommenttien jälkeen Nvidia julkisti tänä tiistai-iltapäivänä (20) kauan odotetun peligrafiikkapiirien GeForce RTX 4000 -perheen. Ennennäkemättömään Ada Lovelace -mikroarkkitehtuuriin perustuva linja lupaa tarjota jälleen valtavan harppauksen lähestyvässä suorituskyvyssä. . 4x verrattuna nykyiseen huippuluokan RTX 3090 Ti:hen, samalla kun se tarjoaa massiivisia lisäyksiä säteenseurannassa 3. sukupolven RT-ytimillä ja turboahdetulla skaalausoptimoinnilla DLSS XNUMX:lla, juuri nyt valmiiden kehysten renderöinnillä alusta alkaen.

RTX 4000 -mallisto esittelee Ada Lovelace -arkkitehtuuria

Uusien korttien ytimessä on Ada Lovelace -mikroarkkitehtuuri, Amperen seuraaja RTX 3000 -mallistossa. Toisin kuin edellisessä sukupolvessa, joka jakoi täsmälleen saman tekniikan pelaajakorttien ja GPU-tietojen välillä, yritys päätti jakaa segmentit arkkitehtuuria varten. Hopper palvelimille ja Lovelace tavallisille käyttäjille. Uutisten nimi on kunnianosoitus Ada Lovelacelle, jota pidetään ensimmäisenä ohjelmoijana maailmassa.

Nvidian lippulaivasiru linjalle, AD102, on valmistettu käyttämällä TSMC:n mukautettua 4nm 4N-kehitystä, joka korvaa Samsungin edellisessä perheessä käytetyn 8nm litografian, ja siinä on 76 miljardia transistoria verrattuna 000 miljardiin edellisestä perheestä. 28 Ti, massiivinen kehitys 000 kertaa, mikä käytännössä tarkoittaa parempaa energiatehokkuutta ja huomattavasti enemmän suorituskykyä.

TSMC:n 4nm 4N-kehitykseen rakennettu AD102 GPU-siru käyttää Nvidian uusinta Ada Lovelace -arkkitehtuuria, jossa on yli 18 000 CUDA-ydintä (Kuva: Nvidia)

AD102:n täydessä kokoonpanossa on 18 432 CUDA-ydintä jaettuna 144 Streaming Multiprosessoriin (SM) verrattuna 10 752 ytimeen 84 SM:ssä, mikä lisää ytimien lukumäärää hieman yli 70 %. Kun kellot rikkovat 2500 MHz:n esteen, ratkaisu voi ehdottaa 90 TFLOP:n laskentakapasiteettia, mikä on yli kaksinkertainen suorituskyky GA40:n 102 TFLOP:iin verrattuna.

Nämä entiteetit eivät ole vain vähäisempiä, vaan myös huomattavasti tehokkaampia Lovelace-arkkitehtuurin tuomien monien muutosten ansiosta. Ensimmäinen suuri uutinen on Shader Execution Reorderingin eli SER-teknologian sisällyttäminen, joka on kehitetty erityisesti Ray Tracing (RT) -käsittelyyn. Huolimatta loistavista tuloksista ja DLSS:n ja muiden ominaisuuksien tuesta, säteenseuranta on tekniikka, joka on ristiriidassa GPU:iden luonteen kanssa.

Shader Execution Reordering (SER) -tekniikka järjestää "hajautetun" tiedon, erityisesti säteenseurantadatan, suorituskyvyn skaalaamiseksi jopa 2-kertaiseksi (Kuva: Nvidia)

Grafiikkasirut ovat asiantuntijoita laskemaan dataa rinnakkain, organisoidusti, mutta RT-sovelluksessa käytetyt säteet kehittävät kymmeniä ja kymmeniä hajaantuneita tietoja pelimaailmassa olevien 3D-elementtien ja -materiaalien ansiosta. SER saapuu vähentämään tätä vaivaa luokittelemalla tiedot ennen kuin CUDA-ytimet ja RT-ytimet suorittavat käsittelyn; ominaisuus toimii samalla tavalla kuin Intelin Arc-pelikorteissa käyttämät säikeen luokitusyksiköt.

Nvidia väittää, että tämä lisäys antaa kaksinkertaisen suorituskyvyn, 25% korkeammalla kuvanopeudella peleissä. Näitä edistysaskeleita täydentävät 3. sukupolven RT-ytimet, jotka tarjoavat jopa 191 RT-TFLOP RT-suorituskykyä verrattuna RTX 78 Ti:n 2. sukupolven RT-ytimien 3090 RT-TFLOP:iin, mikä on 2,8-kertainen suorituskyvyn kasvu. Tämän kehityksen lisäksi ominaisuuksilla on kaksi uutta rakennetta: läpinäkyvyys mikrokarttamoottorit ja mikrogrid-moottorit.

Uudet RT Cores -ytimet käyttävät ennennäkemättömiä kehyksiä säteenseurantaan, mikä takaa hiukkasten ja muiden läpikuultavien elementtien paremman laadun sekä paremman laadun kokonaisuudessaan (Kuva: Nvidia)

Ensin mainitut ovat taitavia parantamaan hiukkasten, kuten kipinöiden, savun ja muiden läpikuultavien elementtien säteenjäljitystä, saadakseen paljon realistisemman tuloksen, kun taas jälkimmäiset pystyvät lisäämään geometriaa 3D-elementteihin renderöintituloksen edistämiseksi. valaistus vaikuttamatta negatiivisiin vaikutuksiin pelissä. suorituskykyä, koska vain pienten alueiden vaikeus lisääntyisi.

Artificial Wisdom -käsittelyn asiantuntijat, jotka mahdollistavat toiminnot, kuten DLSS, Tensor Cores, saavuttavat 4. sukupolven ottamalla käyttöön täsmälleen samat uutuudet kuin H100:ssa, vihreän tiimin datakeskusten GPU:ssa Hopperin mikroarkkitehtuuriin perustuvassa. Suuri uutinen on kyky suorittaa erittäin tarkkoja FP8-tietomuotolaskelmia, mikä toisi viisinkertaisen lisäyksen tekoälyn kykyyn.

Uusien tensoriytimien ja uusien optisten nestekiihdyttimien avulla DLSS 3 onnistuu poistamaan artefakteja liikkuvista elementeistä ja jopa kiertämään keskusyksikön rajoituksia tuottamalla valmiita kehyksiä yksinään (Kuva: Nvidia)

Toinen olennainen uutuus, joka tulee olemaan perustavanlaatuinen uudelle DLSS 3:lle, ovat Optical Fluid Accelerator -rakenteet, jotka arvioivat eroja pikselien liikkeissä pelikehysten välillä, jotta ne eivät ainoastaan ​​poista liikeartefakteja, vaan hyväksyvät myös täysin uuden kehyksen luomisen suoraan GPU. , ohittaen PC:n keskusyksikön rajoitukset.

Lopulta Ada Lovelace -arkkitehtuurissa on kaksi NVENC-enkooderia ja -dekooderia videon tallennusta ja toistoa varten, mikä varmistaa pari kertaa nopeamman tallennuksen toiston ketteryyden ja sallii nyt GeForce ShadowPlayn, GeForce-korttien sieppaustyökalun, hyväksyä 8K-resoluution 60 FPS:llä. Tulevaisuuteen katsoen uudemmat NVENC:t tukevat nyt AV1-koodekkia, mikä on huomattavasti tehokkaampi kuin nykyään yleisesti käytetty H.265.

RTX 4090 ja RTX 4080 ovat ensimmäiset julkaisut

Uuden arkkitehtuurin julkistamisen myötä Nvidia esitteli pelinäytönohjainperheen, GeForce RTX 4000:n. Mallistoa johtaa GeForce RTX 4090, joka toimii AD102 GPU:lla hieman pienennetyssä kokoonpanossa ja jonka sisällä on 16,384 128 CUDA-ydintä. jaettu. 128 SM:ssä, mukana 512 RT-ydintä ja 2230 tensoriydintä. TSMC:n uuden litografian ansiosta taajuudet ovat kasvaneet dramaattisesti saavuttaen 2520 MHz:n peruskellon ja XNUMX MHz:n tehosteen.

Reilusti yli 16 000 CUDA-ytimen kanssa Nvidia GeForce RTX 4090 väittää olevansa jopa 4 kertaa nopeampi kuin RTX 3090 Ti (Kuva: Nvidia)

Tässä yhdistelmässä RTX 4090:n laskentakapasiteetti on 83 TFLOP:a, mikä on hieman yli kaksinkertainen verrattuna RTX 40 Ti:n 3090 TFLOP:iin. 24 Gt GDDR6X VRAM täydentää dataroolin, joka toimii 21 Gbps nopeudella 384-bittisellä työalustalla 1008 Gt/s kaistanleveydellä. Valtava varmistaa, että näemme lineaarisia voittoja pelaamisessa, kun pelit, kuten Microsoft Flight Simulator ja Warhammer 40,000 XNUMX: Darktide, kaksinkertaistavat suorituskyvyn.

Paljon massiivisempia hyppyjä ei ole vielä nähtävissä peleissä, joissa on Ray Tracing, kiitos Lovelace-arkkitehtuurin tuomat uudet rakenteet. Yhtiö näytti tietoja Cyberpunk 2077:stä, joka saa radikaalisti uuden RT-tilan, RT Overdriven, jossa debyytti-GPU toimittaisi 4 kertaa paljon enemmän suorituskykyä kuin edeltäjänsä. Suorituskyvyn eron pitäisi näkyä myös "seuraavan sukupolven peleissä", kuten uudessa Portal RTX:ssä ja Racer RTX:ssä, jotka vievät valaistustekniikan käytön paljon näkyvämmälle intensiteetille.

Juuri alla on RTX 4080, tällä kertaa jaettu kahteen versioon. Paljon vahvempi on RTX 2, jossa on 4080 Gt VRAM-muistia ja jossa on AD16-siru, jossa on 103 9.728 CUDA-ydintä, jotka on järjestetty 76 SM:ään, 76 RT-ytimellä ja 304 Tensor-ytimellä. Peruskello on asetettu 2210 MHz:iin ja tehostus 2510 MHz:iin, ja laskentakapasiteetti saavuttaa 48 TFLOP:a. Paketti täydentää 16 Gt GDDR6X VRAM-muistia, joka toimii nopeudella 23 Gbps 256-bittisellä työalustalla ja tarjoaa 736 Gt/s kaistanleveyden.

Yhtiö takaa, että malli olisi kaksi kertaa nopeampi kuin RTX 3080 Ti, ja täydellinen vaihtoehto asiantuntijoille, jotka tarvitsevat paljon monimutkaisempia 3D-tilanteita tai videoeditointia erittäin korkealla resoluutiolla ilman pakkausta, kuten 12K RAW-tiedostoja. Toinen muunnelma, 4080 Gt:n RTX 12, tulee harvoin paljon helpommalla sirulla, AD104:llä, jossa on vaatimattomat 7680 CUDA-ytimet jaettuna 60 SM:ään, 60 RT-ytimellä ja 240 tensoriytimellä.

Nvidia GeForce RTX 4080 on saatavana 12 Gt:n ja 16 Gt:n versioina, ja sen suorituskyky on jopa 4 kertaa parempi kuin RTX 3080 Ti (Kuva: Nvidia)

Vähemmän koontikertoja käytettäessä taajuudet ovat paljon korkeammat, joten ratkaisun peruskellotaajuus on 2.310 2.610 MHz ja tehostus 40 3090 MHz, mikä saavuttaa XNUMX TFLOP:n laskentakapasiteetin. Huolimatta RTX XNUMX Ti:hen liittyvästä määrästä, Nvidia varmistaa, että julkaisu olisi paljon nopeampi kuin Ampere-perheen lippulaiva, jonka tärkein etu on Lovelace-mikroarkkitehtuurin edistysaskel.

Uusi GeForce RTX 4000 on saatavilla räätälöityinä malleina valmistajilta, kuten ASUS, Colorful, Gainward, GALAX, GIGABYTE, INNO3D, MSI, Palit, PNY ja ZOTAC, ja 4090 Gt:n RTX 4080 ja RTX 16 saavat myös mallit Founder's Edition. . tuo suunnittelun hienovaraisesti muuttuneen edelliseen sukupolveen verrattuna. Sen lisäksi, että grafiittivanteet korvataan pronssilla, variaatiot tuovat 10 % enemmän jäähdytysripoja, 23-vaiheista tehoa ja uuden PCIe 5.0 -virtaliittimen (12VHPWR), joka palvelee ATX 3.0 -virtalähteitä.

Hinta ja saatavuus

Nvidia GeForce RTX 4000 -tuoteperhe lanseerataan 12. lokakuuta, ja RTX 4090 tulee kauppoihin 1599 8240 USD:n (~ 4080 1599 R$) suositushinnalla, jota seuraa marraskuussa RTX 899, jonka suositushinnat ovat 4.640 12 USD. 1.199 USD (~ 6.180 16 R$) XNUMX Gt:n mallille ja XNUMX XNUMX $ (~ XNUMX XNUMX R$) XNUMX Gt:n variaatiolle.

Portaalin saamien tietojen mukaan adrenaliini, RTX 4090:n pitäisi saapua Espanjaan 14.999 4080 euron arvolla, kun taas 16 Gt:n RTX 10.999 pitäisi myydä 4080 12 eurolla. 8.199 Gt:n RTX XNUMX sen sijaan pitäisi myydä suositushintaan XNUMX XNUMX R$. Tästä huolimatta Espanjasta ei ole vielä saatavilla tietoja.

Nvidia GeForce RTX 4090: tekninen tiedote

  • GPU: AD102
  • Suoratoistomoniprosessorit (SM): 128
  • CUDA-värit (ydin): 16,384 XNUMX
  • Väritensori (keinoäly): 512
  • RT (Ray Traced) Värit: 128
  • Taajuudet: 2230MHz (Base), 2520MHz (Boost)
  • Tasapainotuskapasiteetti (FP32): jopa 83 TFLOPia
  • VRAM-muisti: 24GB GDDR6X
  • Muistin työalusta: 384 bittiä
  • Muistin ketteryys: 21 Gbps
  • Kaistanleveys: 1008 Gt/s
  • Virrankulutus: 450 W
  • Virtaliitin: 1 x PCIe 5.0 (12VHPWR) 12-nastainen liitin tai 3 x 8-nastainen liitin (sovitin pakkauksessa)
  • Suositeltu virtalähde: 850W

Nvidia GeForce RTX 4080 16 Gt: tietolehti

  • GPU: AD103
  • Suoratoistomoniprosessorit (SM): 76
  • CUDA-värit (ydin): 9728 XNUMX
  • Väritensori (keinoäly): 304
  • RT (Ray Traced) Värit: 76
  • Taajuudet: 2210MHz (Base), 2510MHz (Boost)
  • Tasapainotuskapasiteetti (FP32): jopa 48 TFLOPia
  • VRAM-muisti: 16GB GDDR6X
  • Muistin työalusta: 256 bittiä
  • Muistin ketteryys: 23 Gbps
  • Kaistanleveys: 736 Gt/s
  • Virrankulutus: 320 W
  • Virtaliitin: 1 x PCIe 5.0 (12VHPWR) 12-nastainen liitin tai 3 x 8-nastainen liitin (sovitin pakkauksessa)
  • Suositeltu virtalähde: 750W

Nvidia GeForce RTX 4080 12 Gt: tietolehti

  • GPU: AD104
  • Suoratoistomoniprosessorit (SM): 60
  • CUDA-värit (ydin): 7680 XNUMX
  • Väritensori (AI): 240
  • RT (Ray Traced) Värit: 60
  • Taajuudet: 2310MHz (Base), 2610MHz (Boost)
  • Tasapainotuskapasiteetti (FP32): jopa 40 TFLOPia
  • VRAM-muisti: 12GB GDDR6X
  • Muistin työalusta: 192 bittiä
  • Muistin ketteryys: 21 Gbps
  • Kaistanleveys: 504GB/s
  • Kulutus: 285W
  • Virtaliitin: 1 x PCIe 5.0 (12VHPWR) 12-nastainen liitin tai 2 x 8-nastainen liitin (sovitin pakkauksessa)
  • Suositeltu virtalähde: 700W

Lähde: Nvidia, Adrenaline

Tommy Banks
Kuulemme mielellämme mielipiteesi

Jätä vastaus

TechnoBreak | Tarjoukset ja arvostelut
Logo
Ota rekisteröinti käyttöön asetuksissa - yleinen
Ostoskärry