Nvidia GeForce RTX 4090 ба 4080 нь 4 дахин илүү гүйцэтгэлтэй гарсан.

Жил гаруйн хугацаанд олон удаа санал хүсэлт гаргасны дараа Nvidia энэ мягмар гарагийн үдээс хойш (20) удаан хүлээгдэж буй GeForce RTX 4000 тоглоомын GPU-г зарлалаа. Одоогийн хамгийн шилдэг RTX 4 Ti-тэй харьцуулахад 3090 дахин өндөр, 3-р үеийн RT цөмүүд болон DLSS XNUMX-ын тусламжтайгаар турбо цэнэглэгдсэн масштабын оновчлолоор туяа хянах асар их ашиг тусыг өгөхийн зэрэгцээ яг одоо дууссан фреймүүдийг эхнээс нь гаргах чадвартай. эхлэл.

RTX 4000 шугам нь Ada Lovelace архитектурыг харуулж байна

Шинэ картуудын гол цөм нь RTX 3000 шугаман дээрх Ampere-ийн залгамжлагч болох Ada Lovelace бичил архитектур юм.Тоглогчийн картууд болон үндсэн GPU мэдээллийн хооронд яг ижил технологийг хуваалцдаг өмнөх үеийнхээс ялгаатай нь компани архитектурт зориулж сегментүүдийг хуваах. Серверүүдэд зориулсан Hopper, энгийн хэрэглэгчдэд зориулсан Lovelace. Мэдээллийн нэр нь дэлхийн анхны программист гэгддэг Ада Лавлейст хүндэтгэл үзүүлсэн явдал юм.

Nvidia-ийн тэргүүлэх чип болох AD102 нь өмнөх гэр бүлд хэрэглэж байсан Samsung-ийн 4нм литографыг орлуулсан TSMC-ийн захиалгат 4nm 8N хөгжүүлэлтийг ашиглан үйлдвэрлэсэн бөгөөд өмнөх гэр бүлийн 76 тэрбумаас 000 тэрбум транзистортой. 28 Ti нь 000 дахин их хэмжээний бүтээн байгуулалт хийсэн бөгөөд энэ нь практикт илүү өндөр эрчим хүчний хэмнэлттэй, илүү их гүйцэтгэлтэй байх ёстой.

TSMC-ийн 4нм 4N хөгжүүлэлтийг ашиглан үйлдвэрлэсэн AD102 GPU чип нь 18 гаруй CUDA цөм бүхий Nvidia Ada Lovelace-ийн хамгийн сүүлийн үеийн архитектурыг ашигладаг (Зураг: Nvidia)

AD102-ийн бүрэн тохиргоонд 18 CUDA цөм нь 432 Streaming Multiprocessors (SMs)-д хуваагдсан ба 144 SM-ийн 10 цөмтэй харьцуулахад үндсэн тоо 752% -иас бага зэрэг нэмэгдсэн байна. Цагийн тоо 84 МГц-ийн саадаас давсан тохиолдолд уг шийдэл нь 70 TFLOP тооцоолох хүчин чадлыг санал болгож чадна, энэ нь GA2500-ийн 90 TFLOP-ийн гүйцэтгэлээс хоёр дахин их юм.

Lovelace-ийн архитектурт оруулсан олон өөрчлөлтийн ачаар эдгээр аж ахуйн нэгжүүд тоо хэмжээнээс даваад зогсохгүй илүү чадвартай болсон. Эхний том мэдээ бол Ray Tracing (RT) боловсруулахад зориулагдсан Shader Execution Reordering буюу SER технологийг нэмж оруулсан явдал юм. DLSS болон бусад функцүүдийн хувьд маш сайн үр дүн, дэмжлэгийг үл харгалзан туяа хянах нь GPU-ийн шинж чанартай зөрчилддөг арга юм.

Shader Execution Reordering буюу SER технологи нь гүйцэтгэлийг 2 дахин сайжруулахын тулд "эмх цэгцгүй" өгөгдлийг, ялангуяа туяа хянах өгөгдлийг зохион байгуулдаг (Зураг: Nvidia)

График чипүүд нь өгөгдлийг зэрэгцүүлэн, эмх цэгцтэй байдлаар тооцоолох мэргэжилтнүүд боловч RT аппликейшнд ашигласан туяа нь тоглоомын үзэгдэлд байгаа олон тооны 3D элемент, материалын ачаар олон арван зохион байгуулалтгүй өгөгдлийг боловсруулдаг. SER нь CUDA цөм болон RT цөмүүд боловсруулалт хийхээс өмнө өгөгдлийг ангилах замаар энэхүү таагүй байдлыг арилгахын тулд ирдэг; Энэ функц нь Intel-ийн Arc тоглоомын картууд дээр ашигладаг урсгалын ангиллын нэгжүүдтэй адилхан ажилладаг.

Nvidia энэхүү нэмэлт нь гүйцэтгэлийг хоёр дахин нэмэгдүүлж, тоглоомын фрэймийн хурдыг 25%-иар ихэсгэдэг гэж мэдэгджээ. Эдгээр дэвшлийг RTX 3 Ti дээрх 191-р үеийн RT цөмүүдийн 78 RT-TFLOP-той харьцуулбал 2 хүртэлх RT-TFLOP RT гүйцэтгэлийг хангадаг 3090-р үеийн RT цөмүүдээр нэмэгдэн гүйцэтгэл нь 2,8 дахин нэмэгдсэн байна. Энэхүү хөгжлөөс гадна онцлог шинж чанарууд нь ил тод байдлын микромап хөдөлгүүр ба микромеш хөдөлгүүр гэсэн 2 шинэ бүтэцтэй.

Шинэ RT цөмүүд нь туяа мөрийг сайжруулах, бөөмс болон бусад тунгалаг элементүүдийн чанар, ерөнхий чанарыг сайжруулахын тулд урьд өмнө хэзээ ч байгаагүй хүрээг ашигладаг (Зураг: Nvidia)

Эхнийх нь илүү найдвартай үр дүнд хүрэхийн тулд оч, утаа болон бусад тунгалаг элементүүд зэрэг бөөмс дээр туяа мөрдөх боловсруулалтыг сайжруулах чадвартай байдаг бол бусад нь гэрэлтүүлгийн үр дүнд сөрөг нөлөө үзүүлэхгүйгээр гэрэлтүүлгийн үр дүнг сайжруулахын тулд 3D элементүүдэд геометр нэмэх чадвартай байдаг. тоглоом. гүйцэтгэл, учир нь зөвхөн жижиг хэсгүүдэд хүндрэл нэмэгдэх болно.

Хиймэл мэргэн ухааныг боловсруулах мэргэжилтнүүд DLSS, Tensor Cores зэрэг функцуудыг идэвхжүүлж, 4-р үеийнхэнд хүрч, Hopper бичил архитектурт суурилсан ногоон багийн дата төвүүдийн GPU болох H100-д ​​үзүүлсэн яг ижил инновацийг нэвтрүүлсэн. Хамгийн том мэдээ нь FP8 өгөгдлийн форматын өндөр нарийвчлалтай тооцоолол хийх чадвар бөгөөд энэ нь хиймэл оюун ухааны чадавхийг 5 дахин нэмэгдүүлэх болно.

Шинэ тензор цөм болон шинэ оптик шингэний хурдасгуурын тусламжтайгаар DLSS 3 нь хөдөлж буй элементүүдээс олдворуудыг арилгах, тэр ч байтугай дангаар нь бэлэн фрейм үүсгэх замаар CPU-ийн хязгаарлалтыг даван туулах чадвартай (Зураг: Nvidia)

Шинэ DLSS 3-д чухал ач холбогдолтой өөр нэг томоохон шинэлэг зүйл бол тоглоомын хүрээ хоорондын пикселийн хөдөлгөөний ялгааг харгалзан хөдөлгөөнт олдворуудыг арилгахаас гадна GPU дээр шууд цоо шинэ фрейм үүсгэх боломжийг олгодог Оптик шингэний хурдасгуур бүтээц юм. , PC-ийн төв боловсруулах нэгжийн хязгаарлалтыг давах.

Эцсийн эцэст, Ada Lovelace архитектур нь видео бичлэг хийх, тоглуулах хос NVENC кодлогч болон декодчилогчдыг агуулдаг бөгөөд энэ нь бичлэг тоглуулах хурдыг хоёр дахин хурдан болгож, одоо GeForce картуудын доторх барих хэрэгсэл болох GeForce ShadowPlay-д 8 FPS-ээр 60К нягтралыг хүлээн авах боломжийг олгодог. Цаашид шинэ NVENC нь одоо өргөн хэрэглэгддэг H.1-аас хамаагүй илүү үр ашигтай AV265 кодлогчийг дэмждэг болсон.

RTX 4090 ба RTX 4080 нь анхны хувилбарууд юм

Зарлагдсан шинэ архитектурын тусламжтайгаар Nvidia тоглоомын видео картуудын гэр бүл болох GeForce RTX 4000-ийг танилцууллаа. ​​Энэ цувралыг GeForce RTX 4090 удирддаг бөгөөд бага зэрэг жижгэрүүлсэн тохиргоотой AD102 GPU, дотор нь 16,384 CUDA цөмтэй. хуваагдсан. 128 SM-д, 128 RT цөм, 512 тензор цөм дагалддаг. TSMC-ийн шинэ литографийн ачаар давтамжууд эрс нэмэгдэж, 2230 МГц-ийн үндсэн цаг, 2520 МГц-ийн нэмэгдэл цаг болсон.

16 гаруй CUDA цөмтэй Nvidia GeForce RTX 000 нь RTX 4090 Ti-ээс 4 дахин хурдан гэж мэдэгддэг (Зураг: Nvidia)

Энэ хослолын хувьд RTX 4090 нь 83 TFLOP тооцоолох хүчин чадалтай бөгөөд RTX 40 Ti-ийн 3090 TFLOP-ээс хоёр дахин их юм. 24 ГБ GDDR6X VRAM нь өгөгдлийн үүргийг дүүргэж, 21 ГБ/с зурвасын өргөнтэй 384 битийн фрэймворк дээр 1008 Gbps хурдтай ажилладаг. Энэ нь Microsoft Flight Simulator, Warhammer 40,000: Darktide зэрэг тоглоомуудын гүйцэтгэлийг хоёр дахин нэмэгдүүлсэн тоглоомуудад шугаман ашиг олох болно гэдгийг баталгаажуулдаг.

Lovelace архитектурын нэвтрүүлсэн шинэ бүтээцүүдийн ачаар туяаг хянах системтэй тоглоомуудад илүү их үсрэлтүүд харагдах болно. Тус компани Cyberpunk 2077-ийн өгөгдлийг харуулсан бөгөөд энэ нь RT Overdrive хэмээх цоо шинэ RT горимыг хүлээн авах гэж байгаа бөгөөд анхны GPU нь өмнөх хувилбараасаа 4 дахин илүү гүйцэтгэлтэй байх болно. Гүйцэтгэлийн зөрүүг гэрэлтүүлгийн технологийг илүү өндөр эрчимтэй ашигладаг шинэ Portal RTX болон Racer RTX зэрэг "дараагийн үеийн тоглоомууд"-аас харах ёстой.

Яг доор RTX 4080 байгаа бөгөөд энэ удаад 2 хэвлэлд хуваагдсан. Илүү хүчтэй нь RTX 4080 нь 16 ГБ VRAM-тай, AD103 чипээр тоноглогдсон бөгөөд 9.728 SM-д байрлуулсан 76 CUDA цөм, 76 RT цөм, 304 тензор цөмтэй. Үндсэн цагийг 2210 МГц, өсгөх цагийг 2510 МГц-т тохируулсан бөгөөд тооцоолох хүчин чадал нь 48 TFLOP-д хүрдэг. Багцыг 16 ГБ GDDR6X VRAM багтаасан бөгөөд энэ нь 23 битийн фрэймворк дээр 256 Гбит/с хурдтай, 736 ГБ/с зурвасын өргөнийг хүргэж байна.

Тус компани уг загвар нь RTX 3080 Ti-ээс хоёр дахин хурдан бөгөөд 3К RAW файл гэх мэт илүү төвөгтэй 12D нөхцөл байдал эсвэл маш өндөр нягтралтай видео хувилбартай ажиллах шаардлагатай мэргэжилтнүүдэд зориулсан төгс сонголт гэдгийг баталж байна. Өөр нэг хувилбар болох 4080GB RTX 12 нь 104 RT цөм, 7680 тензор цөмтэй, 60 SM-д хуваагдсан 60 CUDA цөмтэй, AD240 гэх илүү хялбар чиптэй ховор ирдэг.

Nvidia GeForce RTX 4080 нь 12 ГБ ба 16 ГБ хэмжээтэй хувилбарууд бөгөөд RTX 4 Ti-ээс 3080 дахин илүү гүйцэтгэлтэй (Зураг: Nvidia)

Цөөн бүтээцтэй үед давтамж нь хамаагүй өндөр байдаг тул шийдэл нь 2.310 МГц-ийн үндсэн цаг, 2.610 МГц-ийн өсөлттэй бөгөөд 40 TFLOP-ийн тооцоолох хүчин чадалтай. RTX 3090 Ti-тэй төстэй тоо хэдий ч Nvidia нь Lovelace микро архитектурын дэвшлийг гол давуу тал болгон Ampere гэр бүлийн тэргүүлэгч загвараас хамаагүй хурдан гаргах болно гэж Nvidia баталж байна.

Шинэ GeForce RTX 4000 нь ASUS, Colorful, Gainward, GALAX, GIGABYTE, INNO3D, MSI, Palit, PNY, ZOTAC зэрэг үйлдвэрлэгчдийн захиалгат загвараар худалдаалагдах бөгөөд 4090 ГБ RTX 4080 болон RTX 16 загваруудыг мөн авах болно. Үүсгэн байгуулагчийн хэвлэл. . загварыг авчрах нь өмнөх үетэй харьцуулахад бага зэрэг өөрчлөгдсөн. Бал чулуун хүрээг хүрэлээр солихоос гадна эдгээр өөрчлөлтүүд нь 10%-иар илүү хөргөлтийн сэрвээ, 23 фазын хүч, ATX 5.0 тэжээлийн хангамжид үйлчлэх шинэ PCIe 12 тэжээлийн холбогч (3.0VHPWR) зэргийг авчирдаг.

Үнэ ба бэлэн байдал

Nvidia GeForce RTX 4000 гэр бүл 12-р сарын 4090-нд худалдаанд гарах бөгөөд RTX 1599 нь 8240 ам.доллар (~R$4080), дараа нь арваннэгдүгээр сард RTX 1599, MSRP нь 899 ам.доллар. 4.640 доллар (~12 доллар) зарна. ) 1.199GB загварт, 6.180GB хувилбарт 16 доллар (~R$XNUMX).

Порталаас авсан мэдээллээр adrenalina, RTX 4090 нь Испанид 14.999 еврогийн үнээр ирэх ёстой бол 4080 GB RTX 16 нь 10.999 еврогоор зарагдах ёстой. 4080 GB RTX 12-г санал болгож буй үнээр 8.199 R$-оор зарах ёстой. Гэсэн хэдий ч өнөөдрийг хүртэл Испанид бэлэн байгаа талаар мэдээлэл алга байна.

Nvidia GeForce RTX 4090: техникийн хуудас

  • GPU: AD102
  • Урсгалын олон процессор (SM): 128
  • CUDA өнгө (үндсэн): 16,384
  • Өнгөт тензор (хиймэл оюун ухаан): 512
  • RT (Ray Traced) Өнгө: 128
  • Давтамж: 2230 МГц (Үндсэн), 2520 МГц (Өсгөх)
  • Тэнцвэржүүлэх хүчин чадал (FP32): 83 TFLOP хүртэл
  • VRAM санах ой: 24 ГБ GDDR6X
  • Санах ойн ажлын платформ: 384 бит
  • Санах ойн уян хатан байдал: 21 Gbps
  • Дамжуулах зурвасын өргөн: 1008 ГБ/с
  • Хэрэглээ: 450 Вт
  • Цахилгаан холбогч: 1 x 5.0 зүү PCIe 12 (12VHPWR) холбогч эсвэл 3 х 8 зүү холбогч (хайрцаг доторх адаптер)
  • Санал болгож буй эрчим хүчний эх үүсвэр: 850 Вт

Nvidia GeForce RTX 4080 16 ГБ: мэдээллийн хуудас

  • GPU: AD103
  • Урсгалын олон процессор (SM): 76
  • CUDA өнгө (үндсэн): 9728
  • Өнгөт тензор (хиймэл оюун ухаан): 304
  • RT (Ray Traced) Өнгө: 76
  • Давтамж: 2210 МГц (Үндсэн), 2510 МГц (Өсгөх)
  • Тэнцвэржүүлэх хүчин чадал (FP32): 48 TFLOP хүртэл
  • VRAM санах ой: 16 ГБ GDDR6X
  • Санах ойн ажлын платформ: 256 бит
  • Санах ойн уян хатан байдал: 23 Gbps
  • Дамжуулах зурвасын өргөн: 736 ГБ/с
  • Хэрэглээ: 320 Вт
  • Цахилгаан холбогч: 1 x 5.0 зүү PCIe 12 (12VHPWR) холбогч эсвэл 3 х 8 зүү холбогч (хайрцаг доторх адаптер)
  • Санал болгож буй эрчим хүчний эх үүсвэр: 750 Вт

Nvidia GeForce RTX 4080 12 ГБ: мэдээллийн хуудас

  • GPU: AD104
  • Урсгалын олон процессор (SM): 60
  • CUDA өнгө (үндсэн): 7680
  • Өнгөний тенсор (AI): 240
  • RT (Ray Traced) Өнгө: 60
  • Давтамж: 2310 МГц (Үндсэн), 2610 МГц (Өсгөх)
  • Тэнцвэржүүлэх хүчин чадал (FP32): 40 TFLOP хүртэл
  • VRAM санах ой: 12 ГБ GDDR6X
  • Санах ойн ажлын платформ: 192 бит
  • Санах ойн уян хатан байдал: 21 Gbps
  • Дамжуулах хурд: 504 ГБ/с
  • Хэрэглээ: 285 Вт
  • Цахилгаан холбогч: 1 x 5.0 зүү PCIe 12 (12VHPWR) холбогч эсвэл 2 х 8 зүү холбогч (хайрцаг доторх адаптер)
  • Санал болгож буй эрчим хүчний эх үүсвэр: 700 Вт

Эх сурвалж: Nvidia, Adrenaline

Томми Бэнкс
Бид таны бодлыг сонсохдоо баяртай байх болно

хариу үлдээгээрэй

TechnoBreak | Санал болон шүүмж
Logo
Бүртгэлийг тохиргоон дотроос идэвхжүүлнэ үү - ерөнхий
Дэлгүүрийн түрдэг тэрэг