Nettsteder

Nvidia lanserer neste generasjons arkitektur

Real-time Ray Tracing for Architectural Visualization | Unreal Fest Online 2020

Real-time Ray Tracing for Architectural Visualization | Unreal Fest Online 2020
Anonim

Nvidia kan ha omdøpt sin NVISION-kampanje konferanse til "GPU Technology Conference", men det er fortsatt et Nvidia-show gjennom og gjennom. Konsernsjef Jen-Hsun Huang tok litt tid under sin hovedtale for å avdekke selskapets neste store GPU-arkitektur, kodenavnet "Fermi." Dette er chip-grafikkfansene som har ringt GT300, generasjonsfølgeren til GT200-brikken som driver kort som GeForce GTX 285.

Chippegiganten var veldig forsiktig med å plassere brikken som ikke en ny grafikkbrikke, men en ny " beregne og grafikk" chip, i den rekkefølgen (kursivgruve). Faktisk har nesten alt avslørt om den nye brikken relaterer seg til sine beregningsfunksjoner, i stedet for tradisjonelt grafisk orienterte ting som tekstur enheter og render-back endene. Det vi vet er at brikken er stor på en estimert 3,0 milliarder transistorer, og vil bli produsert på en 40nm prosess hos TSMC. Dette er om lag 40 prosent flere transistorer enn RV870-brikken i de nye Radeon 5800-serien DirectX 11-kortene som nettopp er utgitt av rivaliserende AMD. Brikken har 512 prosesseringsenheter (Nvidia kaller dem CUDA-kjerner) organisert i 16 "streaming multiprocessors" med 32 kjerner hver. Dette er mer enn doble 240 kjerner i GT200, og kjernene har betydelige forbedringer dessuten. Chipet vil benytte et 384-bits GDDR5-minnegrensesnitt.

Her er noen av de store punktpunkene:

Tredje generasjons Streaming Multiprocessor (SM)

  • 32 CUDA-kjerner per SM, 4x over GT200
  • 8x toppdobbelttrykkgraden i GT200
  • Dual Warp Scheduler som planlegger og sender to warps på 32 tråder
  • per klokke
  • 64 KB RAM med en konfigurerbar partisjonering av delt minne og L1-buffer

Andre Generering parallell trådutførelse ISA

  • Samlet adresseområde med full C ++-støtte
  • Optimalisert for OpenCL og DirectCompute
  • Full IEEE 754-2008 32-bits og 64-biters presisjon
  • Full 32-biters heltallbane med 64 -bit-utvidelser
  • Minnetilgangsinstruksjoner for å støtte overgang til 64-biters adressering
  • Forbedret ytelse gjennom prediksjon

Forbedret minneundersystem

  • NVIDIA Parallell DataCache-hierarki med konfigurerbare L1 og Unified L2
  • Caches
  • Første GPU med ECC-minnestøtte
  • Stor forbedret atomminneoperasjon ytelse

NVIDIA GigaThread Engine

  • 10x raskere applikasjonskonfigurasjon
  • Samtidig kjernekjøring
  • Utførelse av rekkefølge uten blokkering
  • Dual overlappede minneoverføringsmotorer

Det er mange tilleggsfunksjoner som bør forbedre ytelsen til denne brikken i stream databehandling oppgaver, som mye raskere dobbel-presisjon flytende punkt beregning rate. Nåværende Nvidia GPUer beregner dobbelt-presisjon ved brøkdel av hastigheten på enkel-presisjon operasjoner. Dobbelthøyde flytpunktsoperasjoner bør nå være på halvparten av enkeltprestasjon, noe som er en stor forbedring. Store forbedringer i caching og planlegging er også synlige. Du kan lese mer om arkitekturen på Nvidias nye Fermi-side, som inneholder en PDF-tekst.

Så når kan du kjøpe et grafikkort som bruker denne brikken? Nvidia sier ikke. Bedriftsrepresentanter har sagt at de for tiden "bringer opp brikken", noe som betyr at arbeidsprøver først har kommet tilbake fra fabrikkanlegget. Å lage et utdannet gjetning fra fortidens historie, ville vi si at desember er en optimistisk utgivelsesdato, og Q1 2010 for bred tilgjengelighet er mer sannsynlig. Forvent styrene å være dyre. Nvidia vil ikke avsløre chipstørrelsen, men dømmer etter transistor tellingen vi vil gjette mellom 450 og 500 mm 2 . I kombinasjon med de ekstra kostnadene til et 384-bits minnegrensesnitt og utfordringene med å få gode resultater ut av en så stor chip på den relativt nye 40nm produksjonsprosessen, og du ser på kort som sannsynligvis vil være både kraftigere og dyrere enn AMDs nettopp utgitte Radeon 5800-serien kort.

Følg Jason Cross på twitter eller besøk hans blogg.