GeForce RTX 4090 Karakuri con prestazioni fino a 4 volte superiori anche con il 70% di transistor in più
Posted by qiaowanyi
from the Agriculture category at
23 Sep 2022 07:33:29 am.
Annunciata la serie GPU "GeForce RTX 40" basata sull'architettura di nuova generazione "Ada Lovelace" (di seguito Ada). Si dice che il top "GeForce RTX 4090" sia almeno due volte più veloce del modello top "GeForce RTX 3090 Ti" dell'architettura Ampere convenzionale e fino a quattro volte più veloce, e questo salto di prestazioni è stato ottenuto in una generazione. le persone dovrebbero essere sorprese.
In effetti, il processo di produzione di Ada si è evoluto dal processo convenzionale a 8 nm di Samsung al processo a 4 nm (custom 4N) di TSMC e il numero di transistor che possono essere integrati è aumentato. Inoltre, c'è un'accelerazione che accompagna il miglioramento dell'orologio di funzionamento. Tuttavia, Ada ha ottenuto miglioramenti delle prestazioni che non sono vincolati dall'evoluzione dei processi dei semiconduttori incorporando nuova ingegnosità . Se la confronti con una CPU, è un'immagine che implementa nuove istruzioni per velocizzare l'elaborazione specifica.
La recente tendenza della grafica è senza dubbio il ray-tracing in tempo reale. Dall'introduzione del ray-tracing in tempo reale da parte della serie GeForce RTX 20 nel 2018, i giochi supportati sono aumentati.
Il problema è che l'elaborazione del ray tracing per pixel è esplosa negli ultimi giochi. In "Battlefield V" pubblicato nel 2018, l'elaborazione del ray tracing è stata eseguita 39 volte per pixel, ma nell'ultimo "Cyberpunk 2077", il numero di elaborazioni è 635 volte, che in realtà è 16 volte di più. .
D'altra parte, il numero di transistor è "solo" quadruplicato negli ultimi quattro anni (la generazione Turing della GeForce RTX 2080 è di 18,6 miliardi, la 4090 è di 76 miliardi). La grafica può essere elaborata in parallelo, quindi se aumenti il ​​numero di transistor, le prestazioni miglioreranno in modo quasi lineare.
Il numero di processi di ray tracing necessari per l'output di un pixel è aumentato di 16 volte in quattro anni. D'altra parte, il numero di transistor è solo quadruplicato.
Pertanto, Ada ha deciso di incorporare un meccanismo per eseguire in modo efficiente il ray-tracing in tempo reale. A proposito, sebbene entrambi siano conformi all'API di ray-tracing in tempo reale "DXR" di DirectX 12, sono trattati come "estesi" e devono essere gestiti dagli sviluppatori di giochi. Ciò non significa che i giochi esistenti beneficeranno immediatamente di velocità più elevate. Tuttavia, è possibile aggiornare e corrispondere con la distribuzione.
 Shader Execution Reordering (SER) è un'estensione che riorganizza i processi di shading che non possono essere parallelizzati a causa del ray tracing al volo in modo che gli shader possano essere eseguiti in parallelo in modo efficiente. Questa funzione sarà aperta agli sviluppatori di giochi, che possono abilitare SER secondo necessità .
Shader Execution Reordering semplifica la parallelizzazione dell'elaborazione SM
Secondo NVIDIA, in "Cyberpunk 2077" verrà aggiunta una modalità di ray tracing chiamata "Modalità Overdrive" e l'utilizzo di SER migliorerà le prestazioni del 44%. Inoltre, si dice che le prestazioni di "Portal with RTX", che dovrebbe essere rilasciata come versione remake compatibile con RTX, possano essere migliorate del 29% e le prestazioni del gioco "Racer RTX", che è interamente costruito mediante simulazione, può essere migliorato del 20%.
Nello specifico, la Micro-Mesh può essere suddivisa in "Displaced Micro-Mesh" e "Opacity Micro-Map". Entrambi sono efficaci quando si esprimono oggetti molto dettagliati come esseri viventi e piante. Ciascuno è un SDK separato e puoi utilizzarne uno o entrambi contemporaneamente.
 Displaced Micro-Mesh è una funzione efficace per la geometria ad alta definizione. Quando si tentava di eseguire il ray-tracing su una geometria ad alta definizione con Ampere, il BVH (Bounding Volume Hierarchy) si è complicato, il che è stato un fattore di consumo di memoria. Micro-Mesh ha solo dati triangolari semplici in BVH e, applicando i dati della mappa di spostamento a un triangolo nel nucleo RT, realizza in seguito una geometria complessa.
0 Comments