Read Time:3 Minute

Στο NVIDIA GeForce Special Event που πραγματοποιήθηκε πριν από λίγες ώρες, μας παρουσιάστηκαν οι νέες GPU της NVIDIA, οι οποίες είναι κατασκευασμένες με την αρχιτεκτονική Ampere. Οι νέες αυτές κάρτες δεν μπορούν παρά να θεωρηθούν μεγαθήρια, μιας και οι βελτιώσεις που προσφέρουν σε σχέση με τις προγενέστερες Turing είναι πραγματικά εκπληκτικές.

Μάλιστα, σύμφωνα με τον CEO της NVIDIA, Jensen Huang, η Ampere αποτελεί την μεγαλύτερη βελτίωση από γενιά σε γενιά καρτών, στην ιστορία της NVIDIA. Και δεν είναι καθόλου δύσκολο να το πιστέψουμε αυτό, μιας και οι Ampere κάρτες είναι ένα “θαύμα” της μηχανικής!

Ψύξη

Υπήρχαν εδώ και αρκετό καιρό leaks, με τα ανορθόδοξα και αντισυμβατικά σχέδια των ψηκτρών που χρησιμοποιούνται στην νέα σειρά καρτών της NVIDIA. Το πολύ ιδιαίτερο design τους όμως, δεν σημαίνει πως και οι επιδόσεις τους δεν είναι εξίσου ιδιαίτερες.

Με την κάρτα ουσιαστικά χωρισμένη σε δύο μέρη, ο ένας ανεμιστήρας αποβάλει τον ζεστό αέρα μέσα στο case, ενώ ο δεύτερος τον αποβάλει απευθείας έξω από το case, μέσα από τις γρίλιες στα πλάγια της κάρτας. Αυτή η τεχνική, σε συνδυασμό με το νέο, πολύ μικρό και compact PCB που χρησιμοποιούν οι Ampere, οδηγεί σε μείωση των θερμοκρασιών έως και 20°C χαμηλότερα, σε σχέση με το design των ψηκτρών των Turing.

Πυρήνας

Ο πυρήνας και υπό μία έννοια, η ίδια η αρχιτεκτονική Ampere, έχει ξεπεράσει τα προηγούμενα θεσμοθετημένα όρια. Με την χρήση των 8nm LPP της Samsung, έχουμε τεράστιους πυρήνες, με ασύλληπτους αριθμούς transistor και μεγάλη αύξηση των Shader, Tensor και RT Cores. Το αποτέλεσμα είναι να έχουμε και την ανάλογη αύξηση επιδόσεων, όπως και προφανώς αντίστοιχη αύξηση στις καταναλώσεις.

Ίσως οι περισσότεροι να μην μπορείτε να το συνειδητοποιείσετε, λόγω μη επαφής με το αντικείμενο, όμως το να καταφέρεις να φτιάξεις έναν τόσο τεράστιο πυρήνα, σε ένα σχετικά νέο lithography, είναι άθλος. Δεν ξέρω τι έκαναν οι μηχανικοί της NVIDIA και της Samsung για να το επιτύχουν και να έχουν αποδεκτά yields, όμως σίγουρα αγγίζει τα όρια του “θαύματος”.

Μνήμη

Κάθε μεγάλος και δυνατός πυρήνας, χρειάζεται “φαΐ”(για να χρησιμοποιήσουμε πιο απλή ορολογία). Χωρίς τα απαραίτητα δεδομένα για να επεξεργαστεί, ο πυρήνας μας είναι πρακτικά άχρηστος. Συνεπώς, κάπως πρέπει να εξασφαλιστεί η συνεχής ροή δεδομένων προς αυτόν και μάλιστα σε μεγάλες ποσότητες.

Η Micron με την GDDR6X, δίνει ακριβώς την λύση που χρειάζεται στο παραπάνω πρόβλημα. Χρησιμοποιώντας το PAM4 πρωτόκολλο σήματος, μπορεί να επιτρέψει ακόμα μεγαλύτερο αριθμό δεδομένων να περάσουν από την μνήμη στον πυρήνα και αυτό γίνεται με έναν αρκετά ιδιαίτερο τρόπο.

Ένα κλασικό ηλεκτρικό σήμα, γίνεται αντιληπτό ως 0 ή 1 από ένα ψηφιακό/λογικό κύκλωμα, ανάλογα το επίπεδο της τάσης. Συνήθως, όταν είναι χαμηλή θεωρείται 0 και όταν είναι υψηλή θεωρείται 1 (μπορεί να ισχύει το αντίθετο), με τις ενδιάμεσες καταστάσεις να είναι αυτό που αναφέρουμε ως “απροσδιόριστες λογικές καταστάσεις/στάθμες” οι οποίες μας δίνουν… απροσδιοριστία. Γι αυτό λοιπόν και τις αποφεύγουμε.

Η Micron εκμεταλεύτηκε την ύπαρξη των απροσδιόριστων καταστάσεων και εισήγαγε μέσα σε αυτές ακόμα δύο επίπεδα τάσεων, τα οποία γίνονται αντιληπτά από τον πυρήνα. Αυτό σημαίνει πως πλέον δεν έχουμε αποκλειστικά 0 και 1, αλλά 00, 01, 10 και 11. Κατά συνέπεια, αυξήθηκε και ο αριθμός των δεδομένων που μπορούμε να μεταδώσουμε ανά χρονική στιγμή (τα γνωστά bits), από ένα σε δύο.

Ως τελικό αποτέλεσμα λοιπόν, βλέπουμε την GDDR6X να έχει 50% αύξηση σε bandwidth σε σχέση με την απλή GDDR6, καθιστώντας την ικανή να… “ταΐσει” τον Ampere πυρήνα.

Interface

Το PCI-E Gen 4 έχει θέσει νέα standards όσον αφορά την ενδοεπικοινωνία και μεταφορά δεδομένων μεταξύ των κομματιών ενός υπολογιστή. Φυσικά και οι Ampere χρησιμοποιούν το νέο αυτό πρωτόκολλο, όμως ακόμα και οι ταχύτητες του PCI-E Gen 4 δεν είναι αρκετές. Ένας PCI-E Gen 4 SSD μπορεί να προσφέρει το πολύ 7-7.5GB/s bandwidth.

Mε την συμπίεση των δεδομένων όμως, μπορούμε να επιτύχουμε έως και διπλάσιες ταχύτητες, εφόσον το επιτρέπει το CPU μας. Το compression και decompression είναι μια διαδικασία η οποία απαιτεί χρόνο και κυρίως πυρήνες. Σύμφωνα με τα δεδομένα της NVIDIA, ένας PCI-E Gen 4 SSD με compressed δεδομένα, απαιτεί 24 πυρήνες για να φτάσει το μέγιστο των επιδόσεων του.

Εδώ λοιπόν έρχεται το RTX IO. Ένα low level software το οποίο “πατάει” πάνω στην Ampere αρχιτεκτονική και επιτρέπει την μεταφορά compressed δεδομένων προς και από την GPU με τρομερές ταχύτητες και ελάχιστο CPU overhead. Πράγμα το οποίο σημαίνει πως ίσως να αποχαιρετήσουμε τα loading screens όπως τα ξέραμε.

Ηλεκτρονικοί Μηχανικοί, Μηχανολόγοι Μηχανικοί, Μηχανικοί Πληροφορικής και πολλοί άλλοι συνεργάστηκαν για να δημιουργήσουν αυτό που είδαμε σήμερα στα χέρια του Jensen Huang. Και ο καθένας, μπορώ να πω, πως “έδωσε ρέστα” με την δουλεία του…

Μείνετε στους TechLads για περισσότερα άρθρα ανάλυσης σαν και αυτό!

About Post Author

Κώστας Ανεστόπουλος

Στα 4 μου έπαιξα το πρώτο μου PC game, το διάσημο Starcraft του 1998 και αποφάσισα ότι "αυτό θέλω να κάνω όταν μεγαλώσω". Πλέον έχω ένα πάθος με το competitive overclocking, την ηλεκτρολογία και τα ηλεκτρονικά γενικότερα, όπως και την ανάλυση hardware. Στο Starcraft από την άλλη, ακόμα noobας είμαι.