
Η NVIDIA αποκάλυψε την αρχιτεκτονική Ampere, της οποίας την ύπαρξη γνωρίζαμε εδώ και μερικά χρόνια, με την NVIDIA A100. Η κάρτα αποτελεί έναν πανίσχυρο διάδοχο της NVIDIA Tesla V100 και προορίζεται καθαρά για συστήματα workstation. Φυσικά η κάρτα δημιουργήθηκε για να παρέχει πρωτοποριακή απόδοση σε κάθε κλίμακας AI, data analytics και HPC όπως υποστηρίζει η ίδια η εταιρία.
Χαρακτηριστικά
Όπως μπορείτε δείτε και στην παραπάνω εικόνα η επερχόμενη A100 φένεται να έχει πέντε νέες καινοτομίες
- Αρχικά με την αρχιτεκτονική Ampere που διαθέτει, περιέχει περισσότερα από 54 δισεκατομμύρια τρανζίστορ, καθιστώντας τον επεξεργαστή της, τον μεγαλύτερο επεξεργαστή 7nm που έχει κατασκευαστεί.
- Εν συνεχεία διαθέτει τρίτης γενιάς Tensor Cores με Tensor Float (TF) 32. Αυτή νέα γενιά πυρήνων παρέχει ευελιξία, ευχρηστία και πολύ μεγαλύτερη απόδοση.
- Επίσης διαθέτει το ολοκαίνουργιο σύστημα της NVIDIA, MIG (Multi-Ιnstance GPU ). To MIG επιτρέπει σε κάθε NVIDIA A100 να μπορεί να ”διαμελιστεί” σε επτά επιμέρους κομμάτια ώστε να διαμοιράζει το φόρτο εργασίας.
- Τέλος διαθέτει το τρίτης γενιάς NVIDIA NVLink μέσω του οποίου διπλασιάζεται η ταχύτητα επικοινωνίας μεταξύ των διαφορετικών GPUs.
Ο παρακάτω πίνακας αναπαριστά τα αναλυτικά τεχνικά χαρακτηριστικά που έδωσε στην δημοσιότητα η NVIDIA.
Χαρακτηριστικά | NVIDIA A100 |
Peak FP64 | 9.7 TF |
Peak FP64 Tensor Core | 19.5 TF |
Peak FP32 | 19.5 TF |
Peak FP32 Tensor Core | 156 TF | 312 TF* |
Peak BFLOAT16 Tensor Core | 312 TF | 624 TF* |
Peak FP16 Tensor Core | 312 TF | 624 TF* |
Peak INT8 Tensor Core | 624 TOPS | 1,248 TOPS* |
Peak INT4 Tensor Core | 1,248 TOPS | 2,496 TOPS* |
GPU Memory | 40 GB |
GPU Memory Bandwidth | 1,555 GB/s |
Interconnect | NVIDIA NVLink 600 GB/s PCIe Gen4 64 GB/s |
Multi-instance GPUs | Various instance sizes with up to 7MIGs @5GB |
Form Factor | 4/8 SXM on NVIDIA HGX A100 |
Max TDP Power | 400W |
Επιδόσεις
Στις εργασίες που αναφέραμε παραπάνω οι NVIDIA έχει δώσει κάποια σχεδιαγράμματα που αναπαριστούν τις επιδόσεις της A100 σε σχέση με τον προκάτοχό της, την V100. Έτσι παρουσιάζοντα τα παρακάτω διαγράμματα.
Έτσι με την σειρά που εμφανίζοντα οι εικόνες έχουμε:
- Πενταπλάσια απόδοση σε σχέση με την V100 όσων αφορά το deep learning και training AI μοντέλων
- Εξαπλάσια απόδοση σε σχέση με την V100 όσων αφορά το deep learning interface
- Πενταπλάσια απόδοση σε σχέση με την V100 και οκταπλάσια σε σχέση με την P100 στο HPC
- Διαθέτει Enterprise-Ready Utilization.
Εντυπωσιακή η νέα κάρτα και περιμένουμε να δούμε και αποτελέσματα από ιδρύματα και οργανισμούς που θα την εντάξουν στο δυναμικό τους. Φυσικά δεν πρόκειται για κάποια mainstream κάρτα οπότε εμείς, οι απλοί χρήστες, αναμένουμε την ανακοίνωση των RTX 3000. Μείνετε στους Techlads για τα τελευταία νέα από τον κόσμο των GPUs.