nvidia a100
Read Time:2 Minutes

Η NVIDIA αποκάλυψε την αρχιτεκτονική Ampere, της οποίας την ύπαρξη γνωρίζαμε εδώ και μερικά χρόνια, με την NVIDIA A100. Η κάρτα αποτελεί έναν πανίσχυρο διάδοχο της NVIDIA Tesla V100 και προορίζεται καθαρά για συστήματα workstation. Φυσικά η κάρτα δημιουργήθηκε για να παρέχει πρωτοποριακή απόδοση σε κάθε κλίμακας AI, data analytics και HPC όπως υποστηρίζει η ίδια η εταιρία.

Χαρακτηριστικά

Όπως μπορείτε δείτε και στην παραπάνω εικόνα η επερχόμενη A100 φένεται να έχει πέντε νέες καινοτομίες

  1. Αρχικά με την αρχιτεκτονική Ampere που διαθέτει, περιέχει περισσότερα από 54 δισεκατομμύρια τρανζίστορ, καθιστώντας τον επεξεργαστή της, τον μεγαλύτερο επεξεργαστή 7nm που έχει κατασκευαστεί.
  2. Εν συνεχεία διαθέτει τρίτης γενιάς Tensor Cores με Tensor Float (TF) 32. Αυτή νέα γενιά πυρήνων παρέχει ευελιξία, ευχρηστία και πολύ μεγαλύτερη απόδοση.
  3. Επίσης διαθέτει το ολοκαίνουργιο σύστημα της NVIDIA, MIG (Multi-Ιnstance GPU ). To MIG επιτρέπει σε κάθε NVIDIA A100 να μπορεί να ”διαμελιστεί” σε επτά επιμέρους κομμάτια ώστε να διαμοιράζει το φόρτο εργασίας.
  4. Τέλος διαθέτει το τρίτης γενιάς  NVIDIA NVLink μέσω του οποίου διπλασιάζεται η ταχύτητα επικοινωνίας μεταξύ των διαφορετικών GPUs.

Ο παρακάτω πίνακας αναπαριστά τα αναλυτικά τεχνικά χαρακτηριστικά που έδωσε στην δημοσιότητα η NVIDIA.

ΧαρακτηριστικάNVIDIA A100
Peak FP649.7 TF
Peak FP64 Tensor Core19.5 TF
Peak FP3219.5 TF
Peak FP32 Tensor Core156 TF | 312 TF*
Peak BFLOAT16 Tensor Core312 TF | 624 TF*
Peak FP16 Tensor Core312 TF | 624 TF*
Peak INT8 Tensor Core624 TOPS | 1,248 TOPS*
Peak INT4 Tensor Core1,248 TOPS | 2,496 TOPS*
GPU Memory40 GB
GPU Memory Bandwidth1,555 GB/s
InterconnectNVIDIA NVLink 600 GB/s
PCIe Gen4 64 GB/s
Multi-instance GPUsVarious instance sizes with up to 7MIGs @5GB
Form Factor4/8 SXM on NVIDIA HGX A100
Max TDP Power400W

Επιδόσεις

Στις εργασίες που αναφέραμε παραπάνω οι NVIDIA έχει δώσει κάποια σχεδιαγράμματα που αναπαριστούν τις επιδόσεις της A100 σε σχέση με τον προκάτοχό της, την V100. Έτσι παρουσιάζοντα τα παρακάτω διαγράμματα.

Preview(opens in a new tab)

Έτσι με την σειρά που εμφανίζοντα οι εικόνες έχουμε:

  • Πενταπλάσια απόδοση σε σχέση με την V100 όσων αφορά το deep learning και training AI μοντέλων
  • Εξαπλάσια απόδοση σε σχέση με την V100 όσων αφορά το deep learning interface
  • Πενταπλάσια απόδοση σε σχέση με την V100 και οκταπλάσια σε σχέση με την P100 στο HPC
  • Διαθέτει Enterprise-Ready Utilization.

Εντυπωσιακή η νέα κάρτα και περιμένουμε να δούμε και αποτελέσματα από ιδρύματα και οργανισμούς που θα την εντάξουν στο δυναμικό τους. Φυσικά δεν πρόκειται για κάποια mainstream κάρτα οπότε εμείς, οι απλοί χρήστες, αναμένουμε την ανακοίνωση των RTX 3000. Μείνετε στους Techlads για τα τελευταία νέα από τον κόσμο των GPUs.

About Post Author

Γιάννης Ελευθερίου

Όλα ξεκίνησαν κάπου στα 7 μου. Κάτοχος του XBOX classic τότε μπήκα στον μαγικό κόσμο των video games με το V-Rally 3. Πλέον λάτρης της τεχνολογίας και των games, επενδύω τον ελεύθερό μου χρόνο σε καλά παιχνίδια ή τουλάχιστον σε όσα θεωρώ εγώ καλά!