Xeon Phi: Υπερυπολογιστης σε συσκευασια chip

Η παρουσίαση του Xeon Phi από την Intel, αποτελεί ένα από τα σηµαντικότερα βήµατα στην προσπάθεια της εταιρείας να φτάσει στη δηµιουργία ενός υπολογιστή απόδοσης exaflop µέχρι το 2018.

Ο πρώτος συνεπεξεργαστής της σειράς Xeon Phi, ο οποίος έχει αναπτυχθεί µε την κωδική ονοµασία Knights Corner, κατασκευάζεται µε αρχιτεκτονική 22 nm  (νανόµετρων) και διαθέτει 3D Tri-Gate transistors. Η λογική µε την οποία έχει δηµιουργηθεί ο Xeon Phi είναι η εύκολη κλιµάκωση µε χαµηλή κατανάλωση για την πραγµατοποίηση περίπλοκων υπολογισµών. Οι επεξεργαστές Xeon Phi, είναι µέλη της οικογένειας Xeon, οι οποίοι βρίσκονται στην πλειοψηφία των στάνταρ servers που συναντάµε σε εφαρµογές όπως είναι το cloud και οι βάσεις δεδοµένων. Η Intel πέρα από τη δική της τεχνογνωσία, αξιοποίησε και τις τεχνολογίες που απέκτησε από τις εξαγορές των Qlogic και Cray ώστε να µπορέσει να δώσει το απαραίτητο bandwidth για τη µεταφορά δεδοµένων.

Ο λόγος που ο Xeon Phi ονοµάζεται συνεπεξεργαστής, είναι ότι απαιτεί την ύπαρξη ενός επεξεργαστή σχεδιασµένου για server ώστε να λειτουργήσει σε κάποιο σύστηµα. Μια από τις πιο ενδιαφέρουσες υλοποιήσεις που λαµβάνουν χώρα αυτή την περίοδο αφορά σε έναν υπερ-υπολογιστή µε την ονοµασία Stampede, ο οποίος θα λειτουργήσει µέχρι το τέλος του έτους στο πανεπιστήµιο του Τέξας. Η απόδοση του συστήµατος, θα φτάνει τα 10 petaflops (10.000 τρις λειτουργίες το δευτερόλεπτο). Οι επεξεργαστές στους οποίους στηρίζεται, που δεν είναι άλλοι από τους Xeon E5, αντιστοιχούν στο 20% της ισχύος του υπερ-υπολογιστή, ενώ το υπόλοιπο 80% προέρχεται από το Xeon Phi. Στόχος της εταιρείας είναι να κατασκευάσει στο µέλλον νέους επεξεργαστές Xeon Phi, που θα παρέχουν ακόµη καλύτερο λόγο απόδοσης ανά watt. Με την κίνησή της η εταιρεία, έρχεται να δώσει τη δική της απάντηση στο χώρο των εξειδικευµένων εφαρµογών στις οποίες απαιτείται ιδιαίτερα ισχυρή επεξεργαστική ισχύ ανά δολάριο και ανά watt, µε καλύτερη αναλογία από αυτή που µπορούν να δώσουν οι Xeon.

Υπάρχουν πολλά ενδιαφέροντα στοιχεία, που κάνουν τον Xeon Phi να ξεχωρίζει. Ένα από αυτά είναι ότι ο πυρήνας εκτελεί τις εντολές σειριακά και µπορεί να διαχειριστεί τέσσερα threads την ίδια στιγµή. O κάθε πυρήνας διαθέτει 32 KB Level 1 instruction cache και 32 KB data cache όπως και L2 µεγέθους 512KB. Η επεξεργαστική µονάδα διανυσµάτων (Vector Processing Unit – VPU) στον πυρήνα Xeon Phi είναι εντελώς νέου σχεδιασµού και µπορεί να διαχειριστεί SIMD instructions µεγέθους 512-bit αντί για 128-bit ή 256-bit AVX instructions που βρίσκουµε στους σύγχρονους Xeon.

Η εν λόγω µονάδα είναι σε θέση να επεξεργαστεί οκτώ 64-bit πράξεις κινητής υποδιαστολής διπλής ακρίβειας, ή δεκαέξι 32-bit πράξεις κινητής υποδιαστολής µονής ακρίβειας σε έναν κύκλο µηχανής.
Η µονάδα VPU διαθέτει ένα καινοτόμο χαρακτηριστικό, νέο από πλευράς Intel, που ονοµάζεται Extended Math Unit (EMU), και υποστηρίζει διάφορες λειτουργίες, όπως η τετραγωνική ρίζα, η ύψωση σε δύναµη και δεν στηρίζεται σε πολυώνυµα και συντελεστές για την εκτίµηση των αποτελεσµάτων σε τέτοιου είδους λειτουργίες. Η υλοποίηση στηρίζεται στο hardware για την πραγµατοποίηση των πράξεων και όχι στο software ή σε διάφορα τρυκ που έχουµε δει σε διάφορες υλοποιήσεις.

Οι επεξεργαστές Xeon Phi συνδέονται µεταξύ τους µε υψηλής ταχύτητας διασυνδέσεις, όπως έχει κάνει η Intel στην περίπτωση των Xeon E5. Ο τρόπος είναι διαφορετικός όµως. Υπάρχουν τρεις συνδέσεις. Η πρώτη αφορά στην αποστολή δεδοµένων διαµέσου των L2 Caches και οι άλλες δυο αφορούν στα διάφορα requests που αποστέλλονται και στα µηνύµατα συνοχής ανάµεσα σε όλους τους πυρήνες και τις caches. Η βασική µνήµη τύπου GDDR5 χρησιµοποιεί και αυτή τις ίδιες διαδροµές, που συνδέουν τους δυο memory controllers στο chip.

Άλλο ένα ιδιαίτερα ενδιαφέρον χαρακτηριστικό που θα πρέπει να αναφέρουµε έχει την ονοµασία Streaming Stores, το οποίο µειώνει σηµαντικά τον όγκο του bandwidth, που απαιτείται για την πραγµατοποίηση full cache-line stores.  Το αποτέλεσµα δείχνει βελτίωση της τάξης του 30% στο bandwidth της µνήµης σε πραγµατικές συνθήκες εργασίας. Το Xeon Phi υποστηρίζει το πρωτόκολλο TCP/IP over PCI-Express, κάτι που σηµαίνει ότι µπορούµε να συνδεθούµε µέσω Telnet στην κάρτα, ενώ εξυπακούεται ότι υπάρχει και η δυνατότητα απευθείας “συνοµιλίας” µεταξύ των καρτών που βρίσκονται σε ένα σύστηµα.

Καθώς οι developers υιοθετούν ολοένα και περισσότερο τη λογική του παραλληλισµού, τα σηµαντικά και δηµοφιλή µοντέλα προγραµµατισµού, που χρησιµοποιούνται στους επεξεργαστές αρχιτεκτονικής Intel µπορούν  να επεκταθούν και στους Xeon Phi, χωρίς να χρειάζεται εκ νέου προσέγγιση στο ζήτηµα. Οι ίδιες τεχνικές που παρέχουν τη βέλτιστη απόδοση στους επεξεργαστές της Intel, κλιµακώνοντας την απόδοση σε πυρήνες και threads και χρησιµοποιούν αποτελεσµατικά τις εντολές SIMD, µπορούν να εφαρµοστούν και να µεγιστοποιήσουν την απόδοση στην αρχιτεκτονική MIC της εταιρείας. Με επαναχρησιµοποίηση του παράλληλου κώδικα των επεξεργαστών, οι εταιρείες software και τα τµήµατα IT επωφελούνται από τη δηµιουργία και τη συντήρηση µιας ενιαίας βάσης κώδικα χωρίς να απαιτείται εκ νέου εκπαίδευση για τους προγραµµατιστές σε κλειστά προγραµµατιστικά µοντέλα που σχετίζονται µε άλλες λύσεις του χώρου.

Ήδη Dell και Intel ανακοίνωσαν τα σχέδιά τους για τη δημιουργία δυο Product Centers of Competence (PCC) στο πανεπιστήµιο του Cambridge, που θα λειτουργήσουν ως πλατφόρµα δοκιµών για τους Intel Xeon και τους Intel Xeon Phi. Τα κέντρα θα προσφέρουν εκπαίδευση σε High Performance Computing (HPC) και στο πιο πρόσφατο hardware, µε στόχο την προετοιµασία της επιστηµονικής κοινότητας για την παρουσίαση της πρώτης γενιάς της οικογένειας προϊόντων Xeon Phi έτσι ώστε να µπορούν να περάσουν άµεσα στην παραγωγή.

Related Posts