Review: AMD Radeon HD 7970 και Radeon HD 7950
Στην παρακάτω εικόνα διακρίνουμε το αρχιτεκτονική σχέδιο της GPU Tahiti. Στην πραγματικότητα, δεν αποτελεί το "φυσικό σχέδιο" του πυρήνα αλλά μία αναπαράσταση ορισμένων από τα σημαντικότερα στοιχεία του για να καταλάβουμε με πιο παραστατικό τρόπο την λειτουργία του. Ο επεξεργαστής γραφικών δεν έχει αυτή τη μορφή.
Οι 2048 stream processors είναι οργανωμένοι σε 32 "block", δηλαδή στις υπολογιστικές μηχανές GCN (Graphics Core Next). Κάθε μηχανή GCN διαθέτει τέσσερις μονάδες texturing (4 x texture units) και 4 μονάδες simple instruction multiple data (4 x SIMD units) μαζί με μία μονάδα scalar και βεβαίως την απαραίτητη cache και τους καταχωρητές.
To frontend της Tahiti αποτελείται από δύο Asynchonous Command Engine (ACE) και δύο μηχανές γεωμετρικών υπολογισμών (geometry engines). Όπως και στην Cayman, έτσι και στην Tahiti, κάθε μηχανή γεωμετρικών υπολογισμών μπορεί να "χειριστεί" ένα πολύγωνο ανά κύκλο ρολογιού, οπότε θεωρητικά ο ρυθμός είναι ο ίδιος σε σχέση με το παρελθόν (2 triangles per clock rate) ωστόσο στην πράξη, η Tahiti λόγω ορισμένων βελτιώσεων είναι ταχύτερη.
Η αρχιτεκτονική Graphics Core Next φέρνει επίσης και ένα χαρακτηριστικό που η AMD αναφέρεται ως 9η γενιά μονάδων tessellation. Όπως αναφέραμε στην GPU με την κωδική ονομασία Tahiti, παρατηρούμε δύο μηχανές υπολογισμού γεωμετρικών πράξεων, και μαζί με αυτές δύο ανεξάρτητες μονάδες tessellation που είναι σημαντικά βελτιωμένες (χάρη σε νέες off-chip δυνατότητες προσωρινής αποθήκευσης κ.α) ώστε να προσφέρουν τέσσερις φορές υψηλότερη απόδοση σε tesselation intensive εφαρμογές σε σχέση με την AMD Radeon HD 6970, τουλάχιστον σε θεωρητικό επίπεδο.
Η Tahiti GPU διαθέτει όμοιο πάντως αριθμό ROPs (Raster Operations Pipeline Units) σε σχέση με την Cayman της προηγούμενης γενιάς, δηλαδή 32 μονάδες. Εφόσον το έυρος του memory bandwidth αυξήθηκε στα 384-bit, θα μπορούσε κάποιος να υποθέσει ότι θα αυξανόταν και ο αριθμός των μονάδων ROP αντίστοιχα, ας πούμε στον αριθμό 48. Επειδή ωστόσο η διάταξη των στοιχείων του πυρήνα άλλαξε - για παράδειγμα οι ROPs που είναι ιδιαίτερα bandwidth intensive ήταν σε σχεδιασμό αντιστοίχισης με τους ελεγκτές μνήμης και την L2 cache στην περίπτωση της Cayman - και άρα και ο τρόπος αλληλεπίδρασης μεταξύ τους, η AMD πιθανότατα να διαπίστωσε πως δεν μπορούσε ή δεν γινόταν με την συγκεκριμένη γενιά των καρτών γραφικών να αυξήσει την αποδοτικότητα των ίδιων των μονάδων ROPs και έτσι διατήρησε των αριθμό των ROPs ως είχε. Μπορούσε ωστόσο να αυξήση την αποδοτικότητα τους με άλλο τρόπο.
Τα στοιχεία SIMD (Simple Instruction Multiple Data) έχουν υποστεί μεγάλες αλλαγές ενώ επιπλέον και η Raster Operations Pipeline είναι πλέον αποσυνδεδεμένη από το εύρος του memory bus.
Οι ROPs είναι κατά μέρος αποσυνδεδεμένες από την L2 cache και τους ελεγκτές μνήμης, και για αυτό παρατηρούμε οκτώ τμήματα ROPs αλλά έξι συνολικά ελεγκτές μνήμης. Η AMD, όπως είδαμε στην Cayman, χρησιμοποιούσε μία πιο παραδοσιακή προσέγγιση όσο αφορά στον σχεδιασμό, με τις ROPs, την L2 cache και τους ελεγκτές μνήμης να συνδέονται άμεσα μεταξύ τους, επειδή πολύ απλά οι ROPs απαιτούν εξαιρετικά μεγάλο εύρος ζώνης (bandwidth).
Στην περίπτωση της Tahiti, χωρίς να αυξήσει τον αριθμό των ROPs, κάτι που αναμφισβήτητα θα κάνει στην επόμενη γενιά καρτών γραφικών της για να μπορέσει να ανταποκριθεί στις τεχνολογικές καινοτομίες των επόμενης γενιάς τίτλων παιχνιδιών, φρόντισε να αυξήσει τουλάχιστον την αποδοτικότητα τους, αποσυνδέοντας τις μονάδες από τους ελέγκτές μνήμης και χρησιμοποιώντας μία διασύνδεση "crossbar" ενώ αύξησε παράλληλα το εύρος του διαύλου μνήμης κατά 50%, ώστε να επωφεληθούν από το πρόσθετο εύρος ζώνης. Το αποτέλεσμα είναι βεβαίως η αύξηση στην ταχύτητα, ωστόσο αμφιβάλλουμε ότι θα κρατήσει τον ίδιο σχεδιασμό και στην επόμενη γενιά καρτών γραφικών χωρίς να αυξήσει παράλληλα των αριθμό των ROPs.
Για να εξυπηρετηθούν οι ανάγκες των ROPs, η AMD αύξησε το εύρος του memory interface κατά 50%, και έτσι από 256-bit αυξήθηκε στα 384-bit. Αυτό είχε ως αποτέλεσμα την αύξηση του memory bandwidth στα 264GB/s θεωρητικά.
Στην προηγούμενη γενιά καρτών γραφικών, όταν και είχαμε βρεθεί στην επίσημη παρουσίαση της εταιρείας στο Λος Άντζελες, οι μηχανικοί της μας είχαν πει ότι ο βελτιωμένος αλγόριθμος Anisotropic Filtering που είχαν δημιουργήσει ήταν... τέλειος. Και όμως, από ότι φαίνεται κατάφεραν να τον βελτιώσουν περαιτέρω!
Είσοδος
Συζητήσεις
-
2 απαντήσεις, τελευταία πριν 10 έτη 13 εβδομάδες
-
2 απαντήσεις, τελευταία πριν 10 έτη 13 εβδομάδες
-
3 απαντήσεις, τελευταία πριν 10 έτη 13 εβδομάδες
-
1 απάντηση, πριν 10 έτη 14 εβδομάδες
-
6 απαντήσεις, τελευταία πριν 10 έτη 14 εβδομάδες
-
5 απαντήσεις, τελευταία πριν 10 έτη 14 εβδομάδες
-
6 απαντήσεις, τελευταία πριν 10 έτη 14 εβδομάδες
-
1 απάντηση, πριν 10 έτη 15 εβδομάδες
-
4 απαντήσεις, τελευταία πριν 10 έτη 15 εβδομάδες
-
15 απαντήσεις, τελευταία πριν 10 έτη 16 εβδομάδες
Bits & Bytes
-
πριν 10 έτη 22 εβδομάδες
-
πριν 10 έτη 45 εβδομάδες
-
πριν 11 έτη 39 εβδομάδες
-
πριν 12 έτη 3 εβδομάδες
-
πριν 12 έτη 10 εβδομάδες
-
πριν 12 έτη 23 εβδομάδες
Ουφ...
Ουφ...
!!!!
Πολύ καλή παρουσίαση(once again).
Τι να πούμε τώρα,μακάρι να είχα λεφτά να τα έδινα σε τέτοιο εργαλείο.
Στα γνωστά (υψηλότατα)
Στα γνωστά (υψηλότατα) standards των reviews του Voltmod. Οι κάρτες τα σπάνε και ιδιαίτερα εντυπωσιακή η κατανάλωση...
Μακαρι να βγαλει κατι καλο η
Μακαρι να βγαλει κατι καλο η Nvidia και να πεσουν οι τιμες γιατι εκει δεν παλευονται. Καλη, χρυση, γαμ....ερη η AMD αλλα θυμηθηκε τιμες του 2006 (X1900XT @ 599$/X1900XTX @ 649$), nawt kewl broski...
ΥΓ: Φυσικα για ακομα μια φορα, καταπληκτικη δουλεια!
+1 ! Εύγε ωραίο review.
+1 !
Εύγε ωραίο review.