Analyse des Gains de Débit avec le Benchmark MP MFLOPS

Cray-1 contre Raspberry Pi, une histoire de décennies

MP MFLOPS 2 - Intel DP, Android et Raspberry Pi SP

Les résultats des tests, réalisés avec des outils tels que Linpack, Whetstone et Livermore loops, révèlent des performances du Raspberry Pi Model B original jusqu'à 15,7 fois supérieures à celles du Cray-1. Même les derniers modèles de la famille Raspberry Pi, tels que le Raspberry Pi 400, affichent des gains de performance remarquables, jusqu'à 95,5 fois les résultats du Cray-1. Cette comparaison étonnante souligne la progression spectaculaire de la technologie, transformant des appareils autrefois massifs et coûteux en des solutions compactes et abordables. Le rapport complet de Longbottom, incluant des comparaisons avec des appareils Android et des processeurs Intel et AMD, est accessible sur son site web.Fondée sur des benchmarks complexes, l'étude utilise les noyaux de programmes du Lawrence Livermore Laboratory, tels que Livermore Loops, Linpack et Whetstone, pour évaluer les performances en millions d'opérations en virgule flottante par seconde (MFLOPS). Les résultats détaillés incluent des comparaisons avec d'autres dispositifs, tels que les tablettes Android et les processeurs Intel, démontrant l'évolution remarquable de la technologie depuis 1976. En outre, Longbottom partage son expérience dans l'évaluation des performances des systèmes informatiques et met en lumière l'implication directe avec des figures majeures de l'industrie, notamment Seymour Cray.Les résultats du benchmark Multithreading MP Whetstones sont principalement obtenus en exécutant plusieurs instances de la version principalement scalaire du benchmark Whetstone, utilisant respectivement 1, 2, 4 et 8 threads à travers un seul programme. Ces résultats mettent en lumière les défis liés à la variation de la fréquence du processeur en fonction du nombre de threads, ainsi que les avantages de l'Hyperthreading sur les PC. Les versions à simple et double précision ont été testées, montrant des performances similaires. Les gains de débit avec huit threads par rapport au Cray 1 ont été remarquables, atteignant 400 fois pour le Raspberry Pi, 757 fois pour le téléphone Android, et 1521 fois pour l'ordinateur portable Core i5.Le programme MP MFLOPS effectue des combinaisons de multiplications et d'additions en virgule flottante manipulant des variables SP ou DP dans le but de démontrer des performances presque maximales, tout en étant exécuté à partir d'un seul programme. Des listes de codes d'assemblage sont fournies pour le test normalement le plus rapide sur les processeurs Intel. En prenant comme base le mélange d'opérations en virgule flottante, l'estimation de la vitesse maximale du Cray 1, exécutant ces opérations, est réduite de 160 MFLOPS à 122.Les gains sur les ordinateurs portables Core i5, par rapport à la vitesse maximale révisée du Cray 1, ont été considérables, atteignant 2671 pour SP et 1317 pour DP, équivalant à 326 et 161 GFLOPS. Les gains sur les autres appareils ont également été significatifs, avec une augmentation de 293 fois pour le téléphone Android et de 247 fois pour le Raspberry Pi, les deux dépassant les 30 GFLOPS. Ce benchmark dispose d'un paramètre de temps d'exécution permettant d'utiliser jusqu'à 64 threads, illustrant ainsi les performances nettement supérieures des CPU plus avancés.Notons que le mégaflops est une unité de mesure de puissance en informatique. Cette unité quantifie la capacité des ordinateurs à effectuer des calculs en virgule flottante. Les mégaflops évaluent la performance d'un système informatique, notamment dans le domaine du traitement des données scientifiques et techniques. Un mégaflops correspond à un million d'opérations en virgule flottante par seconde. Ils sont utilisés pour comparer les performances des processeurs, cartes graphiques et supercalculateurs. Plus le nombre de mégaflops est élevé, plus l'équipement est performant pour effectuer des calculs complexes.La performance matérielle maximale possible a été estimée à 160 MFLOPS pour le Cray 1 à 80 MHz, comprenant la multiplication et l'addition liées, pour deux résultats par cycle d'horloge. Le benchmark LLL affiche un maximum de 82,1 MFLOPS avec une moyenne de 11,9 et un minimum de 1,2. Linpack et Whetstone sont respectivement de 27 et 6 MFLOPS, Linpack bénéficiant de la multiplication et de l'addition liées.En 2013, Longbottom a exécuté ses benchmarks sur la première version du Raspberry Pi. Il s'agissait essentiellement des mêmes que ceux utilisés sur les PC, sous Linux. Les programmes incluaient le benchmark Livermore Loops et cela a conduit à inclure ce qui suit dans un rapport. « En 1978, le superordinateur Cray 1 coûtait 7 millions de dollars, pesait 10 500 livres et avait une alimentation électrique de 115 kilowatts. C'était, de loin, l'ordinateur le plus rapide du monde. Le Raspberry Pi coûte environ 70 dollars (carte CPU, boîtier, alimentation, carte SD), pèse quelques grammes, utilise une alimentation de 5 watts et est plus de 4,5 fois plus rapide que le Cray 1 ». Il s'agit des résultats officiels de la moyenne géométrique.En 2019 (à l'âge de 84 ans), Longbottom a été invité à devenir un membre volontaire de l'équipe de test Alpha de la Fondation Raspberry Pi, ce qu’il a accepté. Cela a amené Longbottom à effectuer ses benchmarks et ses tests sur de nouveaux systèmes haut de gamme avant leur annonce.Les comparaisons suivantes de MFLOPS sont dans l'ordre de la moyenne des boucles de Livermore. Les trois mesures principales du Pi 1 700 MHz (Loops, Linpack et Whetstone) étaient de 55, 42 et 94 MFLOPS, les quatre gains par rapport au Cray 1 étant de 8,8 fois pour les MHz et de 4,6, 1,6 et 15,7 fois pour les MFLOPS.Le Pi 400 2020 1800 MHz a fourni 819, 1147 et 498 MFLOPS, avec des gains de vitesse en MHz de 23 fois et de 69, 42 et 83 fois pour les MFLOPS. Avec des options SIMD plus avancées, la compilation 64 bits a produit des gains Cray 1 MFLOPS de 78,8, 49,5 et 95,5 fois.Les premières colonnes de ce tableau fournissent les résultats des MP MFLOPS en double précision des Core i7 et Core i5, en utilisant. 1 et 8 threads. Les calculs ci-dessous montrent que les performances à 32 opérations par mot, et d'autres domaines très performants, étaient effectivement à la moitié de la vitesse de la simple précision, comme prévu avec SIMD. Les ratios inférieurs reflètent probablement les calculs en double précision à demi-vitesse et les frais généraux liés aux nombres de 64 bits.Les résultats en simple précision sont également inclus pour le téléphone Android Kryo 570 à 2000 MHz et le Raspberry Pi 400 à 1800 MHz. Pour ces derniers, le niveau SIMD utilisé est équivalent à Intel SSE. Pire que MP Whetstone, cette fois le Kryo 570, utilisant 8 threads, n'était que trois fois plus rapide que lors du test à un seul thread. Ensuite, une application de surveillance du CPU a indiqué que six cœurs tournaient à 1804 MHz, dont deux à 768 MHz.En termes de coût/performance, le Raspberry Pi 400 était meilleur que l'ordinateur portable Core i5 dans certains des premiers cas, mais moins bon dans d'autres, et il était loin derrière dans les benchmarks qui pouvaient bénéficier d'une compilation utilisant les instructions Intel Advanced Vector. Par rapport au Cray 1, des gains de performance MP allant jusqu'à 400 fois ont été enregistrés.Si l'on considère uniquement les performances du téléphone Android, le processeur ARM plus avancé utilisé a permis des gains significatifs par rapport au Raspberry Pi, mais a perdu l'avantage, en raison de l'architecture big/LITTLE, lors de l'exécution du test MP MFLOPS 8 threads. Néanmoins, le meilleur gain de performance du Cray 1 a été de 757 fois grâce à l'utilisation de plusieurs cœurs.L'étude comparative réalisée par le développeur Roy Longbottom, confrontant le superordinateur Cray-1 de 1976 à la gamme de micro-ordinateurs monocartes Raspberry Pi, est une initiative intéressante qui met en lumière l'évolution spectaculaire de la technologie informatique sur plusieurs décennies. Cependant, l'étude semble principalement axée sur des benchmarks de performances tels que Linpack, Whetstone, et Livermore Loops.Bien que ces tests soient utiles pour mesurer les performances en virgule flottante, ils ne capturent peut-être pas l'ensemble des capacités des supercalculateurs et des micro-ordinateurs, en particulier dans des domaines tels que la gestion de données massives, la connectivité réseau, ou encore l'intelligence artificielle, qui sont des aspects cruciaux dans le paysage informatique moderne.De plus, la comparaison des coûts, des dimensions physiques, et des besoins en énergie entre le Cray-1 et les Raspberry Pi est pertinente pour illustrer l'évolution de l'accessibilité et de l'efficacité énergétique. Cependant, il est important de souligner que ces deux types d'appareils répondent à des besoins très différents. Le Cray-1 était un supercalculateur conçu pour des tâches de calcul intensif, souvent utilisé dans des domaines scientifiques et industriels spécifiques, tandis que les Raspberry Pi sont destinés à une utilisation plus générale et éducative.Par ailleurs, bien que l'étude mette en avant la performance impressionnante des Raspberry Pi par rapport au Cray-1, il est crucial de reconnaître les avancées technologiques considérables qui ont eu lieu au fil des décennies. Les progrès dans la miniaturisation des composants, l'efficacité énergétique des processeurs, et l'amélioration des architectures ont tous contribué à la création d'appareils plus puissants et abordables.Source : Roy Longbottom, Cray 1 Supercomputer Performance Comparisons With Home Computers Phones and Tablets Y a-t-il des limitations dans les tests effectués par Longbottom, et si oui, comment ces limitations pourraient-elles influencer la validité des conclusions tirées de l'étude comparative?La comparaison entre le Cray-1 et le Raspberry Pi est-elle juste, étant donné que ces deux systèmes ont été conçus pour des utilisations différentes à des époques différentes ?Dans quelle mesure les résultats de l'étude de Roy Longbottom sur la confrontation entre le Cray-1 et le Raspberry Pi peuvent-ils être considérés comme représentatifs de l'évolution générale de la technologie informatique ?