banner
Maison / Blog / Arm se rapproche de la création complète
Blog

Arm se rapproche de la création complète

May 14, 2024May 14, 2024

Il faut trop de temps pour mettre en place un nouveau moteur de calcul sur le terrain, et tout le monde s'en plaint. Les clients sont impatients car ils veulent plus de performances et le meilleur rapport qualité-prix qui accompagne toujours une nouvelle génération de puces. Et ceux qui fabriquent des CPU, des GPU et d’autres moteurs de calcul sont également impatients. Ils veulent écraser la concurrence et gagner plus d’argent.

Lors du Hot Chips 2023 cette semaine, alors qu'Arm Ltd présentait ses cœurs « Demeter » V2 juste après avoir annoncé sa (à nouveau) introduction en bourse, la société a également déployé les sous-systèmes de calcul « Genesis » N2, ou le package intellectuel CSS en abrégé. . (Nous aborderons séparément l’analyse approfondie du noyau V2.) Cet effort Genesis a une chance de mettre les processeurs Arm sur le terrain plus rapidement que cela n’a été possible dans le passé.

Au fil des années, Arm s'est rapproché de plus en plus de la création de processeurs à part entière que les clients pourront modifier et commercialiser plus directement. À la fin des années 2000, lorsque Arm avait repris les smartphones et que les fabricants de serveurs réfléchissaient à la façon dont l'architecture Arm pourrait améliorer une architecture X86 qui était essentiellement un monopole, les concepteurs de puces de serveur ont commencé avec une licence d'architecture Arm et l'ont fait. Il s'agissait d'un moyen très coûteux et long de créer une puce de serveur, bien que mieux que de commencer avec un ISA personnalisé, pour lequel le monde n'aurait aucune tolérance en raison du travail massif de portage de logiciels.

Après de nombreuses tentatives infructueuses de puces de serveur Arm – de la part de géants des semi-conducteurs établis comme Broadcom, Qualcomm, AMD et Samsung ainsi que de startups comme Calxeda et Applied Micro – et d'un succès limité de Cavium avec ses processeurs ThunderX et ThunderX2, Arm a décidé de réussir. un peu plus facile avec son effort Neoverse, qui a été déployé en octobre 2018 et qui a fourni non seulement une feuille de route pour les cœurs de puces de serveur, mais aussi des architectures de référence pour les transformer en processeurs appropriés avec un mélange d'autres propriétés intellectuelles d'Arm telles que celles sur matrice. interconnexions maillées et mémoire tierce, contrôleurs PCI-Express et contrôleurs Ethernet. Ces conceptions Neoverse ont été adaptées à des nœuds de processus spécifiques chez Taiwan Semiconductor Manufacturing Co, ce qui a permis aux fabricants de puces de serveur d'évoluer encore plus facilement et plus rapidement.

Nous n'avons jamais su si Neoverse était moins cher ou plus cher qu'une licence d'architecture. Vous pourriez argumenter de différentes manières. Neoverse a effectué une plus grande partie du travail, mais des degrés de liberté limités par rapport à une licence architecturale Arm. Peut-être plus important encore, comme nous l'avons souligné il y a un an dans Arm Is the New RISC/Unix, RISC-V Is The New Arm, si Arm ne peut pas être moins cher que le RISC-V ISA et ses conceptions, qui sont open source, il peut être plus rapide. De toute façon, Arm doit être plus rapide en raison de l'impatience des clients.

Voici la dernière feuille de route de Neoverse, dévoilée en septembre 2022 :

À l’origine, il n’existait qu’une seule famille de cœurs – la série N – mais Arm l’a divisée en trois familles de cœurs et trois plates-formes correspondantes, chacune destinée à différentes parties du marché des systèmes. Les cœurs et plates-formes de la série N étaient destinés aux charges de travail de serveur grand public où les performances par watt étaient déterminantes dans la conception, tandis que la série V avait un traitement vectoriel plus lourd et était destinée à des charges de travail plus gourmandes en calcul telles que la formation et l'inférence de l'IA et la simulation et la modélisation HPC. La série E était destinée au calcul à haut débit et optimisée non seulement pour des performances par watt plus élevées, mais aussi pour le plus grand débit dans une enveloppe thermique encore plus faible que celle que la série N pouvait offrir. Désormais, il n'y aura plus seulement trois familles de cœurs et de plates-formes, mais deux approches : le DIY et le CSS, pour ainsi dire.

Alors maintenant, la nouvelle feuille de route Neoverse ressemble à l'option CSS intégrée :

Nous avons ajouté les noms de code pour chaque noyau et plate-forme là où nous les connaissons.

L’effort de Neoverse a permis aux fabricants de puces d’avoir une longueur d’avance sur leurs conceptions, et beaucoup l’ont fait. Fujitsu a commencé bien plus tôt que n'importe lequel des fournisseurs actuels – des années avant les efforts de Neoverse – avec sa puce A64FX et pourrait être considérée comme l'implémentation « Kronos » V0 à bien des égards, puisqu'elle a inventé les extensions vectorielles évolutives et les a portées au 512. -bit vectoriel extrême de l'Intel AVX-512. Amazon a utilisé le « Maya » Cortex A72 dans la pile Neoverse originale dans sa puce Graviton1, le « Ares » N1 dans sa puce Graviton2 et le « Zeus » V1 dans sa puce Graviton3. Nvidia a initialement utilisé sa licence d'architecture Arm pour créer ses processeurs de serveur « Denver » il y a plus de dix ans, mais est passé aux cœurs V2 pour les puces CPU « Grace » qui arrivent maintenant sur le marché. Ampere Computing avait des cœurs N1 dans ses processeurs Altra et Altra Max Arm, mais fabrique désormais des cœurs personnalisés. Alibaba a apparemment créé un cœur Arm v9 personnalisé pour son processeur Yitian 710, et si cela est vrai, alors Grace de Nvidia n'a pas les premiers cœurs Arm v9 sur le marché. Le gouvernement indien utilise les cœurs V1 dans son processeur « Aum » A48Z.