Ethernet supporta velocità di trasferimento dati da 10 Mbps fino a 800 Gbps (Gigabit al secondo), con 1.6 Tbps (Terabit al secondo) in arrivo a breve. Queste velocità sono cruciali per gestire gli enormi set di dati che l'IA utilizza in genere.
- Reattività in tempo reale: La bassa latenza è essenziale per i sistemi AI. Ethernet riduce al minimo i ritardi, garantendo interazioni tempestive tra componenti come GPU, CPU e dispositivi di archiviazione.
- Processo decisionale in tempo reale: Ethernet consente di prendere decisioni in tempo reale basate sull'intelligenza artificiale. La sua elevata larghezza di banda garantisce una comunicazione efficiente tra i nodi AI.
- Rete senza perdite: L'Ethernet tradizionale può perdere pacchetti durante la congestione, influenzando l'accuratezza del modello AI. Tuttavia, le tecnologie emergenti promettono una trasmissione "senza perdite", garantendo l'integrità dei dati anche sotto carichi pesanti.
- Scalabilità: Man mano che i modelli di intelligenza artificiale aumentano in complessità, l'infrastruttura scalabile diventa vitale. Ethernet consente un'espansione senza soluzione di continuità collegando server e dispositivi aggiuntivi. Ethernet si adatta alla loro crescita esponenziale, garantendo connettività e scambio di dati efficienti.
- Interoperabilità basata su standard: Garantire bassa latenza e prestazioni senza perdite è essenziale per le applicazioni di intelligenza artificiale che desiderano massimizzare i vantaggi di Ethernet terabit. Teledyne LeCroy supporta quindi sia Specifiche dell'Ultra Ethernet Consortium (UEC) e gli standard IEEE.
- Percorso di soluzioni AI e UE:
Un set dedicato di funzionalità con licenza che offre le capacità di test più avanzate per la verifica dell'utilizzo di Ultra Ethernet nelle applicazioni di intelligenza artificiale.
(Per saperne di più)
Ultra Ethernet è progettato per soddisfare le esigenze specifiche degli ambienti AI e HPC, tra cui picchi di traffico sincronizzati, latenza ultra-bassa, ripristino rapido in caso di perdita di pacchetti e prestazioni prevedibili a velocità fino a 1.6 Tbps (utilizzando SerDes a 224G) e 3.2 Tbps (utilizzando SerDes a 448G).
Ultra Ethernet migliora l'architettura di Ethernet standard con iniziative quali il retry a livello di collegamento, la gestione avanzata della congestione e un comportamento di trasporto ottimizzato dall'IA, per garantire prestazioni più deterministiche in condizioni di traffico AI reali.
La validazione delle reti UE richiede test approfonditi e consapevoli del protocollo a livello di frame, simbolo e fabric. Dalla scoperta delle funzionalità tramite estensioni LLDP specifiche per UE, al recupero localizzato delle perdite e al controllo intelligente del flusso, i test Ultra Ethernet si concentrano sulla garanzia che i dispositivi interagiscano correttamente e in modo coerente in implementazioni di IA e HPC su larga scala e ad alte prestazioni.
Teledyne LeCroy offre soluzioni hardware e software avanzate per il collaudo di Ultra Ethernet, l'infrastruttura di rete utilizzata per le applicazioni di intelligenza artificiale.
Questi includono i generatori di traffico Z800 Freya e Z1608 Edun che possono generare traffico a velocità fino a 800 Gbps e 1.6 Tbps utilizzando sia SerDes da 112 G che SerDes da 224 G, e il SierraNet Analizzatore di protocollo M1288 per l'acquisizione a piena velocità di linea e funzionalità di disturbo avanzate fino a 800 Gbps.
Oltre alle complete funzionalità di test fornite di serie con questi dispositivi, è disponibile anche Xena AI & UE Solution Track, che aggiunge comportamenti del livello di collegamento specifici per UE, necessari per la convalida di switch e xPU abilitati per UEC. Questi includono:
-
Tentativi di riconnessione a livello di collegamento (LLR)
-
Controllo dei flussi basato sul credito (CBFC)
-
Negoziazione a livello di collegamento (LLDP per estensioni UE)
-
Controllo stateful del protocollo UE e scambio di messaggi
-
Iniezione di errori UE, ispezione dei messaggi e acquisizione
Per saperne di più su come differiscono le architetture Ethernet scale-up e scale-out, perché Ultra Ethernet è importante e cosa serve per testare con sicurezza le reti AI di prossima generazione, vedere
https://xenanetworks.com/ultra-ethernet-testing/
Le architetture dei data center per i carichi di lavoro di intelligenza artificiale adottano spesso una struttura "spine-and-leaf", collegando migliaia di acceleratori di intelligenza artificiale e soluzioni di storage attraverso un'infrastruttura di rete L2/L3 a bassa latenza con velocità di porta di 400-800 Gbps. RDMA su Ethernet convergente (RoCE) è una scelta promettente per i protocolli di trasporto dei dati di storage.
- Bridge per data center (DCB): facilita il trasporto ad alta velocità, bassa latenza e senza perdita di pacchetti di pacchetti RDMA (traffico senza perdita) insieme al normale traffico best-effort (traffico con perdita).
- Controllo del flusso prioritario (PFC): per impedire la perdita di pacchetti chiedendo al mittente di sospendere temporaneamente l'invio dei pacchetti quando un buffer si riempie oltre una certa soglia.
- Notifica di congestione (CN):RoCEv1 e RoCEv2 implementano una segnalazione tra dispositivi di rete che può essere utilizzata per ridurre la congestione che si diffonde nelle reti lossless, oltre a diminuire la latenza e migliorare la tolleranza ai burst.
- Selezione del traffico avanzata (ETS): consente l'assegnazione di una larghezza di banda minima garantita a ciascuna Classe di Servizio (CoS).