EXO Labs ha creado un sistema que combina 2 NVIDIA DGX Spark con un Mac Studio M3 Ultra para mejorar el rendimiento en inteligencia artificial. Cada NVIDIA DGX Spark tiene 4 veces mayor potencia de cómputo que el Mac Studio y el M3 Ultra tiene 3 veces mayor ancho de banda que el Spark. En pruebas con el modelo de IA Llama-3.1 8B, el sistema logró una mejora de 2,8 veces en comparación con el Mac Studio solo. Un solo NVIDIA DGX Spark es 1,9 veces más rápido que el Mac Studio en tareas de inferencia. El sistema EXO 1.0 combina los puntos fuertes de cada dispositivo para lograr un rendimiento superior en IA. La prueba se realizó con un prompt de 8.192 tokens y generando 32 tokens, lo que dio como resultado un tiempo de prefill de 1,47 segundos y un tiempo de decode de 0,85 segundos, para un total de 2,32 segundos. Esto supone una mejora del 90% sobre el Mac Studio solo. La combinación de dispositivos logra aprovechar al máximo la potencia de cálculo y el ancho de banda para mejorar el rendimiento en IA.