
Microsoft Research propone ADeLe, un sistema que analiza qué habilidades requiere una tarea y si el modelo las posee. ADeLe evalúa 18 tipos de capacidades cognitivas y de conocimiento, y se ha probado con más de 16.000 ejemplos de 63 tareas distintas. Los resultados muestran que los modelos muestran perfiles de habilidad distintos y que el tamaño del modelo importa, pero no lo es todo. ADeLe puede predecir fallos antes de que ocurran con una precisión del 88% en modelos como GPT-4 o LLaMA-3.1-405B.