
SketchAgent es un sistema desarrollado por el MIT CSAIL y la Universidad de Stanford que enseña a los modelos de lenguaje multimodal a dibujar paso a paso, imitando el proceso de boceto que usamos los humanos. La herramienta utiliza un lenguaje de dibujo estructurado y no requiere entrenamiento con dibujos humanos previos. SketchAgent puede funcionar de manera autónoma o colaborativa, generando dibujos que imitan la manera en que una persona podría ir probando, editando y perfeccionando un boceto. El sistema ha sido probado con varios modelos, siendo Claude 3.5 Sonnet el más eficaz. Aunque tiene limitaciones, SketchAgent podría tener un papel importante en sectores como la educación, terapias y juegos creativos.