LegoGPT utiliza machine learning para projetar estruturas estáveis

Pesquisadores da Carnegie Mellon University desenvolveram uma aplicação de IA que utiliza machine learning para projetar estruturas estáveis a partir de LEGO usando prompts textuais. O estudo foi publicado no arXiv e promete revolucionar a maneira como os modelos generativos lidam com a estabilidade estrutural.
Contexto da pesquisa
A equipe buscou melhorar modelos 3D generativos que frequentemente geram designs inviáveis devido a problemas de gravidade e desconexão. Para isso, optaram pelos LEGOs, que permitem a construção de estruturas imaginativas, e repurposaram um modelo de linguagem de grande porte (LLM) da META, conhecido como LLaMA-3.2-1B-Instruct.
Método proposto
O sistema alterna previsões de palavras por previsões de blocos. Um módulo matemático separado garante a estabilidade física, considerando forças estruturais e gravidade. Para treinar o modelo, a equipe criou um dataset contendo 47.000 estruturas de LEGO estáveis, com legendas geradas por um sistema de IA.
“Para criar um design, o sistema utiliza uma abordagem recursiva, testando a estabilidade a cada adição de bloco.”
(“To create a design, the system takes a recursive approach—bricks are placed and then tested to see if adding them causes instability.”)— Ava Pun, Pesquisadora, Carnegie Mellon University
Resultados e impacto
Os testes mostraram uma taxa de estabilidade de 98,8% com a implementação de uma função de rollback, em contraste com apenas 24% sem essa funcionalidade. Além disso, a equipe utilizou robôs programáveis para construir as estruturas geradas. As comparações com outros sistemas de IA mostraram que sua abordagem gerou uma maior porcentagem de estruturas estáveis.
Esses resultados indicam não apenas o potencial do modelo, mas também seu impacto em áreas como design de produtos e educação, onde ferramentas interativas de construção podem estimular a criatividade e a aprendizagem. Os próximos passos incluem a adição de capacidades de cor e textura ao sistema, aprimorando ainda mais a experiência do usuário.
Fonte: (TechXplore – Machine Learning & AI)