
São Paulo — InkDesign News —
A pesquisa recente em machine learning revelou que arquiteturas mais enxutas podem ser eficazes para análises de sentimento, oferecendo métodos de alta performance com menor custo computacional. Essa abordagem pode democratizar o uso de inteligência artificial para empresas menores.
Contexto da pesquisa
Com a crescente demanda por modelos de AI mais poderosos e a pressão pelos custos elevados de treinamento, autores como Agni Siddhanta e colegas propuseram investigar se modelos mais leves poderiam produzir resultados equivalentes. No estudo, publicado na Procedia Computer Science, os pesquisadores se dedicaram a descobrir como organizações poderiam minerar o sentimento de clientes em tempo real sem depender de recursos computacionais massivos.
Método proposto
A pesquisa utilizou dois robustos backbones de transformadores: MPNet e RoBERTa-Large. Primeiramente, as sentenças de entrada foram convertidas em vetores de comprimento fixo, empregando as técnicas de mean-pooling sobre suas representações em tokens. A seguir, os transformadores foram ajustados com dados rotulados de sentimento, aplicando funções de perda supervisionadas como CosineSimilarity e SoftmaxLoss para aprimorar a precisão da classificação ao promover a separação de sentimentos dissimilares.
Resultados e impacto
Os resultados demonstraram que o modelo RoBERTa-Large, com configuração de afinação CosineSimilarity e XGBoost, alcançou 88,4% de acurácia no conjunto de dados TAS e 95,9% no IMDb. “Esses resultados enfatizam que transformadores pouco ajustados, em combinação com classificadores leves, podem rivalizar com modelos pesados em termos de custos computacionais” ( “These results underscore that carefully fine-tuned sentence transformers plus lightweight classifiers can rival parameter-heavy LLMs—at a fraction of the computational and financial cost.” )
— Agni Siddhanta, Autor Principal, Procedia Computer Science. Além disso, a abordagem treina muito mais rápido: o pipeline completo levou menos de quatro horas para ser treinado em comparação com sete horas para o modelo Meta-Llama-3-8B.
O impacto desta pesquisa pode ser significativo, permitindo que empresas menores implementem análises de sentimento robustas sem a necessidade de investimentos substanciais em hardware. O próximo passo envolve expandir essa metodologia para modelagem de tópicos e sumarização, oferecendo também insights valiosos sobre preocupações emergentes dos clientes.
Fonte: (TechXplore – Machine Learning & AI)