
Machine Learning e Inteligência Artificial: Avanços na Distinção de Textos Humanos e Gerados por Chatbots
São Paulo — InkDesign News — Pesquisadores têm explorado a capacidade de machine learning para distinguir textos escritos por humanos de conteúdos gerados por inteligência artificial (IA), revelando a complexidade deste desafio e suas implicações na educação e na comunicação digital.
Contexto da pesquisa
A crescente utilização de chatbots para a produção de conteúdo está gerando preocupações em diversos setores, incluindo o acadêmico. Diversas pesquisas têm mostrado que a capacidade de identificar textos gerados por AI é limitada, pois mesmo especialistas em linguística têm dificuldade para diferenciar as produções. Um estudo de 2021 revelou que participantes não conseguiram distinguir entre histórias e artigos gerados por humanos e pelo ChatGPT.
Método proposto
Para fundamentar essa análise, um método chamado Burrows’ Delta tem sido aplicado, que analisa a frequência de palavras comuns em diferentes textos. Estudos recentes apresentaram também modelos de linguagem BERT, que são treinados com grandes volumes de textos humanos e gerados por chatbots. Esses modelos demonstraram uma acurácia que varia de 80% a 98% na detecção de textos gerados por IA.
Resultados e impacto
Os resultados evidenciam a eficácia de técnicas de estilometria na análise de textos. Apesar de Burrows’ Delta exigir um volume significativo de texto para entregas precisas, os modelos BERT apresentam soluções mais flexíveis. Entretanto, as métricas de performance, embora promissoras, ainda enfrentam desafios, uma vez que a evolução constante dos modelos de AI pode alterar características detectáveis em seus textos. “A distinção entre textos humanos e não humanos pode ser traiçoeira”, admite um dos modelos analisados. fala traduzida(“Distinguishing human from nonhuman prose can be tricky”)— Fonte: Estudo não especificado.
Diante dessa discussão, as aplicações práticas incluem a possibilidade de implementar ferramentas de detecção em plataformas educacionais e redes sociais, visando à integridade acadêmica e à confiabilidade das informações. A pesquisa continua, com a expectativa de desenvolver modelos que sejam mais transparents e eficazes na identificação de autoria.
Fonte: (TechXplore – Machine Learning & AI)