No início deste mês, nós ficamos sabendo que a Apple liberou seus pesquisadores para publicar descobertas referentes a inteligência artificial, o que anteriormente era estritamente proibido.
Já aproveitando dessa liberdade, foi publicada no dia 22 de dezembro a primeira pesquisa — intitulada “Learning from Simulated and Unsupervised Images through Adversarial Training” (algo como “Aprendendo com Imagens Simuladas e Não-Supervisionadas através do Treinamento de Eventos Adversos”). Basicamente, ela mostra um programa muito similar ao reconhecimento facial/de objetos que já existe no app Fotos, porém de maneira mais avançada.
Neste trabalho, propomos aprendizagem de simulação + não-supervisão, cujo objetivo é melhorar o realismo das imagens sintéticas a partir de um simulador, utilizando dados reais não-marcados. O realismo aprimorado permite o treinamento de melhores modelos de aprendizagem de máquina em grandes conjuntos de informações sem nenhuma coleta de dados ou anotação humana.
Na pesquisa, a Apple discorre sobre os pontos positivos e negativos de se utilizar imagens sintéticas no processo de reconhecimento facial/de objetos. É muito mais fácil (e também mais barato) usar imagens geradas por um computador (que já são automaticamente marcadas, identificadas) do que imagens reais, que precisam ser identificadas uma a uma, por um ser humano. Entretanto, perde-se qualidade e o “realismo” quando a imagem é sintética.
Assim como pode-se ver na ilustração acima, imagens sintéticas são bem diferentes das reais. Quando o programa baseava-se nelas, o “julgamento” do que era aquele objeto era ou inexistente ou errôneo. Por isso, a pesquisa trouxe uma maneira mais fácil de fazer o processo, passando a imagem sintética pelo que foi chamado de refiner (refinador), a fim de conseguir transformá-las em algo muito mais realista, baseando-se em imagens reais — melhorando, assim, a qualidade do reconhecimento.
A pesquisa se estende por este assunto, mostrando o processo de cada experimento feito tanto qualitativamente quanto com um estudo de usuário. O trabalho apresenta apenas imagens (olhos e mãos formando palavras e/ou letras da língua de sinais americana), porém a equipe de pesquisa da Apple explicita que espera iniciar o mesmo tipo de testes com vídeos.
[via MacRumors]