O futuro da pesquisa visual do Google

14-02-2011 17:16

O futuro da pesquisa visual do Google

 

Lançado em 2009, como um novo aplicativo experimental no Google Labs, hoje o Google Goggles está disponível para Android e iOS na forma de um aplicativo gratuito. O Goggles é capaz de pesquisar visualmente uma série de coisas, principalmente objetos e lugares, como livros, pontos de interesse, cartões, desenhos, quadros, rótulos de produtos, logotipos e textos.

Quando o Google Goggles foi lançado, a mídia mundial se surpreendeu com a capacidade do aplicativo em reconhecer elementos visuais de forma rápida e precisa, sem qualquer necessidade de utilizar o teclado para adicionar outros dados. A tecnologia, que parecia ser de última geração, está pronta para dar um novo grande passo.

Com a utilização da tecnologia de reconhecimento óptico de caracteres (OCR) intregado à plataforma do Goggles, o App é capaz de transformar o texto inserido em uma imagem em texto pesquisável na internet, ler códigos de barras, e encontra imagens similares em bancos de dados de artes e monumentos. Entretanto, isso parece ser apenas o início para o Google Goggles.

De acordo com uma patente publicada no último dia 10 de fevereiro, a gigante de Mountain View planeja expandir os recursos do Goggles e torná-lo ainda mais poderoso e inteligente. Em vez de focar as informações em um único objeto por vez, o novo Goggles teria a capacidade de trazer, aos usuários, uma pluralidade de resultados.

A ideia é bem simples. Ao tirar fotos de uma cidade, as imagens tradicionalmente contém prédios, ruas, rostos de pessoas, carros e muitos outros objetos. Com a nova tecnologia do Goggles, o mecanismo de busca seria capaz de quebrar as imagens em partes, buscar os objetos captados, e dar, então, uma combinação de resultados de pesquisa com base em todas essas partes.

Para que isso seja possível, o Google precisaria trabalhar com diferentes tecnologias de reconhecimento de objetos. Segundo o site SEO by The Sea, as tecnologias necessárias seriam:

- uma busca de reconhecimento facial;
- uma pesquisa OCR para textos nas imagens;
- um sistema de busca para reconhecimento de objetos;
- pesquisa de reconhecimento de produtos, o que poderia reconhecer imagens bidimensionais, como capas de livros e CDs, e imagens em três dimensões, tais como mobiliários;
- reconhecimento de códigos de barras;
uma busca de reconhecimento, que poderia fornecer informações sobre determinadas pessoas, lugares e coisas;
- reconhecimento histórico, reconhecendo marcos reais e, possivelmente, imagens de anúncios em outdoors;
- reconhecimento do lugar através de dados georeferenciados por um receptor GPS;
- reconhecimento de cores;
- busca de imagens semelhantes.