Google il riconoscimento facciale delle immagini: Visual Search

Il riconoscimento facciale consiste nella verifica dell’identità di un individuo attraverso i tratti somatici del viso.

Da un punto di vista tecnico il riconoscimento facciale non è altro che un particolare problema di “object recognition” nel quale gli oggetti da riconoscere presentano particolari proprietà che li accomunano (es. posizione di occhi, bocca e naso) ed altre, più sottili, che permettono di distinguerli (es. lineamenti e forma del viso).

Tra i principali algoritmi per il riconoscimento facciale annoveriamo:

  • PCA 
  •  ICA
  • LDA  EP
  • EBGM
  • Metodi di Kernel
  • Trace Transform 
  • AAM
  • D Morphable Model 
  • 3-D Face Recognition
  • Bayesian Framework
  • SVM 
  • HMM

Ma tutto questo cosa centra? Partiamo da lontano…da alcuni post di Seobythesea

In questo contesto troviamo… Google Goggles che ci consente, attraverso una foto scattata direttamente da un cellulare, di trovare informazioni correlate ad essa; per esempio facendo una foto al codice a barre di un libro possiamo immediatamente ricevere informazioni sull’autore o sull’opera . Recentemente Google ha pubblicato un brevetto che potrebbe essere l’evoluzione dell’algoritmo di Visual Search: ipotizziamo di scattare una foto in centro a Milano, all’interno dell’inquadratura potrebbero apparire volti di persone, oggetti, cartelli stradali e via dicendo. Inviando tale stream di dati, il motore potrebbe suddividere l’immagine in porzioni, per cercare di analizzare separatamente gli oggetti raffigurati in essa.

Il brevetto è il seguente:

User Interface for Presenting Search Results for Multiple Regions of a Visual Query
Invented by David Petrou and Theodore Power
US Patent Application 20110035406
Published February 10, 2011
Filed: August 4, 2010

Un estratto recita:

A visual query such as a photograph, screen shot, scanned image, or video frame is submitted to a visual query search system from a client system. The search system processes the visual query by sending it to a plurality of parallel search systems, each implementing a distinct visual query search process.

A plurality of results is received from the parallel search systems. Utilizing the search results, an interactive results document is created and sent to the client system. The interactive results document has at least one visual identifier for a sub-portion of the visual query with a selectable link to at least one search result for that sub-portion.

The visual identifier may be a bounding box around the respective sub-portion, or a semi-transparent label over the respective sub-portion. Optionally, the bounding box or label is color coded by type of result.

Come funziona?

Ho la seguente immagine

visual-google

Il sistema di ricerca visiva suddivide l’immagine  in diversi segmenti di ricerca:
riconoscimento-facciale-google2

I risultati vengono visualizzati sulla medesima immagine come link di testo:

riconoscimento-facciale-v3

Alla fine viene prodotto un mix di risultati suddivisi in categorie:

riconoscimento-v4

l passo successivo che vorrebbe fare Google è quello di applicare algoritmi di riconoscimento visivo e facciale per individuare personaggi famosi, monumenti od opere d’arte attraverso l’analisi delle immagini.

Per effettuare un ricerca di riconoscimento facciale, Google potrebbe utilizzare le immagini raccolte dal web e di pubblico dominio.

Ovviamente per fare questo Google dovrebbe accedere ad un gran numero di immagini e di informazioni e meta informazioni contenute in esse. Ma una delle maggiori fonti di immagini, come ben sappiamo, sono i social network come Facebook e Twitter, Flickr e Picasa Web Album.. e via dicendo…

Google potrebbe sfruttare questi dati per migliorare gli algoritmi ed essere in grado di dirvi chi è il soggetto rappresentato nella foto… pazzesco.. vero..? o pauroso?

Il brevetto è il seguente:

Facial Recognition with Social Network Aiding
Invented by David Petroum, Andrew Rabinovich, and Hartwig Adam
US Patent Application 20110038512
Published February 17, 2011
Filed: August 5, 2010

Un astratto recita:

A facial recognition search system identifies one or more likely names (or other personal identifiers) corresponding to the facial image(s) in a query as follows. After receiving the visual query with one or more facial images, the system identifies images that potentially match the respective facial image in accordance with visual similarity criteria.

Then one or more persons associated with the potential images are identified. For each identified person, person-specific data comprising metrics of social connectivity to the requester are retrieved from a plurality of applications such as communications applications, social networking applications, calendar applications, and collaborative applications.

An ordered list of persons is then generated by ranking the identified persons in accordance with at least metrics of visual similarity between the respective facial image and the potential image matches and with the social connection metrics. Finally, at least one person identifier from the list is sent to the requester.

 

Il Visual Search di Google un giorno ci potrà offrire risultati di ricerca che includeranno tecniche di riconoscimento facciale (catturate attraverso un mix di ricerche all’interno dei social network).. il futuro nasconderà molte sorprese… speriamo che la nostra privacy venga comunque rispettata…

voi cosa ne pensate?

Share