Facebook e non vedenti: intelligenza artificiale per descrivere le foto

Uno dei maggiori problemi di facebook, è il sempre più frequente contenuto basato esclusivamente su immagini; dopo la mossa di Twitter, che sulle sue app mobili ha consentito agli utenti di aggiungere una descrizione sulle immagini pubblicate, Facebook ha compiuto un passo ancora più evoluto: utilizzerà una intelligenza artificiale per descrivere le foto! Per cui, sull'app iOS, per ora solo nella versione in inglese, quando verrà visualizzata una fotografia nell'home feed di facebook, VoiceOver descriverà a parole ciò che l'intelligenza artificiale avrà rilevato nell'immagine.
Il sistema si chiama AAT (Automatic Alternative Text), e tramite un evoluto sistema di riconoscimento oggetti, scansiona le immagini e crea automaticamente un testo alternativo (il classico tag ALT) che verrà letto come una normale immagine HTML etichettata.
Per ora ha delle limitazioni: può dire "quattro persone sorridenti", ma non per esempio "Chiara Marco Gianni e Paolo sorridono"; quando c'è un meme o uno screenshot, si limita a dire "contains text", senza però leggere il testo.
Ci sono alcune perplessità da parte di molti, che temono questo riconoscimento immagini possa essere un ulteriore strumento di rilevamento dati per inviare pubblicità agli utenti, e per questo motivo ho il timore che facebook dia la possibilità di disattivare la scansione; se così accadesse, sussisterebbe il rischio di vedersi 90 utenti vedenti su 100 che disattivano la funzione rendendo a noi disabili visivi inaccessibile la fruizione di foto su facebook come prima; per adesso, questa funzionalità è presente solo impostando il telefono in inglese e come zona geografica Stati Uniti, ma con il tempo verrà ampliata la fruizione anche nel resto del mondo.
Seguiranno ulteriori approfondimenti.

Alcune considerazioni

Questa intelligenza artificiale è un ottimo punto di partenza, per poter avere la consapevolezza nel modo migliore possibile, di quanto viene pubblicato sui social network.
Non è e non dev'essere, però, il punto di arrivo, perché rimane pur sempre una macchina: l'inclusione sociale, deve avvenire grazie alla sensibilizzazione e spontaneità della gente, le macchine sono soltanto un aiuto: descrivere è un conto, rendere partecipi è un altro!
Infatti, c'è una bella differenza tra questa descrizione esemplificativa, potenzialmente creata da una macchina. "Questa immagine potrebbe contenere: cane su divano".
E quest'altra, che potrebbe invece aver scritto il padrone del cane, volendo rendere tutti partecipi di quanto pubblicato, indipendentemente dalla disabilità:

Vita da cani. Quando Argo occupa il divano, si mette a pancia all'aria, stende le zampe, e per noi umani non è più possibile sedersi. Vorrei io fare la vita sua!

Staremo a vedere, e approfondiremo ulteriormente, l'evoluzione di questo innovativo progetto.

Aggiornamento su questione lettura screenshot

Si apprende da Matt King, uno degli sviluppatori che lavora all'accessibilità di facebook, che loro sono perfettamente consapevoli che al momento la loro funzione non riconosce le immagini contenenti testi.
Per non ritardare troppo il lancio di questa funzione di accessibilità, hanno preferito quindi rilasciarne una versione meno completa, ma la cui funzione principale ovvero il riconoscimento oggetti e persone, fosse abbastanza matura da definirsi utilizzabile dal pubblico.
Il progetto è in corso di evoluzione, nel tempo, per cui ci aspettiamo ulteriori sviluppi nel medio-lungo periodo.

Tags: