Quand le bruit est source d’information

Notre mémoire est une faculté qui oublie. Comparativement aux ordinateurs, nous oublions presque tout.

L’ordinateur est beaucoup plus apte à enregistrer et conserver des informations visuelles que le cerveau humain. Je crois avoir une assez bonne mémoire des noms, des visages et des idées, et quand je marche dans la rue, je pense être conscient de tout ce qui entre dans mon champ de vision. Mais si vous me questionnez sur mon parcours dix minutes plus tard, je serai incapable de me souvenir des affiches de stationnement, du nom des magasins ou du visage des gens que j’ai croisés.

Un ordinateur en sera parfaitement capable.

Si vous entrez un volume massif de données visuelles – toutes les images enregistrées par les caméras d’un véhicule autonome, par exemple – dans un ordinateur doté d’un logiciel d’intelligence artificielle, cet ordinateur sera en mesure de filtrer diverses combinaisons significatives de pixels et de les enregistrer par catégories, comme il le ferait pour un simple document Word.

En d’autres mots, le logiciel d’IA peut transformer un amas de données bruitées en données utiles : des signaux.

Le « bruit » devient une source d’information gérable, et ce n’est pas le bruit qui manque.

Pensez à votre routine matinale d’il y a cinq ans : vous vous levez, vous déjeunez, vous prenez votre auto pour vous rendre au travail, vous stationnez l’auto puis vous entrez au bureau, vous saluez vos collègues, vous vous installez à votre poste de travail et vous commencez à travailler à l’ordinateur ou vous appelez des clients.

Le quotidien dans une grande ville occidentale a considérablement changé depuis. Vous vous réveillez au son d’Amazon Echo, votre téléphone relève le moment de votre réveil et fait le suivi des nouvelles et des courriels que vous parcourez, votre télé observe vos déplacements dans la cuisine, votre montre Fitbit compile vos données biométriques, votre auto connectée enregistre votre itinéraire complet et votre appareil Bluetooth écoute chacune de vos conversations.

Drones, satellites, autos autonomes : ce ne sont que quelques-uns des outils de la nouvelle ville connectée. Certains technologues peuvent même utiliser un routeur Wi-Fi pour créer des images holographiques d’une pièce fermée au moyen de la réverbération et des micro-ondes des signaux Wi-Fi. Les machines et les capteurs sont PARTOUT et sont à la fois de plus en plus sophistiqués et de plus en plus abordables.

Le dilemme de la pertinence des données

Même si vous ne voyez pas ces données, quelqu’un, quelque part, est en train de les classer, de les enregistrer et de les analyser à des fins commerciales. La notion de confidentialité est devenue très relative à notre époque.

Devrions-nous nous en inquiéter?

Voici le problème : une grande partie de ce travail de collecte de données, dont celui rendu possible par l’IA, ne sert qu’à alimenter d’autres systèmes d’IA. Pour fonctionner, tout ce qui relève de l’IA doit avoir accès à un volume massif de données. Des téraoctets de données. Une somme inimaginable pour l’humain.

Selon l’objectif du programme d’IA, les données dont il a besoin peuvent être particulièrement privées : votre emplacement par exemple, ou chaque produit que vous avez considéré avant de vous commander ce chandail en ligne, ou les mots exacts que vous employez dans les textos envoyés à vos amis.

Une entreprise peut-elle justifier, sur le plan éthique, l’accès à de tels renseignements personnels?

En tant que cofondateur d’Element AI, je crois que les entreprises devraient tirer profit de l’intelligence artificielle pour innover et devenir les chefs de file de leur industrie. Mais en tant que citoyen, je me pose la question : suis-je vraiment d’accord pour que des entreprises que je ne connais même pas en sachent autant sur moi?

La transparence, principe fondamental

En théorie, si l’usage commercial de vos données personnelles vous préoccupe, la solution est simple : vous n’avez qu’à demander aux entreprises de vous l’expliquer. D’un point de vue juridique, elles doivent répondre à votre demande.

En réalité, si vous demandez à une entreprise de spécifier la nature des données personnelles qu’elle a recueillies sur vous et l’usage qu’elle en fait, elle vous renverra sans doute aux 12 000 pages d’annexe de ses modalités administratives. Le problème reste donc entier.

 

Divers sondages ont révélé que le pourcentage de gens qui lisent ce genre de modalités se situe entre 8 % et < 1 %.

À mon avis, un trop grand nombre d’entreprises se cachent encore derrière un mur de documents illisibles. Elles sont « transparentes » d’un point de vue technique et juridique, mais en fait elles s’ingénient à dissimuler le mécanisme derrière leur produit.

Malheureusement, c’est un enjeu particulièrement problématique pour les entreprises axées sur l’IA. Il arrive très souvent que les développeurs d’IA de pointe soient incapables de donner un aperçu clair de l’usage qu’ils font des données. Pourquoi? Parce que l’IA se déploie dans plusieurs dimensions, traitant l’information en multiples niveaux et en réseaux. C’est un mode de fonctionnement qu’il est difficile de faire comprendre à monsieur Tout-le-Monde.

Dans ces conditions, comment assurer la transparence?

En général, je m’attends à ce que les gens me communiquent les informations importantes qui me concernent. Je m’attends à ce que mes partenaires d’affaires me transmettent les excellentes idées qu’ils ont eues, comme je m’attends et à ce que mon Boston Terrier me fasse comprendre qu’il a faim. Ça me semble la base d’un bon système de communication.

Nous sommes en droit de nous attendre à la même courtoisie de la part de chaque application, site Web ou autre appareil qui emmagasinent joyeusement nos renseignements (à ce sujet, le site de Tristan Harris, Time Well Spent, vaut le détour).

Je ne crois pas que la transparence en matière de données s’imposera d’elle-même ou par la bonne volonté des entreprises; aucune d’entre elles ne voudra risquer de perdre ses parts de marché en partageant ses données avec la concurrence, à moins que la transparence ne soit inscrite dans les normes de l’industrie. Les règles du jeu doivent être réécrites, sous la pression de consommateurs exigeant plus de transparence ou par une mesure gouvernementale contraignante sur le plan économique. En mai 2017, le journal The Economist annonçait que la valeur des données était maintenant supérieure à celle du pétrole. Par conséquent, nous devrions peut-être comptabiliser les données et en rendre compte dans un bilan d’entreprise…

Qu’en pensez-vous? Y a-t-il certains types de données que vous souhaitez absolument garder confidentiels? L’État devrait-il intervenir dès maintenant?

Donnez-moi votre point de vue sur la question. Je suis impatient de poursuivre la discussion ci-dessous!

J’amorce un retour au blogage et les sujets que j’aimerais approfondir émergent peu à peu (qui sait, ces billets deviendront peut-être les chapitres d’un livre à venir). Je continuerai de me pencher sur ce qui arrive « quand le bruit devient source d’information » pour offrir des réponses plus détaillées en matière de politique et de technologie. J’ai par ailleurs commencé à me pencher sur une autre question : « Pourquoi l’IA ne commence qu’aujourd’hui à remplir ses promesses. » Restez à l’affût et inscrivez-vous à la liste d’envoi si vous souhaitez recevoir les billets par courriel.

 

    Leave a comment