(Français) Bienvenue dans le futur : Utiliser les données de Google pour résoudre les problèmes mondiaux

Nous sommes le jour avant l’élection présidentielle américaine et presque tous les sondages prédisent que Hillary Clinton va gagner. Ces mêmes sondages annoncent aussi une participation des électeurs supérieure à celle qu’elle sera réellement.

Mais alors que s’est-il passé ? Le contraire de ce que les sondages nous ont indiqué : il y a moins de gens qui se sont montrés aux isoloirs, et comme on le sait déjà, Donald Trump a étonnamment gagné.

Mais est-ce que sa victoire était vraiment une surprise ? Selon les sondages, oui. Cependant d’après les données de Google, c’est une toute autre histoire.

Seth Stephens-Davidowitz, l’auteur d’Everybody Lies (Tout Le Monde Ment en français), argumente qu’on a la capacité de voir ce que les gens pensent vraiment en utilisant Google Trends.

Il a cherché à évaluer les chances de Donald Trump en s’intéressant à différents indices que fournit Google Trends. En premier lieu, il a trouvé un indicateur intéressant que l’on n’a jamais considéré : l’ordre chronologique des recherches des candidats sur Google. Par exemple, une recherche qui inclut à la fois Donald Trump et Hillary Clinton, mais dont “Trump” est écrit avant elle, suggère que le chercheur est plus susceptible de voter pour Trump que Clinton. Et c’est vrai que, selon l’auteur et son collègue, Stuart Gabriel de l’université de Californie à Los Angeles, les dernières trois élections présidentielles étaient gagnées par “le candidat qui apparaîtrait d’abord en premier dans le plus de recherches.”

Suite à quoi l’auteur et son collègue examinent d’autres indices qui semblaient, de prime abord, intéressants mais finissent par être extrêmement inquiétants. Bien que beaucoup de sondages ont prédit qu’Hillary Clinton gagnerait les états du Midwest, il y avait de plus de recherches pour “Trump Clinton” que “Clinton Trump” – et on a bien vu que Trump a gagné dans ces états. De plus, Stephens-Davidowitz a trouvé que les sondages ont surestimé la participation des électeurs noirs avant la sortie des résultats. Il a trouvé que, malgré que  les sondages ont prédit une forte participation des Afro-Américains aux élections, le nombre de recherches Google sur les informations de vote était curieusement faible dans les régions dominée par la population noire. Finalement, en regardant les facteurs qui pourraient jouer un rôle dans la victoire de Trump, Nate Silver a trouvé que la variable la plus corrélée avec le soutien, selon lui, par région aux Etats-Unis était le nombre de recherches pour le mot “n****r.” Ce n’était pas le taux de chômage ou l’opposition au Président Obama, c’était le nombre de recherches de l’un des mots les plus racistes dans le vocabulaire américain.

Selon l’auteur, on dirait à Google des choses qu’on se dispenserait de dire en public. Google, se comporte comme une ressource. En effet il connaît plus encore vos pensées secrètes que votre entourage. Comme on le lit dans le livre, on ne posera jamais une question raciste à quelqu’un alors qu’on voit bien qu’elles sont communément demandées sur Google.

Et comment ça marche ? Vous pouvez tout simplement trouver un nombre innombrable d’éléments différents : le nombres de recherches d’un terme ou d’une phrase, une comparaison entre la fréquence d’une recherche et un autre nombre comme le taux de chômage par exemple, etc.

Bien qu’il y ait des usages du Big Data avec de mauvaises intentions, on peut utiliser Google Trends dans le but de construire un monde meilleur. Un exemple dispensé par le livre est  la possibilité de voir les symptômes des maladies avant un diagnostic médical. En effet, certaines personnes cherchent au milieu de la nuit sur Google pourquoi ils ressentent les symptômes d’une maladie. Donc il y a la possibilité de comparer le taux de ces recherches par rapport au taux de certaines maladies.

Ainsi, on voit un exemple d’une nouvelle manière qui pourra nous donner des perspectives et  une idée du comportement humain.

Stephens-Davidowitz a également écrit que les données chez Google nous permettent de voir mieux la réalité par rapport aux sondages et enquêtes car comme on le sait Tout Le Monde Ment (titre de son livre).

Appliquant cette logique de nos jours, l’université d’Harvard a sorti son sondage politique  précisant que “37% des Américains sous l’âge de 30 ans” ont dit qu’ils vont “définitivement voter” en 2018, une augmentation par rapport au passé. Il faudrait examiner à l’aide de Google Trends le nombre de recherches en quête d’informations sur le vote, en remarquant un lieu de grande concentration majoritairement de la jeunesse ainsi que de voir si elle a augmenté.

Grâce aux écrits de Seth Stephens-Davidowitz, on dispose maintenant d’une autre solution pour résoudre nos problématiques. Un nouveau livre est basé sur une vieille phrase : “Take what people say with a grain of salt”.

Par Noah Levy.
Image de couverture : Vote estimates by Congressional district provided by Civis Analytics ; Google search estimates from 2004-7 by Seth Stephens-Davidowitz.

Leave a Reply

Your email address will not be published. Required fields are marked *