Une définition problématique des données massives ou méga-données permet de comprendre les questions qui se posent aujourd’hui :
Les méga-données forment de géantes bases de données (lesquelles sont à la fois massives, de structures variées et souvent en quasi-temps réel), qui alimentent des systèmes informatiques dont les algorithmiques permettent de reconnaître des formes par apprentissage automatique et d’inférer des prédictions dans des domaines les plus variés (recherche, commerce, police, santé, finance, traduction…) |
Les progrès spectaculaires de l‘Intelligence Artificielle dans la reconnaissance de formes reposent sur les big data pour entrainer des réseaux de « neurones formels ». Chaque terme de la définition des méga-données mériterait une discussion problématique. On peut au moins retenir deux grandes questions.
1. Les données massives, une nouvelle forme de perception du monde ?
Fondée sur l’analyse de données que certains appelent « brutes », la reconnaissance artificielle modifie notre perception du monde. Les nouvelles possibilités de saisie (capteurs, Web, Internet des objets, biométrie, métadonnées…), de stockage (bases NoSQL, fermes de données, nuage informatique…) et de calcul (processeurs, grappes de serveurs, calcul parallèle…) ont révolutionné le domaine de la reconnaissance de formes sur données massives:
– recherche de régularités (fouille de données, apprentissage automatique par réseaux de neurones formels…) et de singularités (signaux faibles, réduction de variables, sévérité d’événements aléatoires…), et donc la découverte de phénomènes que nous ne pouvions pas percevoir;
– mais cette reconnaissance de formes se fait dans une non-explicitation de ces découvertes (sans transparence possible des calculs et sans catégories qui seraient débattables) ou même une non-compréhension de ces phénomènes (un déluge de données décontextualisées ne menant qu’à un déluge de corrélations).
Voir ce diaporama de B. Fallery (2013), voir les pages 76-77 de l’ouvrage SI et Management, et voir cette sélection de liens :
- Fin de la théorie : le déluge de données rend la méthode scientifique obsolète, le grand débat posé par Chris Anderson dès 2008;
- Six provocations à propos des Big data, les questions posées par Danah Boyd et Kate Crawford dès 2011, toutes les données ne sont pas équivalentes;
- Prédire n’est pas expliquer, le débat épistémologique avec une note de lecture de Françoise Balibar (2012), à propos du livre La science gouvernée de J.P. Malrieu;
- Intelligence Artificielle et Big Data, une convergence révolutionnaire, par Bastien L. en 2018 sur le site Lebigdata;
- Le livre blanc sur le Big Data, par Smile.eu (mise à jour 2019), tendances, solutions, cas d’usage… (téléchargé plus de 25.000 fois).
.
2. Les données massives, une nouvelle idéologie techniciste ?
L’utilisation « directe » et « sans filtre » de masses de données revendique une objectivité très contestable, car de simple traces ne deviennent des données qu’au travers d’une mesure, laquelle n’est pas neutre. Et l’exploitation de ces traces est au service d’une gouvernementalité algorithmique :
– Corrélations abusives ? place de l’interprétation ? un savoir sans trace de « celui qui sait » ? dangers dans le domaine médical ? choix des jeux de données et des métriques ? biais ? incontestabilité ?
– Big brother, religion du dataïsme, surveillance, classements, recommandations, société du contrôle, tracing et tracking, menaces pour la vie privée, association des individus à des profils potentiels, flou juridique, RGPD…
Voir par exemple cette sélection de liens :
- La data et les algorithmiques (2018), une présentation vidéo de Antoinette Rouvray sur l’idéologie technique des big data (les biais, les métriques, les discriminations, la gouvermentalité…) et ses articles avec Thomas Berns en 2010, en 2013 et en 2014;
- Big Data, algorithmes et marketing : rendre des comptes (2016), article de C. Benavent sur les biais et donc sur la nécessaire redevabilité des algorithmes;
- Quand Big Data menace de devenir Big Brother (2014), un clip vidéo par Euronews;
- Dataisme : le Big Data et la fin du libre arbitre ? (2016), un article de Bastien L. sur le site Lebigdata.
.
Retour sur les autres Problématiques actuelles en management des T.I