Conférence de Dominique Boullier : "Pluralisme des politiques des données urbaines""

Conférence "Pluralisme des politiques des données urbaines" donnée par Dominique Boullier lors de l'événement de lancement de DataCités 2, le 11 mars 2019

par Dominique Boullier, Senior researcher, Digital Humanities Institute (DHI), Ecole Polytechnique Fédérale de Lausanne (EPFL), Suisse.

Il a été préféré de réaliser un compte rendu exhaustif des propos de Dominique Boullier pour saisir toutes les subtilités relatives à l’exploration DataCités 2. Pour une lecture plus synthétique et analytique sur ce même thème, se reporter à l’ouvrage de Dominique Boullier, Sociologie du numérique, Armand Colin, spécifiquement les pages 243 à 246.

Les slides de Dominique Boullier sont disponibles :

INTRODUCTION

Cette conférence a pour objet de proposer une analyse précise des différentes politiques de données urbaines pouvant être déployées dans les villes. Il s’agira alors de comprendre quelles sont les stratégies “data” des projets menés dans le cadre de DataCités 2.

(Slide 3) Le terme clé est celui du "pluralisme". Généralement, les réflexions sur les données s’inscrivent dans une façon de penser qui est "fataliste" : le numérique nous tombe dessus, on le subit et on réagit en conséquence. En réalité, il y a toujours de multiples façons de faire. Je demande souvent à mes étudiants d’imaginer plusieurs manière de faire. Il y a toujours des choix possibles, c'est important de garder cela en tête pour le bien de notre démocratie. Restituer ces choix sera donc le fil conducteur de cette présentation.

(Slide 4) En termes de politique de données urbaines, j'utilise une “boussole”. Sur un axe, il y a le modernisme, mot que j'emprunte à Bruno Latour, qui est un mouvement qui nous détache de nos attaches : la nature, les traditions, la religion. Sur l’autre axe, il y a l'incertitude, mot que j’emprunte à Isabelle Stengers. Toute l'activité scientifique est une prise en compte de l'incertitude, à l'intérieur même de nos projets et de nos visions du monde. On voit ici qu’il y a DES politiques possibles, et ça n'est pas toujours si facile à vivre.

TYPES DE VILLE & MODALITÉS DE COLLECTE DE DONNÉES

On peut distinguer plusieurs modèles de villes :

  • Good Old City : On a d'un côté cette bonne vieille ville, celle de l’élu qui serre des mains sur le marché. En général, on disqualifie cette approche, on la considère comme ringarde et on pense qu’elle n’a plus lieu d'être. Or, je pense qu'on rate quelque chose, quand on sait l'importance de ces échelons territoriaux. Je ne vais pas parler de ça, mais c'est bien de l'avoir en mémoire. C'est très important d'avoir tous les canaux à notre disposition.

  • Smart City : C’est le modèle moderne. "Smart City" est un terme commercial, qui a été promu massivement par IBM notamment, bien que d’autres entreprises s'en soient aussi emparées (Cisco, ZTE, Bouygues, Dassault Systèmes...). Si je les regroupe c'est parce qu'il y a une certaine idée derrière : celle que l’on va fonctionner à partir d'une modélisation de la ville. Ce modèle est lui-même contesté et mis en concurrence, par une autre approche, qui part de la donnée.

  • DataCity (ou Google City) : Cette approche s'intéresse à l'existence de “traces” déjà disponibles sur les activités. Il va les utiliser pour générer un certain nombre de corrélations et non plus des modèles comme on le pensait avant. L'objectif, c'est de récupérer ces “traces” et de voir dans quelle mesure certaines des corrélations peuvent faire sens. Je parle de traces parce que ce sont des données de très bas niveau, à base de comportements élémentaires comme un clic. Ce n'est plus tout à fait les données qu'on a l'habitude de traiter dans les bases de données des services urbains, notamment.

  • Et, enfin, une autre politique qui est aussi possible, qu'on a tendance à oublier, c'est ce que j'ai appelé la “Wikicity”, avec une dimension contributive, collaborative, le crowdsourcing, voire même le coopérativisme de plateforme. Il s’agit d’une alternative, ce qui ne veut pas dire pour autant une opposition radicale aux modèles précédents. La Wikicity recoupe des façons de générer de la donnée, de construire un modèle organisationnel qui mérite d'être pris en compte et qui a tendance à être oublié.

Une fois qu’on est pris dans une approche, on a parfois du mal à la combiner avec d’autres manières de faire. Voilà un peu la problématique : on ne peut pas investir dans tous les sens, mais il faut être conscient de ces différents possibles qui existent, et qui, parfois, ont été réduits par le fait qu'on s'est engagé dans une voie spécifique.

En résumé : La Smart city fonctionne selon le modèle “City to data”. La modélisation est supposée corriger les effets de silos. C’est le modèle de ville qui va pousser le modèle de gestion de la donnée. Dans cas, on est à l'inverse du modèle Google de “Data to City”, dans lequel, si on pousse la comparaison, ce sont les data qui vont générer la ville à partir des traces de l'activité, des comportements… A partir de là, on a une idée de ce qui pourrait faire ville. Dans le modèle Wiki City, je pousse l'usage des termes en disant que c'est du “Data as a city” - c'est finalement une forme d'urbanisme participatif qui consiste à comprendre la collecte des données comme une ville, c’est la façon dont on le fait qui est politiquement significative.

Je vais maintenant détailler chacun de ces 3 modèles : City to data, Data to City, La WikiCity.

CITY TO DATA

(Slide 6-7-8) L’ une des questions centrales est : comment on dépasse tout ce qu’on appelle des silos ? Dans le city command center d’IBM, les silos sont dépassés par un “grand tout” dans lequel on peut tout interconnecter et avoir une vision spectaculaire de cet ensemble. Un tel centre de commandes à une capacité à fédérer des images et à mettre tout le monde en coprésence, ce qui est une façon de tenter de résoudre cette question d'interconnexion. En réalité, cette culture n’a pas très bien marché commercialement.

(Slide 9) Elle a servi de modèle pour ériger des villes nouvelles, telles que Songdo ou Masdar, qui sont en réalité de pures abstractions, qu'on pose sur le territoire, avec un modèle qu'on met en œuvre. Je vois bien le décalage qu'il y a avec les préoccupations de villes moyennes autour de la donnée, c'est évident. C'est de l'urbanisme hors sol, qui potentiellement peut permettre d'expérimenter beaucoup de choses, mais qui n'est certainement pas un avenir urbain en tant que tel.

(Slide 10) Ce modèle de Smart City n'a pas fonctionné parce qu’il recrée une forme de sectorisation. Petit à petit, on traite les problèmes domaine par domaine, on a du mal à traiter le tout et quand on veut traiter un aspect supplémentaire, il faut travailler avec des partenaires qui connaissent bien le modèle urbain. C'est un aveu de la complexité des modèles urbains, et de l'incapacité de les réduire à des modèles transversaux. Cet apprentissage de la part de ces grandes firmes, et dans lequel nous sommes d’ailleurs tous embarqués, mérite d'être souligné : la donnée c'est un mécanisme d'apprentissage collectif. Dans cette présentation, je veux donc souligner qu’il ne faut pas disqualifier les approches, mais prendre en compte leurs limites de validité.

(Slide 11-12) On verra à quel point on change de monde quand on passe du model to data au data to model. Ce dernier va pouvoir être révisé, sans doute, grâce à de nouvelles informations. Cette capacité d'apprentissage change complètement la fonction de gérer des modèles, puisque ce ne sont plus des modèles du monde, mais des modèles d’apprentissage, qu’on est capables de réviser au fur et à mesure, à partir des données qui sont fournies. Il faut ici prendre la mesure du changement culturel qui se réalise.

(Slide 13) Pourtant, on a beau traiter un certain nombre de données, et faire tous les calculs que l'on veut, un souci reste : celui du design organisationnel. Par exemple, comment est-ce que le traitement des données va s'intégrer à des métiers et des publics qui sont eux-mêmes bénéficiaires et utilisateurs de ces services ?

Un certain nombre de choix, différents selon les modèles politiques et organisationnels vont être faits.

(Slide 14) Je vais vous donner un exemple de différences de design organisationnel. J'ai beaucoup travaillé sur les questions de sécurité, et notamment sur la police. En comparant les polices de la route française et anglaise, il y a 20 ans, j’ai noté une différence (l'exemple est resté car il assez parlant). Quand on fait des contrôles routiers en France, le préfet dit où les faire et l'équipe part faire son contrôle. Même s'ils savaient qu'ils avaient été repérés, les policiers ne changeaient pas de place, car cela avait été décidé comme ça. Les données d'accidentologie sont remontées au central, et ceux qui font le contrôle n'en voient jamais le résultat. Dans la traffic police anglaise, il y a 20 ans, ils avaient déjà une sorte de data scientist (même si ce nom n’était pas utilisé à l’époque) qui récupérait les données et créait des modèles locaux pour identifier les types d’accident selon l’heure, l'efficacité des contrôles de police, etc.... Il créait sa petite explication locale, qui servait à toute l'équipe, une quinzaine ou vingtaine de policiers qui décidaient, ensemble, des modifications à faire dans le contrôle.

(Slide 15) Selon certains choix, le mode organisationnel va changer complètement l'utilisation de la donnée, le sens qu'elle va avoir, non seulement, pour sa pertinence par rapport à la question, mais aussi pour ceux qui l'utilisent et qui vont se dire "cette donnée-là, je ne la produis pas parce qu'on me demande de la fournir, mais surtout parce qu'elle a du sens pour guider ma propre pratique". J’insiste sur ce point, parce que les territoires accompagnés dans le cadre de DataCités 2 ont évoqué la difficulté de convaincre les différents personnels, les différents métiers de l'intérêt de la donnée. La question du design organisationnel, et ses problématiques, me paraît donc primordiale : comment les métiers sont associés ? Comment on leur montre que ça a du sens dans leur pratique et à quel niveau ?

Dans tous les services, il existe des bases de données. Il faut les examiner pour les réutiliser. Il ne s'agit pas forcément de mettre des capteurs en plus, il y aussi tout ce qui existe et qui n'est pas exploité.

Deuxièmement, chaque service traite les données de son point de vue. Chaque métier a son angle d'attaque sur les données, sur les services, sur les questions. Quand on appartient à “un métier”, il est donc compliqué de devoir échanger, c'est-à-dire de mettre à disposition, non seulement les “données brutes” - qui n'existent pas -, mais aussi les données sous un format qui soit ré-exploitable par d'autres, c’est-à-dire par plusieurs services. C'est un exercice culturel très compliqué, il faut en être conscient.

Dans tous les cas, on ne s'en tirera pas en disant "il y a un tout qui nous permettrait de modéliser tout ça et de faire circuler les données indépendamment des cultures des différents acteurs".

Le troisième élément, c'est la qualité du service. On ne parle pas de la performance du calcul de la donnée, mais de générer collectivement le design organisationnel, le data process et de débattre des finalités. On l'a entendu dans le témoignage des représentants des territoires de DataCités 2, les finalités ne peuvent donc pas se réduire, comme c’est souvent le cas, à la réduction des coûts, la réputation, la tyrannie du retard (“il faut rattraper les autres”). Ce qui est heureux, car ce sont des arguments qui vous empêchent de penser la spécificité de votre métier, de votre choix politique et qui vous empêche d'inventer les formes qui sont réellement innovantes, c'est à dire pertinentes par rapport à votre territoire. Il s'agit donc d'en débattre, de ré-ouvrir le chantier pour discuter de ce que l’on veut faire sur un territoire.

DATA TO CITY (ou Google City)

(Slide 16-17) Les plateformes telles que Google captent les traces indépendamment des services urbains. Du point de vue de leurs investisseurs, elles doivent viser le monopole, faire table rase des concurrents : il n'y a pas d'autres objectifs pour être valorisées comme elles le sont.

C'est très important de comprendre cela, car du point de vue des politiques de coopération, cela pose de nombreuses questions. Attention, cela ne veut pas dire qu'ils ne font pas du très bon travail, mais le problème est qu’il y a une logique financière qui doit attirer notre attention.

(Slide 18) L'exemple de Google Maps est typique de ces “data to models”. Ce n’est pas un hasard si Google s’est mis à travailler sur les cartes, qui sont une source de revenus absolument extraordinaire et qui permet de comprendre la différence qu'il peut y avoir avec une vision d'un Service d’Information Géographique (SIG).

(Slide 19) Un SIG est organisé en couches, donc en silos. Pour que les couches communiquent, il faut avoir un référentiel commun, et les référentiels communs pour les métiers, vous savez à quel point c'est compliqué à construire, c'est un travail politique long, durable, subtil.... qui suppose un “investissement de forme” très important.

Google est parti d’un point de vue très différent. Il ne connaît pas les métiers, ce n’est pas son problème, et ça c'est très important parce que ce qui l'intéresse à travers Google Maps, c’est la traçabilité des comportements en masse et non plus les infrastructures. Google n’a pas d'infrastructures à gérer. Quand vous construisez des SIG, si vous avez des couches comme ça, c'est parce que vous avez un certain nombre de systèmes, de services, qui sont organisés en métiers et qu'il faut arriver à faire travailler ensemble pour délivrer le service et pas simplement récupérer les traces de ce qu'il se passe. Il faut le fournir physiquement. La différence de culture est très importante. Cet après-midi, en écoutant les territoires de DataCités 2, je me suis dit “tout le monde s'accorde sur le fait que le SIG sert à faire circuler la donnée”. Mais, si on veut prendre en compte ce que les plateformes proposent, c'est-à-dire quelque chose qui est basé sur les comportements individuels et pas sur les infrastructures, il faut peut-être inventer quelque chose de nouveau, comme un système d'information des publics, où toutes les couches que l’on aurait ne serait plus en fonction du territoire, mais en fonction des propriétés des publics. On pourrait imaginer construire un système avec de nouvelles classifications en fonction des abonnés à l’eau, au téléphone, des citoyens qui votent, etc. Bien évidemment, il faudrait agréger ces données pour ne pas avoir une traçabilité des pratiques à l’échelle individuelle.

Il faut effectivement trouver un moyen de récupérer ce savoir-faire des plateformes, soit parce qu'on a des partenariats avec elles, soit parce qu’on commence à se préoccuper du fait que les parents qui emmènent leurs enfants à l'école, ça a un rapport avec les gens qui utilisent leur voiture pour aller travailler, ou qui utilisent les transports en commun, etc., donc des comportements. On ne classifie plus seulement selon les CSP. En tant que sociologue, on a fait ça toute notre vie, mais on se rend compte que c’est insuffisant.

(Slide 20) Les plateformes traitent les comportements avec une granularité beaucoup plus fine. Les villes en viennent à capter ce principe, mais elles n'ont pas les ressources, et elles ne vont pas aller voir dans les téléphones de tout le monde. Mais il y a sans doute d'autres leviers pour le faire. Waze a par exemple la capacité de fédérer une quantité phénoménale de sources géographiques, historiques ou encore personnelles, comme le paramétrage individuel. Il ont aussi réussi à constituer une communauté, avec beaucoup de contributeurs qui alimentent les cartes et les mettent à jour etc.

(Slide 21) Ces caractéristiques sont des leçons qu'on peut retenir, parce que la Wikicity dont je parle a été tirée vers la logique des plateformes, ce qui est assez malin car c’est cela qui fait la dynamique et l'adaptabilité des services. Néanmoins, ces plateformes fonctionnent avec des algorithmes propriétaires. Ce sont des boîtes noires. On ne sait pas d'où vient la décision et comment elle a été prise. Dans certains cas, Waze commence à discuter avec les territoires, et ils ont des partenariats qui permet de récupérer des données ou parfois de faire prendre en compte le point de vue du service public. Sinon, ne l'oublions pas puisque c'est collaboratif, les riverains commencent à saboter l'application en introduisant des fausses informations, qui trompent l'algorithme de façon à ce que la programmation du parcours soit modifiée lorsque ça perturbe les plans de circulation locaux.

(Slide 22) Il existe donc des possibilités de services très différents avec des extrêmes dans les politiques de plateformes pour lesquels il faut être capable de faire des choix.

(Slide 23) En conclusion, le “data to city” c'est une reconnaissance que la ville n'est pas le point de départ pour les plateformes, c'est d'abord un service et des revenus publicitaires sans gestion d'infrastructure, ce qui facilite les choses. Or, les plateformes ont spontanément un comportement barbare, elles mènent des attaques délibérées sur toutes les intermédiations, et notamment des intermédiations fragiles ou abusives.

Peut-être que ça n'est pas une préoccupation pour une ville moyenne, mais il faudrait mieux l'avoir en tête pour anticiper le court-circuitage possible d’un service qu’une telle ville souhaiterait proposer. Néanmoins, le temps de la régulation est venu, ça commence. Mais ça doit aussi être le temps des partages de données, l'open data devrait circuler dans les deux sens. Cela n’est pas facile à mettre en place, mais il faudra inventer pour ces plates-formes des obligations de service public par exemple.

En tant que chercheur, on est intéressés par le fait que les plateformes puissent être obligées de nous donner un peu des données qu’elles ont pour qu'on puisse voir ce qu’y s’y passe. Or, quand on voit Facebook se refermer ou même Twitter, on se dit que c'est quand même un problème politique, pas seulement pour les sciences sociales, c’est un problème de société.

Historiquement, on avait les recensements, les sondages, maintenant on a les traces sur les plates-formes. Et les traces, c'est nous qui les produisons : pourquoi est-ce qu'on aurait pas accès un minimum à l'analyse de ces traces ?

La WIKICITY

(Slide 24) La WikiCity est la ville de l’intelligence collective. Comment peut-elle fonctionner ? Elle a plusieurs niveaux, et certains niveaux de collaboration peuvent être très bas.

  • (Slide 25-26) On a un idéal de citoyen qui contribue.... sauf qu'il contribue de moins en moins. Mais comment faire dans les moments où il s'intéresse à quelque chose ? Peut-être qu'il faudrait retrouver une boucle qui prenne en compte ses données et contributions, comme on peut le voir avec certains applications de type complaining apps. Evidemment, le citoyen peut apparaître comme un consommateur dans certains cas, mais c'est un début qui n’est pas si mal. Il faut profiter de ces occasions pour utiliser ce début de statut d'un public qui contribue d'une façon spécifique. Dans d'autres cas, il devient lanceur d'alerte permanent : certaines applications fonctionnent comme ça.

  • (Slide 27-29) Un autre statut consiste à contribuer à la connaissance. C’est le cas des encyclopédies environnementales par exemple. C'est intéressant, parce qu'il y a un ancrage territorial qui est défini par des pratiques, c'est-à-dire que quand vous vous promenez dans une ville, vous avez une expérience d'un autre type que l'expert qui suppose de voir les choses du-dessus. C’est intéressant, car on sort de la démocratie des experts dans ce cas précis. Ainsi, soit on délègue la production de connaissances à des experts qui vont analyser les données produites par des capteurs, soit on met les usagers dans une boucle. Des applications existent où on peut utiliser ses propres capteurs et les associer à une activité des citoyens qui font qu'on récupère aussi des qualités démocratiques. Cela n'est pas forcément simple, mais c'est un objectif que l'on peut avoir.

  • (Slide 30) Enfin les citoyens peuvent débattre et même avoir des budgets pour ça. Un certain nombre d'applications proposent cela. Par ailleurs, en France, on est bien placés pour savoir qu'il y a des plateformes de débat.

(Slide 31) Ainsi, comment une organisation permet de générer de la donnée et de faire ville, de faire urbanité ? C'est précisément un des objectifs qu'on devrait avoir quand on pense la collecte de données ; une forme de ce que j'appelle un “urbanisme numérique de la participation” qui consiste à se demander "mais qui participe à quoi"? Il y a plusieurs façons de participer, donc comment savoir qu'à un moment ou un autre dans l'année un citoyen a participé à quelque chose ? Ce serait intéressant d'avoir un mapping de toutes les participations et de dire “il a pu être dans certaines discussions de quartiers ou avoir été concerné par un problème en particulier ou avoir fait une réclamation”.

Surtout, il ne faut pas mépriser les contributions de base, car c’est également à partir de là que peuvent émerger d'autres engagements. Mais l'important ce n'est pas la donnée pour elle-même, mais la dynamique de la participation. Evidemment, on sait qu'il va y avoir des trous dans la donnée, mais l'important c'est qu'il y ait une dynamique de participation qui soit appuyée sur la donnée où on exploite le levier de la donnée pour la participation. Le sens de mon argument est qu’il ne faut pas de se lancer dans des gros projets. Il faut penser aux relais organisationnels dans la population, aux services et aux métiers pour rendre la participation possible, même si c’est modeste.

CONCLUSION

(Slide 32-34) Je conclurai sur ce point, car vous êtes dans des organisations, donc sur la modalité d'organisation institutionnelle. Pour illustrer cela, je vous propose le modèle du cristal institutionnel, qui présente les différents éléments d'organisation et qui peut servir pour les villes également. En général on a surtout visé le business et la performance et on a rajouté depuis la réputation. Le problème, c'est que la mémoire, la vision et l'intelligence collective sont faibles. Je suggère donc d’être soucieux des innovations dans ces domaines-là, car ils vont vraiment avoir une importance politique.

Last updated