La mission de Cédric Villani sur la stratégie nationale et européenne en matière d'intelligence artificielle touche à sa fin. L'épais rapport fait pas moins de 235 pages, que nous avons analysées dans ce dossier en trois parties. La question des données, carburant indispensable des IA actuelles, occupe une place de choix.
L'intelligence artificielle est un sujet porteur, autant par les craintes (lire notre dossier) que les espoirs qu'il suscite. La France occupe une place de choix dans le monde de la recherche, avec plusieurs scientifiques à la tête de groupes d'envergure mondiale. L'un des plus médiatiques est certainement Yann LeCun, patron de l'IA chez Facebook, épaulé depuis peu par un autre français : Jérôme Pesenti.
En janvier 2017, Thierry Mandon, alors secrétaire d'État à l'Enseignement, s'en offusquait. Il évoquait un secteur de la recherche « en grand danger » en France, avec des centres « pillés » : « Les chercheurs sont débauchés par des sociétés qui ne sont pas françaises et qui ont le bon goût de ne pas payer d'impôt en France » affirmait-il lors de la conférence #FranceIA (lire notre compte rendu).
Des missions sur l'IA comme s'il en pleuvait
À l'image des voitures autonomes, la question de l'intelligence artificielle prend du retard dans l'Hexagone, malgré la multiplication des rapports sur le sujet. S'ils sont nécessaires pour poser les bases, il n'est pas utile de les multiplier comme les petits pains. Début septembre, le gouvernement confiait une mission sur l'intelligence artificielle à Cédric Villani : mathématicien, lauréat de la Médaille Fields en 2010, et député LREM de l'Essonne.
Un de plus après ceux des derniers mois/années ? Pour rappel, FranceIA, l'Office parlementaire d'évaluation des choix scientifiques et technologiques, le Comité économique et social européen et la CNIL se sont déjà penchés en détail sur la question de l'intelligence artificielle.
Cédric Villani veut proposer des actions, du concret...
Cédric Villani avait déjà annoncé que son rapport n'était « ni une prédiction sur ce qui va se passer [...] ni une liste de projets à soutenir [...] ni une liste de recommandations générales ». Son but est de proposer des actions : « Comment organise-t-on des filières, lesquelles et qui s’en charge ? Faut-il en passer par la loi ? ».
Lors d'un passage au Sénat en octobre dernier (lire notre compte rendu), Mounir Mahjoubi abondait dans ce sens : il s'agissait de « présenter des orientations pratiques sur les débats qu'il est urgent de mener, mais aussi sur les enjeux d'investissements industriels qu'il aura considérés, à la suite de ses auditions, comme étant majeurs ». Selon Mahjoubi, mettre en œuvre les propositions précédentes serait trop coûteux ; il faut donc procéder à des « décisions stratégiques à hauteur de nos capacités stratégiques et d'investissement ».
Maintenant qu'un site dédié baptisé AI for Humanity a été mis en ligne et que le rapport est disponible (une conférence sera diffusée en direct demain matin), les promesses sont-elles tenues ?
Notre dossier sur le rapport de Cédric Villani sur l'intelligence artificielle :
- Intelligence artificielle : décortiquons les 235 pages du rapport de Cédric Villani
- Rapport de Cédric Villani sur l'IA : formation, emplois, écologie et excellence à la française
- IA : éthique des « boîtes noires », parité et armes autonomes dans le rapport de Cédric Villani
- Intelligence artificielle : des propositions de Cédric Villani au discours d'Emmanuel Macron
Un rapport de 235 pages, comprenant « 10 messages clés »
Avant d'entrer dans le détail du rapport, plantons le décor. Cette mission est composée de sept personnes (dont une seule femme), comprenant notamment le directeur de recherche INRIA Marc Schoenauer, le secrétaire général du Conseil national du numérique Yann Bonnet et l'ingénieur en armement de la DGA Bertrand Rondepierre.
Ils ont procédé à près de 420 auditions d'experts provenant d'horizons variés : santé, justice, transports, éthique, industrie, éducation, emploi et formation, etc. Une consultation publique a également été mise en place avec 2 000 contributions de 1 639 participants. Enfin, dans le cadre de cette mission, « une étude comparative (benchmark) des politiques mises en place dans quinze pays ».
Comme toujours, ce énième rapport commence par une définition maison de l'intelligence artificielle, se rapprochant de toutes les autres : « L'intelligence artificielle désigne plutôt un programme qui a une ambition : reproduire les performances des processus cognitifs de l'être humain – puis les dépasser, en rapidité et en complexité, bénéficiant de l'augmentation de la puissance de calcul disponible ».
En guise de résumé, l'équipe de Cédric Villani donne « 10 messages clés », que nous allons détailler :
- Favoriser l’émergence d’un écosystème européen de la donnée
- Créer un réseau de recherche d’excellence en IA
- Concentrer les efforts sur quatre domaines prioritaires : santé, transport-mobilité, écologie et défense-sécurité
- Structurer le soutien à l’innovation sur de grands défis et expérimenter
- Créer un Lab public de la transformation du travail
- Expérimenter un dialogue social au niveau de la chaîne de valeur pour financer la formation professionnelle
- Tripler le nombre de personnes formées à l’IA d’ici 2020
- Se donner les moyens de transformer les services publics grâce à l’IA
- Intégrer les considérations éthiques à tous les niveaux, de la conception jusqu’à leur impact dans la société
- Porter une politique audacieuse de féminisation du secteur de l’IA
Les données : le nerf de la guerre dans l'IA
Les jeux de données sont très importants pour l'intelligence artificielle moderne : il s'agit en effet de la matière première du machine learning. « On peut comparer le fonctionnement d’un algorithme de machine learning au développement cognitif de l’enfant : celui-ci apprend en observant le monde, en analysant la manière dont les individus interagissent, en reproduisant les règles sans pour autant qu’on lui expose explicitement » explique le rapport.
Si l’apprentissage par les données n’est pas l'unique méthode pour créer de l’intelligence artificielle, « c’est aujourd’hui la méthode la plus utilisée, celle qui se développe le plus vite et celle qui fait l’objet de la compétition internationale la plus vive ».
Des données seules sont déjà utiles, mais leur valeur est décuplée lorsqu’elles sont structurées et annotées. Sur ce point, les géants du Net américains et asiatiques (Amazon, Facebook, Baidu, Alibaba, Tencent, etc.) disposent d'un avantage certain. De plus, en France, « près de 80 % des visites vers les 25 sites les plus populaires sur un mois sont captés par les grandes plateformes américaines ». Sur ce point, L’Europe fait figure d’exception : la Russie et la Chine parviennent à capter l’essentiel des données de leurs utilisateurs.
RGPD : 20 ans trop tard, mais le droit à la portabilité ouvre des perspectives
Alors que le RGPD entrera en vigueur le 25 mai (lire notre analyse ligne par ligne), le rapport regrette que ces dispositions n'arrivent que maintenant : si elles avaient existé il y a 20 ans, « il est probable que Facebook, Amazon ou Google n’auraient pas pénétré le marché européen aussi facilement et que la concurrence aurait pu démarrer sur des bases plus saines ».
Le droit à la portabilité du RGPD pourrait néanmoins déboucher sur des actions citoyennes : « on peut envisager, à moyen terme, que des citoyens décident de récupérer leurs données auprès de différents services pour les mettre à disposition d’un acteur public ou de la recherche scientifique au profit de missions d’intérêt général [...] Sur le modèle de l’appel au don du sang, il est possible d’imaginer des campagnes d’ampleur, au niveau municipal, régional ou national, visant à constituer des bases de données nécessaires au développement d’intelligences artificielles orientées sur des missions de service public ».
Il ne faut pas uniquement miser sur la récupération de données existantes indique le rapport, mais aussi penser à de nouveaux moyens d'en collecter. Bref, « il faut brasser au plus large pour espérer créer un effet "boule de neige" ».
Le rapport ne veut pas forcément d'un « Google européen »
« Ce n’est pas forcément grâce à un « Google européen » que la France et l’Europe pourront se faire une place » tempère le rapport. En effet, « la puissance publique doit pour cela amorcer de nouveaux modes de production, de collaboration et de gouvernance sur les données, par la constitution de "communs de la donnée" ».
Cédric Villani veut mettre en place une « incitation » au partage et à la mutualisation, l’État pouvant jouer « un rôle de tiers de confiance ». De l'aveu même du rapport, ce n'est pas gagné : en 2017, une étude de l'Union européenne indiquait que 90 % des entreprises ne partageaient pas leurs données (les fuites n'étaient pas prises en comptes).
Si ce n'est pas suffisant, le député évoque également la possibilité d'« imposer l'ouverture » pour des données d'intérêt général. Le rapport précise tout de même que Laurent Cytermann avait en 2015 émis des réserves sur ce sujet. Dans tous les cas, il souhaite que les données publiques (météo, agricoles, transports, énergie, déchets, cadastre, diagnostic de performance énergétique, etc.) soient mises à disposition des chercheurs dès l'année prochaine. Dans quel but ?
« Cette libération pourrait servir à encourager les innovations qui ouvrent la voie à des actions rapides : rénovation mutualisée de l’habitat, valorisation des énergies renouvelables, efficacité énergétique, facilitation des circuits courts, valorisation des déchets des particuliers et des industriels, permis de construire, permis de démolir, etc. Mais également des recherches pour des innovations plus structurées : météo prédictive sans équations différentielles, amélioration du trafic prédictif, prévision des pollutions, crue, etc. »
Autre source pour les précieuses données : « la réforme actuelle du droit d’auteur devrait – enfin ! – permettre d’autoriser les pratiques de fouille de texte et de données (text and data mining) dans un objectif de compétitivité de notre recherche publique ».
Mettre en avant les pépites nationales
Le rapport souhaiterait également une valorisation de certaines initiatives françaises. Quelques exemples sont cités : la place de marché des données Dawex, la plateforme d'échange Catalogue de Transdev et l'offre de mise en relation d'acteurs proposée par La Fabrique des Mobilités.
Autre point sur lequel la France est en retrait : « la visibilité des entreprises faisant de l'intelligence artificielle : les grandes entreprises préfèrent parfois céder aux sirènes des géants mondiaux de la discipline plutôt que de faire confiance à nos pépites nationales, soit parce qu’elles en ignorent l’existence, soit par excès de prudence ». La mission souhaite donc fédérer les acteurs nationaux et les pousser vers le devant de la scène.
Le rapport préconise la mise en place un label rattaché à la French Tech, ainsi que des prix d’innovation. Le but serait ensuite de l'utiliser comme socle pour organiser des événements autour de la recherche et de l’innovation en intelligence artificielle.
Guichet unique et allègement de la réglementation
Elle évoque également l'idée de créer un guichet unique d’information, dans la même veine que French Tech Central. Il favoriserait le dialogue avec les différentes institutions. Afin d'éviter des délais à rallonge, une contrainte de réponse dans les trois mois pourrait être instaurée.
La commande publique est un autre levier de croissance pour l'intelligence artificielle : actuellement, le seuil de l’ordonnance sur les marchés publics est de 25 000 euros HT en France, contre 144 000 à 443 000 euros HT en Europe. Selon le rapport, ramener les seuils au niveau européen permettrait de « fluidifier l’exercice de l’achat public dans le domaine de l’IA ».
Afin d'être efficace, le rapport préconise d'éviter « les logiques de saupoudrage et de concentrer l’effort sur quatre secteurs prioritaires : santé, environnement, transports-mobilités et défense-sécurité ». Pourquoi seulement ces quatre-là et pas la banque ou l'assurance ? Car leur développement nécessite des initiatives publiques, contrairement aux autres où le privé s'en occupe déjà.
Pour que l'intelligence artificielle puisse se développer dans de bonnes conditions, le rapport souhaite mettre en place des terrains d’expérimentation en conditions réelles et des « bacs à sable d’innovation », articulés autour de trois aspects :
- un allègement, temporaire, de certaines contraintes réglementaires pour laisser le champ libre à l’innovation
- un accompagnement des acteurs dans la prise en compte de leurs obligations
- des moyens d’expérimentation en situation réelle.
DINSIC, ANSSI... : la transformation de l'État
Du côté de l'Etat, il reste encore beaucoup de travail pour prendre à pleine main cette transformation explique le rapport, d'autant qu'il se doit d'en être un des moteurs. Cédric Villani souhaite donc notamment mettre en place un coordinateur interministériel et créer au sein de la DINSIC un pôle de compétences mutualisées en IA.
L’Agence Nationale pour la Sécurité des Systèmes d’information (ANSSI) pourrait voir son rôle étendu et se doter d'une mission « de veille, de prospective et d’étude sur la question de la sécurité de l’IA », dans le but d'éviter l'apparition de menaces. Il est en effet possible de fausser arbitrairement les résultats d'un algorithme, de manipuler les données injectées et de créer de nouvelles attaques en se basant sur les faiblesses des techniques d'IA actuelles.
Commentaires (34)
#1
Est-ce moi ou alors est-ce que ce rapport suggère que la collecte des données personnelles est une bonne chose pour éduquer les IA ?
Données personnelles qui seraient bien sur données (!) volontairement par les utilisateurs pour nourrir les algorithmes des administrations.
" />
#2
Je ne comprends pas ça, mais plutôt “on manque de BDD, c’est notre point faible face aux US et la Chine”.
Sur comment combler ce retard, c’est une question de Société. Je trouve que le rapport se limite à ce qu’il doit : poser des constats, proposer des actions, susciter des questions de Société…
#3
J’ai du mal avec l’idée de relever le seuil de l’ordonnance pour la passation des marchés publics… À part faciliter la fraude et le népotisme, ça ne fait justement que fermer le marché aux acteurs les plus puissants et pas aux nouveaux entrants. Bref, une bien mauvaise idée à mes yeux.
#4
Un rapport consternant de plus.
Entre les vœux pieux, les recommandations collectivistes d’usage (il faut bien justifier sa place), le saupoudrage du bon argent public que l’on n’a plus avec un soupçon de protectionnisme dedans parce que le mauvais argent US nous a déjà tout volé nos données, et surtout le rôle essentiel, que dis-je, primordial de notre valeureux l’État-stratège comme chef autoproclamé de l’orchestre, tout est réuni pour aboutir aux futurs fiasco industriel et bide commercial français habituels.
Tant que nos zélites ne comprendront pas que ce ne sont pas elles qui créent ou décident du monde de demain mais les forces du marché (càd les individus qui commercent), tout ira toujours de travers au pays du fromage, plus rapidement, mais assurément toujours dans le mur du ratage planifié d’en haut qui fait notre réputation sur la planète.
La primauté sur les données est caractéristique : l’apprentissage automatique n’est pas de l’intelligence, c’est le niveau zéro des capacités cognitives et il n’y a vraiment rien d’enthousiasmant là-dedans. Tant que les bases neurophysiologiques (voire moléculaires) de l’intelligence humaine ne seront pas découvertes, l’“intelligence” artificielle restera du marketing (d’État en France). Là est la question : où étudie-t-on l’intelligence en France ?
#5
#6
#7
#8
#9
#10
#11
#12
#13
Ceci est un rapport politique de type TINA, compétition à tous les étages avec le charabia libéral habituel: stratégie, investissement, performance, excellence, compétition, innovation, défi… et le fameux “dialogue social” qui n’existe que dans leurs têtes.
Les questions sociales et législatives ont naturellement été minimisées ou évacuées.
Exemple: Dans la synthèse, la proposition de Lê Nguyên Hoang sur le salaire universel qui était arrivé largement en tête des votes lors de la consultation est à peine évoqué.
Vous pouvez comparer la consultation à la synthèse pour constater le grand écart.
Comme d’habitude, on fait semblant de réunir les gens autour d’un table afin d’entériner des décisions basées sur une idéologie.
A l’image de ses contemporains, M. Villani est complètement sur-qualifié pour le travail qu’il effectue.
Par ailleurs il veut nous vendre de l’innovation alors qu’ils n’en a même pas un échantillon sur lui.
A partie de maintenant, on fera comme d’habitude.
#14
Ce rapport reconnait la force et la souplesse des marchés publics comme levier pour développer les activités de R&D privées (exception en matière de R&D, Partenariat d’innovation, et dialogue compétitif).
Mais il souligne néanmoins, “qu’il faut cependant garder à l’esprit que la mise en œuvre de ces procédures, coûteuses en ressources, requiert une très forte implication des administrations […]. C’est l’aversion au risque des signataires des marchés publics qui limite l’utilisation de certains dispositifs et, plus généralement, l’innovation en matière d’ingénierie contractuelle” (cf. P45).
Dans ces conditions, les activités de R&D privées resteront majoritairement financées par des incitations fiscales (crédit impôt recherche, statut fiscal des jeunes entreprises innovantes, réduction de l’IRPP lors de la souscription de parts dans un fonds commun de placement dans l’innovation…).
#15
Plutôt alléchant, reste avoir si ça se transforme dans les fait en quelque chose de viable, je suis mitigé entre l’avis de tmtisfree et secouss.
Le coup de l’investissement étatique dans la recherche est une bonne idée, concentrer les investissement sur des domaine publique également.
J’aime beaucoup l’idée de pousser le partage de l’information, qui est a mon avis la plus grande source de l’innovation, la jouer perso n’est bon que sur le court terme et encore …
sinon le dixième points n’a rien à faire ici selon moi, ça décrédibilise l’ensemble.
#16
#17
#18
#19
Ouh là! Je ne sous-entend absolument rien, je te pose une question tout simplement.
Tous les états font de l’interventionnisme, aucun doute là dessus. Mais le sens de ma question est le suivant : penses tu que l’interventionnisme Français soit plus efficace que l’Américain ? Parce que perso j’en doute.
#20
Une bonne dose d’interventionnisme pour pousser les sociétés à se lancer sur le sujet couplé à une bonne dose d’environnement.
Ariane est née ainsi, le Rafale est né ainsi, Airbus est né ainsi, STX, MBDA, Safran, Thales, Gemalto, Bull, …. la liste est longue ^^
Il faut se battre sur tous les fronts
#21
J’ai attaqué le rapport via la news n°2, mais je suis pas déçu de lire l’introduction au rapport via la new n°1!
Il faut impulser sur les défis majeurs y a qu’à renfoncer la visibilité, il faut transformer l’Etat y a qu’à se donner les moyens …
C’est à se demander s’il en est le rédacteur car j’apprécie habituellement des interventions (ou bouquin), mais là ça brasse surtout de l’air avec le sentiment de distiller les éléments de langage d’une boite de communication…
#22
#23
C’est vrai qu’on entend plus parler ! Je pensais que ça avait disparu Oo ? J’espère qu’ils feront un bilan des échecs avant de lancer autre chose :(
C’est comme les contrat avec formation d’un “jeune” par un “vieux” qui devait faire sauter les cotisations, je sais pas où ça as merdé mais ça a fait un gros flop pour une super idée…
#24
“La recherche c’est le boulot de l’état en partenariat avec les sociétés.” Dans un “Partenariat”, y’a toujours un fucker et un fuckee " />
#25
Dérégulation à tour de bras pour “faciliter l’innovation”…
“L’idée d’un label valorisant les solutions les plus exemplaires estégalement évoquée. Il serait géré par le ministère de la Transitionécologique et solidaire. Pour inciter les entreprises à sauter le pas, lacarotte pourrait prendre la forme d’une récompense fiscale. ”
Ah, et de nouvelles niches fiscales pour les amis du président " />
#26
« le monde du travail est à l’aube de grandes transformations et n’y est encore que peu préparé ». Face à ce phénomène, et comme les autres missions, le rapport de Cédric Villani ne peut prédire l’avenir.
#27
#28
#29
#30
#31
#32
#33
#34
La France veut des BDD ? Ben qu’on commence par centraliser l’identité civile avec tout le reste, comme ça on aura plus à remplir des milliers de formulaires pour donner les mêmes informations tout le temps… En commençant par la scolarité, l’habitation, les assurances, la santé, etc.