La ville de Nice, qui se vante d'être la plus vidéosurveillée avec ses 4 090 caméras, vient de lancer un appel d'offres de maintenance de ses équipements. Il détaille notamment les fonctionnalités des multiples systèmes de « Détection Automatique d’Incidents » (D.A.I.) de son « Système de Vidéoprotection Intelligent ».
Sur son site web, la mairie de Nice précise que son Centre de Supervision Urbain, créé en mars 2010, emploie 90 fonctionnaires surveillant 4 090 caméras « à ce jour », ainsi que 1 400 boitiers d’alerte, 244 bornes d’appel d’urgence et 108 haut-parleurs de voie publique, ayant permis de procéder à « 7 360 interpellations du 23 mars 2010 au 8 décembre 2022 ».
La mairie mentionne également son « Système de Vidéo Protection Intelligent qui permet de détecter automatiquement et en temps réel, tout comportement "anormal" (exemple : intrusion, colis suspect et attroupement) ».
On se souvient en effet que, suite aux attentats de Charlie Hebdo, en 2015, le maire de Nice, Christian Estrosi, avait déclaré devant le conseil municipal de Nice être « à peu près convaincu que si Paris avait été équipée du même réseau [de caméras] que le nôtre, les frères Kouachi n’auraient pas passé trois carrefours sans être neutralisés et interpellés ».
Or, un an plus tard, alors que la ville ne dénombrait alors que 1 257 caméras, le terroriste de l'attentat du 14 juillet 2016 à Nice effectuait – sans être repéré comme l'avait révélé Mediapart – 11 repérages sur la promenade des Anglais entre le 11 et le 14 juillet, dont 3 d'une trentaine de minutes au volant d'un poids lourd de 19 tonnes, « malgré l'arrêté municipal interdisant la circulation des véhicules six fois moins gros dans cette partie de la ville » :
« Un poids lourd a circulé sur la promenade des Anglais fermée à la circulation des camions, est monté sur un trottoir réservé aux piétons, s'est approché dangereusement de la pergola sous laquelle les touristes ont le loisir de se reposer, assis sur des bancs. Le chauffeur a pris son temps pour estimer ses trajectoires. [...] Il ne fait rien à part enfreindre la loi municipale. La scène est immortalisée par une caméra vidéo. Mais au centre de supervision urbain (CSU) de la ville de Nice, personne ne réagit. »
Interrogé par Nice-Matin sur ces repérages du terroriste, Christian Estrosi, qui était alors redevenu premier adjoint en charge notamment de la sécurité, avait éludé le sujet : « Si tous ceux qui passent deux fois sur la promenade des Anglais étaient des criminels… On ne peut pas supposer le pire à chaque fois. »
Le CSU recevrait « en moyenne » 1 500 réquisitions judiciaires par an, d'après sa brochure sécurité 2021, « un chiffre en constante progression », et dénombre « trois salles d'exploitation vidéo équipées de 90 écrans » : une salle de gestion des événements de la voie publique, une salle dédiée à la protection des établissements scolaires et à lutte contre les incivilités, une salle dédiée à la gestion du réseau des lignes de tramway.
Plus une salle de crise « activée pour la gestion d'événements majeurs », un PC radio pour assurer le relais avec les effectifs sur le terrain, et une salle d’extraction vidéo permettant le visionnage et la relecture des séquences vidéo « conservées 10 jours, sur réquisitions des officiers de police judiciaire ».
À l'époque (le document date d'octobre 2021), la ville dénombrait 3 865 caméras en service, soit « 1 caméra pour 88 habitants et 53 caméras au km² ». À raison, notamment, d'une caméra devant chaque entrée des établissements scolaires de la ville, plus de 1 050 pour la sécurité des usagers du tramway, 58 caméras nomades permettant de « répondre ponctuellement à des besoins conjoncturels », 595 caméras « multi-objectifs haute définition » avec une vision à 360°, ainsi que des caméras-piétons déployées pour chaque patrouille de police.
Nice s'y vante d'avoir été la première ville en France à avoir expérimenté la reconnaissance faciale sur la voie publique lors du Carnaval 2019, omettant au passage qu'elle n'avait pas reçu d' « autorisation » de la CNIL, contrairement à ce qu'avait déclaré son maire, Christian Estrosi.
Nice se vante également d'être à l'origine d'une autre expérimentation, « unique en France », de « détection automatisée en temps réel des dépôts de déchets sauvages sur la voie publique grâce au recours à l’intelligence artificielle ».
Un appel d'offres de « maintenance des équipements matériels, logiciels et infrastructures réseaux liés aux plateformes de vidéoprotection et de vidéosurveillance pour l’ensemble des services de la Métropole de Nice » permet d'en apprendre un peu plus sur les caméras de la ville de Nice, que nous avons déjà moult fois chroniquées.
Analyser la couleur et la longueur des vêtements « haut et bas »
Son cahier des clauses techniques particulières (CCTP) de 127 pages (.pdf) détaille l'existant et précise les prestations attendues. Il précise que le marché concerne 2 457 caméras, dont 1 176 dômes ptz (pour pan tilt zoom), 648 « couronnes multi-capteurs FULL HD et 5 Mpx pour vision panoramique » de marque AXIS, 78 caméras nomades de la marque française VDSYS, 30 thermiques, et 16 de reconnaissance de numéros de plaques (LAPI) et attributs de véhicules de l'italien TATTILE.
Le cahier des charges indique qu'en termes d'analyse vidéo intelligente, les caméras dômes ou « multi-capteurs 360° », de type FLIR Teledyne TrafiBot2 ou Dual AID, toutes deux conçues pour la « détection automatique d'incidents », doivent pouvoir identifier : « sabotage, maraudage, détection directionnelle, détection de brouillard, ligne virtuelle, entrée/sortie, apparition/disparition, détection audio, détection de visage, détection de mouvement, classification sonore, auto-tracking », avec une fonction zoom x40.
Des « caméras intelligentes d’identification de véhicules » devront en outre permettre d’identifier les véhicules sur deux voies de circulation, « circulant jusqu’à 160 km/h », ainsi que la reconnaissance des numéros d’immatriculation des véhicules « de tous les pays d’Europe ainsi que ceux des Principautés de Monaco et d’Andorre », mais également de « générer et transmettre les données suivantes :
- Lecture des plaques et reconnaissance des numéros d’immatriculation (algorithme OCR embarqué)
- Type de véhicules (VL/Camionnette/Camion/Bus/2 Roues)
- Marque des véhicules
- Couleur des véhicules. »
Des « caméras IA de détection et classification d'objets » devront pour leur part pouvoir classer « en quatre catégories d’objets les informations visualisées, comme les “personnes”, “visages”, “véhicules” et “plaques d’immatriculation” ».
Pour ce qui est des personnes, elles devront analyser la couleur et la longueur des vêtements « haut et bas », le port de lunettes ou non, celui d'un sac, la moyenne d’âge, le genre.
Une « valise drone » et 4 caméras de « reconaissance faciale »
Un autre type de caméras Ultra HD (24 MP à 64 MP) devra permettre l'analyse d'une dizaine de classifications d'objets :
- « dès qu'il y a un mouvement du type d'objet sélectionné dans la zone d'intérêt,
- en cas de présence prolongée du type d’objet sélectionné après son entrée dans la zone d’intérêt,
- objets franchissant un faisceau directionnel configuré au niveau du champ de vision de la caméra,
- objet pénétrant ou apparaissant dans la zone d'intérêt (peut être utilisé pour compter les objets),
- dès qu’un objet pénètre dans la zone d’intérêt,
- dès lors que la limite spécifiée a été atteinte concernant le nombre d’objets pénétrant dans la zone d’intérêt,
- dès lors que la limite spécifiée a été atteinte concernant le nombre d’objets sortant de la zone d’intérêt,
- dès lors qu’un objet pénètre, puis demeure immobile dans la zone d’intérêt pendant la durée définie. »
Le CCTP précise ensuite les « types d’objets en mode extérieur » à analyser : véhicule (sous-types : voiture, camion, bicyclette, motocyclette, autobus) et personne. Puis, « en mode intérieur : Personne », sans préciser à l'intérieur de quels bâtiments des caméras de vidéosurveillance procèderaient de la sorte à de la « classification » d'êtres humains.
En annexe, un fichier .pdf de 69 pages détaille le « panorama » des milliers de caméras de « vidéoprotection des espaces publics et de vidéosurveillance routière ». Où l'on découvre l'emplacement des caméras nomades et « DAI », que 4 des 30 caméras thermiques ont leur fonctionnalité « VSI désactivée », que le CSU de Nice dispose d'une « valise drone », ainsi que de 4 caméras AXIS Q1615 de « reconaissance faciale » (sic) installées en octobre 2018.
À l'époque, Nice et Marseille voulaient en effet expérimenter la reconnaissance biométrique faciale aux portillons d'accès de deux lycées, avant que la CNIL ne lui rappelle qu'elles étaient illicites au regard du RGPD, puis que le tribunal de Marseille ne les invalide pour « excès de pouvoir » et non-respect du RGPD, comme nous l'avions alors narré.
- Un système de reconnaissance faciale testé à l’entrée de deux lycées du Sud de la France
- Quatre associations attaquent la reconnaissance faciale testée dans deux lycées de PACA
- La CNIL étrille la reconnaissance faciale à l’entrée de deux lycées niçois et marseillais
- Interdiction de la reconnaissance faciale : Muselier, Estrosi et Ciotti furieux contre la CNIL
- Reconnaissance faciale : la lettre de la CNIL adressée à Renaud Muselier
- Reconnaissance faciale : le tribunal de Marseille vire les portiques virtuels de deux lycées
2 serveurs dédiés à la « Détection Automatique d’Incidents »
Le CCTP indique que son Centre de Supervision Urbaine est doté de 68 murs d'images, 35 postes opérateurs, 8 serveurs d'analyses vidéo au moyen des logiciels Briefcam, Evitech, Digital Barriers et StereoLabs. À quoi il convient de rajouter 35 murs d'images et 28 postes opérateurs « déportés ».
Les deux datacenters redondant les données issues des caméras comportent chacun 8 hyperviseurs ESXI hébergeant 71 machines virtuelles, une baie de stockage DELL EMC UNITY 600 de 2 pétaoctets de capacité utile (16 disques SAS de 1,6 To, et 420 NL-SAS de 6 To) avec une durée de rétention des images de 10 jours, et 2 serveurs HP DL380 dédiés à l’application de « Détection Automatique d’Incidents » (D.A.I.). Nous y reviendrons.
À quoi il convient de rajouter 12 serveurs équipés de cartes GPU NVIDIA dédiés à l’ « analyse intelligente avancée des images vidéo » en provenance de 3 829 caméras :
- 2 347 caméras de vidéoprotection, vidéosurveillance routière, détection automatique d’incident, surveillance périmétrique,
- 102 caméras associées au contrôle d’accès zones piétonnes,
- 648 caméras embarquées dans les rames de Tramway,
- 404 caméras des stations souterraines et aériennes du réseau de Tramway,
- 328 caméras des bâtiments communaux, sportifs, culturels, ...
Des filtres désactivés car non conformes à la réglementation
Le volet consacré aux applications d'analyse avancée des images vidéo précise qu'elles sont essentiellement basées sur les technologies de Deep Learning et de « Computer Vision ». Elles ont en outre été intégrées dans l’outil d’Hypervision Prysm AppVision, et ont fait l’objet de « développements de traitements et d’interfaces spécifiques ».
La plateforme BriefCam Insights dispose d'une fonction « Synopsis » permettant de réduire la taille des segments vidéo et donc à l’observateur d’analyser les scènes de plusieurs heures en quelques minutes. La technologie avait été développée par un universitaire israélien, et a depuis été rachetée par le groupe japonais Canon.
Sa fonction « REVIEW » permet quant à elle l’analyse des enregistrements des images vidéo et « l’élaboration automatique de tableaux de bords » en appliquant des filtres de recherche tels que :
- « recherche et identification de la distance entre des individus dans le temps et l’espace afin de contrôler le respect des règles de distanciation physique ;
- franchissement de lignes ;
- comptages, trajectoires, sens de déplacements, immobilisation ;
- similarité d’apparence ».
Une troisième fonction « RESPOND » permet de son côté « l’analyse en temps-réel des images vidéo en vue de la génération d’alarmes et/ou l’élaboration de tableaux de bord », en appliquant des filtres tels que :
- règles de reconnaissance de véhicules et de personnes ;
- comptages de véhicules et de personnes.
Le CCTP précise que « d’autres filtres existent mais ne peuvent être activés en raison de leur non-conformité à la réglementation française ».
Des algorithmes développés suite à la prise d'otages à Moscou
Le logiciel Lynx de « Gestion de la Foule par analyse vidéo » permet de son côté de compter les personnes et mesurer les flux de passants, la densité dans des zones prédéfinies, la détection d'évènements particuliers tels qu’un rassemblement de foule, un attroupement, une personne se déplaçant à contresens dans la foule, un mouvement de panique, ou encore de la fumée.
La solution Jaguar de « Protection de Sites par analyse vidéo » vise pour sa part à générer des alarmes en cas de franchissements de lignes, de véhicules à contre-sens ou dans des zones interdites à la circulation, de détection de stationnements interdits, de dépôts sauvages ou de personnes dans des zones interdites en totalité ou sur certaines plages horaires, mais également de « tracking de personnes ou véhicules ».
La société française Evitech de « Vidéo surveillance intelligente » explique avoir développé Lynx et Jaguar à la demande du ministère de la Défense suite à la tragique prise d'otages du théâtre de Moscou en 2012 qui s'était soldée par la mort des 41 terroristes, mais également de 5 otages tués par les terroristes, et 123 autres décédés du fait du gaz paralysant utilisé lors de l'assaut des forces spéciales russes.
Le ministère de la Défense avait alors mandaté la start-up pour développer « un outil permettant de contrôler et de suivre ce type de situation, de désigner amis et ennemis, de mesurer la position précise de leur corps, leur vitesse apparente, et de ne pas perdre ensuite cette désignation au fil des mouvements des personnages de la scène : croisements, masquages, ... »
Les caméras thermiques ne peuvent pas identifier les visages
Le logiciel Cityvision permet lui aussi d'analyser et comptabiliser les flux de passants, les trajectoires des véhicules et de détecter ceux roulant à contre-sens ou dans des zones interdites à la circulation, ainsi que les stationnements interdits, non-respects de la signalisation tricolore.
Il propose en outre une classification des véhicules en 8 catégories, dont la trottinette, ainsi que la « détection d'évènements particuliers tels qu’un rassemblement de foule, un attroupement, une personne se déplaçant à contre-sens dans la foule ».
Créée fin 2017, la société (française) Wintics qui a développé ce qu'elle qualifie d' « observatoire des mobilités en ville » se targue d'avoir décompté, en 2020, 35 millions de véhicules et 7 millions de vélos auprès de plus de 50 clients.
Cityvision est notamment utilisé par la société Evesa (sous-traitant de la ville de Paris sur les sujets d’éclairage public et de signalisation tricolore) pour produire des données de trafic très détaillées par mode de déplacement (vélos, trottinettes, 2-roues motorisés, véhicules légers, poids lourds et bus), en analysant en temps réel les flux des caméras thermiques déployées sur la voirie.
Les analyses « sont réalisées en local au niveau de la caméra (ce que l’on appelle le Edge Computing ou Calcul Embarqué) sans aucun enregistrement ni transmission d’image », et « seules les statistiques anonymes de comptage sont envoyées vers un tableau de bord de visualisation ».
La mairie de Paris a d'ailleurs décidé de publier en open data les données produites par Cityvision afin de « permettre à chacun de connaitre le trafic des différentes modes de déplacement sur des grands axes de la capitale », mais également de les réutiliser pour d’éventuelles études sur les mobilités.
Elle précise que « les images issues de caméras thermiques ne permettent pas d’identifier des visages ou des plaques d’immatriculation. Les données ainsi collectées ne présentent pas de données à caractère personnel ou individuel ».
Le logiciel canadien Avigilon Control Center (ACC), racheté par la société américaine Motorola en 2018, propose lui aussi des alarmes de détection périmétrique, en cas d'entrée ou de sortie de personnes, d'apparition ou disparition d'objets au sein d'une zone prédéfinie, de véhicules à contre-sens ou roulant dans des zones interdites à la circulation, mais également de « recherche par apparence de personnes ou de véhicules ».
Le système de Détection Automatique d’Incidents Flux de l'Américain TELEDYNE FLIR surveille pour sa part le trafic en temps réel afin d'identifier les embouteillages et bouchons, les véhicules arrêtés, lents (hors bouchons) ou à contre-sens, les piétons, objets au sol, fumées et incendies (via des caméras thermiques).
« Smartpolice » et le « suivi des faits d’une manifestation »
La solution APP Vision Prysm utilisée par le CSU intègre par ailleurs un « jumeau numérique », ou « double virtuel » en 3D de la Ville de NICE, permettant de représenter sur un écran et dans les moindres détails, la totalité des dispositifs de sûreté/sécurité : caméras & dômes et aussi haut-parleurs, bornes escamotables...
Elle permet en outre de diffuser des messages sonores sur les 130 dispositifs de diffusion de messages audio répartis dans la ville à l’attention des citoyens « en cas de crise et notamment en cas d’alertes orange ou rouge météorologique », mais également de contrôler les bornes escamotables servant de contrôleur d'accès sur 92 sites, notamment sur la Promenade des Anglais :
« Le Système récupère la plaque d’immatriculation d’un véhicule via les caméras LAPI installées à cet effet et une requête est envoyée au serveur pour interroger la base de données contenant la liste des plaques d’immatriculation des véhicules disposant d’une autorisation d’accès. La descente des bornes escamotables pourra être déclenchée uniquement si la plaque d’un véhicule figure dans cette liste dite "blanche". »
Le système d’Hypervision APP Vision Prysm permet également l’exploitation des caméras et dispositifs de géolocalisation embarqués dans les rames de Tramway, ainsi que celle de la géolocalisation des équipages de police, via l'application de la société Sysoco.
APP Vision Prysm est en outre interfacé au module de main courante informatisée (MCI) de Smartpolice de la société Edicia afin de décrire et historiser les évènements survenus pour les classer et les consulter. Il est possible d’y associer différents types de contenus pour ajouter des détails et fournir plus d’interactions, précise le CCTP :
- « une liste d’objets, par exemple les cameras utilisées pour la surveillance d’un fait ;
- une liste de notes sous forme de textes et d’images afin de compléter la description, par exemple le suivi des faits d’une manifestation ;
- une liste d’alarmes ou d’actions à mener. »
Un Module de Supervision des équipements actifs conçu et développé selon un cahier des charges établi par les Services de la Ville de Nice et « totalement indépendant de la Suite APP Vision Prysm » permet de visualiser en temps réel, sur une carte OpenStreeMap, l’état des équipements (en service, en panne, déposés, détériorés, ...) tels que caméras, dispositifs d’alertes, diffuseurs de messages audio, etc.
La valeur totale de ce projet d'accord-cadre à bons de commande est estimée dans une fourchette allant d'un minimum de 3,6 à un maximum de 42 millions d'euros pour la ville de Nice, de 2,4 à 28 millions d'euros pour la Métropole Nice Côte d’Azur, soit un total pouvant aller de 6 à 70 millions d'euros, pour une durée de 4 ans.
Commentaires (17)
#1
Petite coquille au 5ème paragraphe.
Or un aur (je suppose que c’est un ans )
#1.1
« Or, un an plus tard » : merci, c’est corrigé
#2
C’est pas Paris ici !
( nan en vrai il nous fait honte le monsieur )
#3
Wow ce boulot encore @manhack 👏
Merci
#4
Expérience personnelle (donc statistiquement insignifiante): ce n’est pas parce qu’il y a des caméras partout que la police acceptera (comme elle en a l’obligation) forcément que vous portiez plainte pour un délit de fuite passé juste sous une caméra, et que vous arriverez à déposer la dite plainte avant la fin du délai de rétention des enregistrements (qui est de 10 ou 15j).
#5
Meilleur commercial du monde.
Le système est (serait) capable de détecter 3 gus dans Paris mais un camion dans une zone interdite, c’est pas possible.
Ça me fait penser : Estrosi (et Ciotti aussi il me semble) avaient pas tout deux encensés le système de vidéosurveillance chinois ?
Sinon tout ce système c’est bien, c’est beau, c’est (très) cher.
Quelqu’un a déjà regardé combien d’officiers ont pouvait mettre sur le terrain pour le même prix (maintenance, électricité, locaux, …) ?
Non parce que franchement, les caméras ne sont pas visibles (à moins de les peindre en fluo), donc bon … sentiment d’impunité, tout ça. A part signaler les rodéos urbains (ce que les habitants de quartiers doivent déjà faire), il y a un réel intérêt à tout ça ?
Après, je vois bien un truc à la Person of Interest mais ça sous-entend une IA bienveillante, dans une boite noire, sans que quiconque ait la main dessus. Bonne chance :p
#6
Et combiens d’inculpation(s) ?
Il est vrai que c’est impossible d’usurper une plaque !!
Ps: 17mn de lecture ? vraiment ! cet article ce lit comme du petit lait, bravo
#7
Je me suis fait la même remarque, il faudrait peut-être reconnaitre la couleur, voire le modèle de véhicule, sinon il “suffit” de se faire une doublette de plaque pour pouvoir se balader partout dans les zones piétonnes ; Par exemple une voiture de la police municipale (facile à localiser, c’est écrit dessus :) )
En tout cas cet article est très intéressant, par contre, on voit vient que les 3⁄4 des fonctions ne sont pas utilisées, car illégales. Ce qui serait bien, c’est d’avoir un vrai audit objectif du système et pas une comm’ politique des “résultats”. Je pense que le ROI doit pas être joli-joli :-/
L’avenir de ce type de solutions, pour respecter nos libertés, est de développer l’embarqué : tu entraines l’IA qui va bien, charge l’algo résultant dans la caméra et celle-ci ne sort que ce qu’elle est supposée chercher, en anonymisant tout le reste. C’est le principe de CityVision : le truc apporte une vrai plus value par rapport au capteur sur la route, il est possible d’avoir par catégorie / tranche d’heures : le nombre, les vitesses. Et pourtant le système est (a priori) anonyme.
#8
Rien qu’avec le contrat qui est annoncé entre 6M et 70M sur 4ans, ça nous fait entre 76 et 886 ETP au SMIC sur la période (6-70M€ / 1645€/mois / 48mois)
C’est évidemment un calcul naïf : il y a d’autres frais que simplement le salaire, ils ne sont probablement pas payés au SMIC… Bon même en divisant par disons 4 cette estimation ça nous fait de 20 à 220 flics à mettre sur le terrain, sans compter les 90 qui étaient actuellement payés à regarder la TV
#8.1
Divise déjà par 2, ce que tu touches en brut, ta boite paye le double (charge patronale)
et oui c’est un peu simpliste.
Les prunes auto pour le stationnement gênant est déjà en place :)
Genre tu te mets en double file pour acheter ton pain ou récupérer ton gosse.
Perso, ce type de prunes je trouve ça bien, ca fluidifie énormément le traffic. (je parle uniquement pour les incivilités sur la route).
#9
Merci pour le rappel en début d’articles sur les déclarations de ce marie au sujet de la prétendue efficacité de la vidéosurveillance. Quelle fuite en avant et que d’argent public dépensé pour un résultat « mitigé ».
Quand les Niçois et les Niçoises se prendront des prunes automatique pour chaque petit délit (arrêt de véhicule interdit devant la gare, stationnement rapide sur une place de livraison ou handicapé, torse-nu dans la rue, etc.), ils vont peut-être commencer à remettre en question leur adoration de la vidéosurveillance.
#10
Oui, je ne dis pas que je soutiens ce genre de pratique (ça me fait aussi chier les gens en double-file). Je dis juste que si on fait une petit incivilité une fois de temps en temps et qu’on se fait systématiquement aligné, on va peut-être commencé à se poser des questions.
#10.1
T’as vu du changement suite aux radars automatiques de vitesse ? ou les suivants sur les feux rouges ?
#10.2
Bah oui, comme il dit, on commence à se poser des questions !! Puis ca s’arrête là
#11
Savoureux quand on pense qu’Estrosi qualifie de potentiel terroriste quelqu’un qui court sur un quai de gare, crie aux abords d’une micro de rue, ou semble simplement plus agité que la moyenne dans une foule.
#12
Classification sonore: du coup écouter du rap trop fort ça pourra devenir un délit?
ou alors les caméras diffusent de la musique classique pour adoucir les “meurt!”
#13
Je pensais plus aux autres frais qu’uniquement le salaire : des fringues, voitures, charges (bureaux, chauffage)