Analyse exploratoire : travailler plus vite sur de meilleures données

Premier tour de piste avec SAS® Visual Analytics pour l'organisme de supervision du contrôle technique

Chaque année, plus de 20 millions de contrôles techniques (100 000 par jour environ) sont centralisés par l'Organisme Technique Central (OTC, groupe UTAC/CERAM).

Pour mieux explorer et exploiter ces données, l'OTC s'est doté en 2013 de SAS Visual Analytics. Retour sur une première année de mise en œuvre, avec les premiers résultats, les premiers enseignements, et les perspectives de développement.

SAS Visual Analytics permet de bien voir les tendances générales, avec la possibilité de retourner en un clic à la donnée de base pour l'examiner.

Thierry Ageron
Responsable Etudes & Productions Statistiques du groupe UTAC/CERAM

Mis en place en 1992 pour les véhicules légers, le contrôle technique automobile est aujourd'hui assuré par 6 000 installations de contrôle, la plupart appartenant à l'un des cinq grands réseaux opérant sur tout le territoire. Depuis l'origine, l'UTAC a été notifié par le ministère des Transports comme Organisme Technique Central pour recueillir, aujourd’hui en temps réel, les données issues de chaque contrôle. L'organisme surveille les opérateurs et délivre les agréments, s'assure de l'homogénéité des contrôles et tient à jour des informations sur l'état du parc automobile français pour adapter et faire évoluer les équipements et les méthodes de contrôle.

Aujourd'hui, l'OTC dispose de plusieurs bases de données contenant l’ensemble des contrôles techniques depuis 1992 – soit environ 400 millions de contrôles au total, avec quelque 450 variables relevées !

Installation de l'outil : une formation express

Déjà équipé d'outils SAS pour l'analyse des données, l'OTC a choisi en 2013 de se doter de SAS Visual Analytics. « Avec une telle volumétrie, il était impossible d'ignorer la data visualisation... au moins pour voir ! » explique Thierry Ageron, responsable Etudes & Productions Statistiques du groupe UTAC/CERAM. L'OTC a donc choisi de partir sur une configuration minimale (un serveur de 16 cœurs avec 100 Go de données lues sur disque et 50 Go de données en mémoire) pour tester l'exploration de données et les possibilités de l'outil en matière d'édition de rapports. Une base de données de 42 Go contenant tous les contrôles effectués depuis 2008 (soit 43 colonnes et 148 millions de lignes), a ainsi été chargée « in memory ».

La mise en place de SAS Visual Analytics s'est réalisée en quatre jours : deux jours pour l’installation du produit, puis deux jours de formation et de prise en main pour les quatre statisticiens chargés d'explorer l'outil. Travailler en amont avec les consultants SAS pour assurer le transfert de compétences constituait pour Thierry Ageron un investissement humain essentiel : « On imagine souvent qu'on peut en faire l'économie, on se dit que 'ça va passer'... mais prendre le temps au départ n'est pas un luxe inutile : c'est un vrai facteur de succès ! ».

Analyse exploratoire : travailler plus vite sur de meilleures données

La première étude menée avec « VA » a concerné les temps de contrôle. Avec d'emblée, un atout important : la détection très facile des données atypiques (des contrôles inférieurs à 5 minutes, par exemple... voire des durées négatives en cas de mauvaise saisie des données), et la possibilité de les éliminer in-memory pour travailler plus vite sur une base statistiquement plus fiable. « Nous n'avions pas cette souplesse auparavant ! » note Thierry Ageron, qui rappelle qu'outre les études statistiques, les cas les plus étonnants peuvent être transmis aux services dépendant du ministère des transports, qui peuvent ainsi « contrôler les contrôleurs ».

Des premières analyses ont ainsi été réalisées pour comparer les durées moyennes selon les réseaux, l'installation de contrôle, le jour de la semaine - ou selon les mois de l'année, avec des changements qui apparaissent clairement lors des deux mois d'été... Le bilan ? « SAS Visual Analytics permet de bien voir les tendances générales, avec la possibilité de zoomer sur une situation qui semble atypique, et de retourner en un clic à la donnée de base pour l'examiner. Ce qui nous prenait beaucoup de temps avant se fait ici très facilement ». Un mode d'exploration idéal pour échanger sur nos hypothèses lorsque l'on explore les données à plusieurs.

Rapports : facilité d'export et diffusion mobile

L'échange, c'est ce que permet aussi Visual Analytics avec l'édition de rapports dynamiques, qui peuvent être diffusés sur tablette auprès des « clients » de l'OTC : ministère des transports et directions régionales, réseaux d'opérateurs, gendarmerie, douanes... Thierry Ageron salue la facilité d'export, reste à voir si la diffusion mobile entrera dans la culture de ses interlocuteurs. Jusqu'ici, son équipe en est restée à des premiers tests – pour comparer deux centres sur un mois donné, par exemple. « Nous avons déjà plusieurs centaines de rapports sous format pdf, explique-t-il. Certains donnent pleine satisfaction à nos clients, il nous faut encore réfléchir avant de passer au tout-VA. »

Le moment est venu en effet pour l'organisme d'étudier l'opportunité d'intégrer plus avant Visual Analytics dans les processus de production et de restitution des informations. Restera-t-il un outil parmi d'autres dans l'arsenal de l'OTC, ou peut-il à terme remplacer le portail décisionnel actuel ? Une décision à la fois technique, financière et culturelle, qui tiendra aussi compte de l'apparition récente du « petit frère » de VA, SAS® Visual Statistics... 

Des perspectives multiples

En attendant, une autre utilisation de la data visualisation est déjà envisagée, pour étudier les retards de présentation des véhicules au contrôle technique. « Pendant longtemps, nous n'avons pu réaliser ces analyses que sur des échantillons, et travailler sur la base en frontal était gênant. Aujourd'hui, nous pouvons travailler sur l'exhaustivité des données grâce à un ODS dédié. Reste à tester l'analyse avec SAS Visual Analytics, pour voir ce que pourra apporter la souplesse de l'outil. »

Parmi les perspectives se profile aussi l'intégration de données non structurées – en reliant par exemple les informations du contrôle technique avec des données d'accidentologie venues de l'extérieur. Mais la route est encore longue !

SAS® Visual Analytics : vitesse, agilité et mobilité

SAS Visual Analytics, la solution phare de SAS dédiée au reporting agile, à l'exploration visuelle et à l'analyse des données, est disponible désormais sur des petits serveurs, ouvrant son utilisation aux entreprises de toutes tailles. Accédez partout et immédiatement à vos informations.
Testez gratuitement SAS Visual Analytics en ligne avec des données correspondant à votre secteur d'activité.

Vos données comme vous ne les avez jamais vues : qu’importent votre secteur d'activité, votre profil ou le volume de données à analyser, vous pouvez, avec SAS Visual Analytics, explorer toutes les données pertinentes rapidement et aisément. Rejoignez-nous sur nos évènements

Lancée en 2012, SAS Visual Analytics a déjà été adoptée par près de 2 000 entreprises dans le monde, dont une centaine en France.

UTAC-OTC

Enjeux

  • Optimiser l’accès à la donnée
  • Améliorer la recherche de données atypiques
  • Produire des statistiques pertinentes et les mettre rapidement à disposition des clients

Solution

Bénéfices

  • Mise en place rapide : deux jours pour l’installation du produit, puis deux jours de formation et de prise en main
  • Détection très facile des données atypiques
  • Visualisation des tendances générales, avec la possibilité de zoomer
  • Mode d'exploration idéal pour échanger sur les hypothèses lorsque l'on explore les données à plusieurs
  • Edition de rapports dynamiques qui peuvent être diffusés sur tablette

Les résultats présentés dans cet article sont spécifiques à des situations, problématiques métiers et données particulières, et aux environnements informatiques décrits. L'expérience de chaque client SAS est unique et dépend de variables commerciales et techniques propres, de ce fait les déclarations ci-dessus doivent être considérées dans un contexte. Les gains, résultats et performances peuvent varier selon les configurations et conditions de chaque client. SAS ne garantit ni ne déclare que chaque client obtiendra des résultats similaires. Les seules garanties relatives aux produits et services de SAS sont celles qui sont expressément stipulées dans les garanties contractuelles figurant dans l’accord écrit conclu avec SAS pour ces produits et services. Aucune information contenue dans le présent document ne peut être interprétée comme constituant une garantie supplémentaire. Les clients ont partagé leurs succès avec SAS dans le cadre d’un accord contractuel ou à la suite de la mise en œuvre réussie du progiciel SAS. Les noms de marques et de produits sont des marques déposées de leurs sociétés respectives.