- Clients SAS dans le monde
- Customer Stories
- SNCF Transilien
Le Big Data pour améliorer les transports franciliens
Les données sont de moins en moins un domaine réservé aux data scientists.
90%
Prévision de trafic fiable
Performance réalisée avec : • SAS® Visual Analytics • SAS® Office Analytics
SNCF Transilien s’est lancée dans l’aventure de l’analytique, en misant sur la visualisation de données pour embarquer un maximum de collaborateurs.
3,2 millions : c’est le nombre de voyageurs qui empruntent chaque jour les gares et les lignes de Transilien, le réseau SNCF d’Ile-de-France.
Pour l’entreprise, ce trafic génère des millions de données - à chaque passage devant un valideur ou à chaque transaction dans un guichet automatique.
« Les données sont de moins en moins un domaine réservé aux data scientists. Aujourd’hui elles sont utilisées en temps réel par différents profils, à tous les niveaux de l'entreprise, que ce soit pour suivre les indicateurs ou pour améliorer la gestion des gares. Fanette Recours Expert Data SNCF Transilien
Valoriser l'analytique
Le premier défi analytique était de pouvoir exploiter ces millions de données disponibles pour :
- mieux suivre et anticiper les éventuelles pannes
- suggérer aux voyageurs des itinéraires alternatifs afin d'optimiser leurs déplacements
- améliorer le planning d'exploitation des conducteurs de train et de l'ensemble du personnel, notamment en envoyant davantage de contrôleurs dans les secteurs où le risque de fraude est élevé
L'ajout de sources de données externes a ensuite permis d'enrichir les informations disponibles. En ajoutant des données liées à des événements culturels ou sportifs, par exemple, l'entreprise peut mieux anticiper les augmentations ou les baisses de trafic dans certaines gares ou sur certaines lignes. De même en cas d’interférence ou d’incident technique, pour l’information et le conseil aux voyageurs.
Poupées russes et scalabilité
Pour approfondir l’exploitation de ces informations, SNCF Transilien a choisi d’investir dans la donnée, selon un modèle inspiré des poupées russes : de multiples couches composées de projets de toutes tailles, liées entre elles et qui, une fois mises en commun, composent le processus de data science de l'entreprise. Cette approche permet de se concentrer sur un point précis (l'une des poupées intérieures), sans perdre de vue l'ensemble de l'organisation (la poupée extérieure).
Ce « voyage analytique » a débuté sur un scope réduit - mais l’organisation envisageait d’emblée de le déployer plus largement. « Nous souhaitions couvrir à la fois les besoins actuels et futurs, explique Fanette Recours, Expert Data chez SNCF Transilien. Nous avons donc dès le départ posé les questions essentielles sur la gouvernance, l’infrastructure, les outils et la qualité des données ».
Une aventure collective
Dès le départ, l’entreprise a fait en sorte d’impliquer un maximum de collaborateurs. « Les données sont de moins en moins un domaine réservé aux data scientists. Aujourd’hui elles sont utilisées en temps réel par différents profils, à tous les niveaux de l'entreprise, que ce soit pour suivre les indicateurs ou pour améliorer la gestion des gares », poursuit Fanette Recours. La visualisation de données a été un élément décisif pour réussir cette démocratisation de l’analytique, de par sa simplicité d’utilisation et l’immédiateté des résultats. C’est ainsi qu’aujourd’hui, une application informe directement les gestionnaires de gares des prévisions de trafic pour les aider à planifier les ressources nécessaires.
Faits et chiffres
90 %
Prévision de trafic fiable
11h > 2h
Requêtes de données beaucoup plus rapide
8 %
Diminution de la duplication des données
Une approche plus « pull » que « push »
L’adoption des différents projets analytiques par les utilisateurs est une des clés de la réussite de ce « voyage » qui ne fait que commencer. C’est ainsi que l’équipe Data science de SNCF Transilien propose régulièrement de nouvelles applications, sans toutefois les imposer : les métiers décident eux-mêmes d’aller plus loin s’ils le souhaitent.
« Tout le monde n’a pas une vision claire de ce qu’il est possible de faire à partir de nos données, note Fanette Recours. Nous avons donc opté pour une approche plus souple, basée sur la conviction et non sur la contrainte. Cela correspond mieux à la culture de l’entreprise. »
Des résultats déjà probants
Plusieurs étapes essentielles du parcours ont déjà été réalisées. Ainsi, les entrepôts de données ont été intégrés dans une véritable gouvernance des données. Une politique de data management a permis d’optimiser et de sécuriser les flux d’informations, tandis que la qualité des données fait l’objet d’un effort continu de l’ensemble des personnes concernées.
Et des résultats concrets sont déjà au rendez-vous :
- Les prévisions de trafic sont aujourd'hui fiables à 90 %, ce qui rend la planification des opérations beaucoup plus précise.
- Le temps de traitement des données est passé de 11 heures à 2 heures (82% de gain de temps).
- La duplication des données a diminué de 8 %. Les efforts d'élimination des doublons se poursuivent pour améliorer encore ce chiffre.
Vers de nouveaux « business models »
Et bien sûr, le voyage est loin d’être terminé. SNCF Transilien a déjà identifié de multiples opportunités additionnelles pour tirer parti de ses données et prévoit de continuer à développer sa stratégie de data science.
Une stratégie qui pourrait d’ailleurs déboucher sur des innovations commerciales, comme le paiement à la consommation, sur le modèle du « pay-per-use » londonien : chaque utilisateur ne paierait qu’à la fin du mois selon sa consommation réelle, calculée par les informations du pass Navigo. Un exemple parmi d’autres des nouveautés qui pourraient améliorer l’expérience de voyage de millions de franciliens...
Les résultats présentés dans cet article sont spécifiques à des situations, problématiques métiers et données particulières, et aux environnements informatiques décrits. L'expérience de chaque client SAS est unique et dépend de variables commerciales et techniques propres, de ce fait les déclarations ci-dessus doivent être considérées dans un contexte. Les gains, résultats et performances peuvent varier selon les configurations et conditions de chaque client. SAS ne garantit ni ne déclare que chaque client obtiendra des résultats similaires. Les seules garanties relatives aux produits et services de SAS sont celles qui sont expressément stipulées dans les garanties contractuelles figurant dans l’accord écrit conclu avec SAS pour ces produits et services. Aucune information contenue dans le présent document ne peut être interprétée comme constituant une garantie supplémentaire. Les clients ont partagé leurs succès avec SAS dans le cadre d’un accord contractuel ou à la suite de la mise en œuvre réussie du progiciel SAS. Les noms de marques et de produits sont des marques déposées de leurs sociétés respectives.