Paste your Google Webmaster Tools verification code here

Big Data

La SNCF à l’heure du Big Data

on

La SNCF se joint à la plateforme Datascience.net et lance un jeu concours pour les data scientists, le challenge est d’élaborer un modèle prédictif de fréquentation des gares.

Chaque jour en Ile de France, la SNCF déclare transporter plus 3 millions de passagers dans ses trains Transilien. La prédiction de la fréquentation des gares est donc un enjeu vital pour la compagnie ferroviaire qui souhaite proposer « les aménagements , offres et services bien dimensionnés et les plus adaptés » à ses voyageurs. La SNCF met donc à libre disposition ses données afin que les data scientists puissent élaborer un modèle prédictif du nombre de voyageurs montant dans une gare.

Les participants disposent de deux échantillons de données sous forme de fichiers csv :

  • Un échantillon d’apprentissage : une liste de 276 gares et point d’arrêts, qui peuvent servir à établir le modèle de prévision, associés au nombre de voyageurs montant.
  • Un échantillon de test : une liste de 105 gares qui sont réservées pour le calcul de la performance du modèle.

Toutes les données externes en open data sont également utilisables et pourront notamment être trouvées sur data.sncf.com et data.gouv.fr. Les 3 meilleurs contributeurs se verront chacun remettre 600 euros en « chèque cadeau SNCF« . Vous avez jusqu’au 30 septembre 2014 pour participer !

Les détails du concours sont à lire ici.

Pour ma part, je pensais mettre au point un modèle prédictif des grèves de la SNCF et de la RATP, mais cela me semble être un projet un peu trop simple.

Commentaires

commentaires

About Thomas Graindorge

Fan de nouvelles technologies, je suis co-fondateur du site After the Web. N'hésitez pas à me contacter pour devenir à votre tour rédacteur sur le site.

Recommended for you

You must be logged in to post a comment Login

Leave a Reply