SYNOPSIS

Les portails public de données ouvertes sont devenus depuis quelques années une réalité. Ceci étant dit, la disponibilité des données ne résout pas complètement le challenge de leur exploitation. L’utilisateur doit ainsi pouvoir jongler entre la variété des portails, l’absence de normalisation sur le format et/ou la structure des jeux de données et leur courte disponibilité temporelle.
Cette formation permettra aux stagiaires d’être sensibilisé à l’exploitation de ces jeux de données ouverts, par le biais d’un exemple concret : la gestion des systèmes de vélos partagés dans deux grandes villes françaises (Bordeaux et Lyon). De la récupération des données à leur analyse, et même jusqu’à la retranscription des résultats par le biais d’une API Web, cette formation permettra d’illustrer l’étude complète de jeux de données ouverts.

OBJECTIFS

Grâce à cette formation, vous pourrez acquérir les compétences suivantes :

  • Savoir récupérer un jeu de donnée ouvert proposé sur un portail public
  • Faire des requêtes sur une base de données depuis Python
  • Mettre en œuvre une analyse statistique élémentaire
  • Rendre compte de ses résultats via une API web

PROGRAMME

Ce programme est donné à titre indicatif. Il peut être adapté selon les besoins.

  • Extraction des données depuis les portails publics de données ouvertes
    • Découverte des portails Open Data de Bordeaux et de Lyon
    • Récupération d’un jeu de données simple (disponibilité des vélos partagés) depuis les sites Web
    • Entrée des données vélo en base de données
    • Manipulation des données en base depuis psql (PostgreSQL)
    • Manipulation des données en base depuis Python
    • Automatisation de l’acquisition des données via un CRON Python
  • Analyse statistique de la disponibilité des vélos partagés
    • Description des données : statistiques élémentaires
    • Extraction de features : créer de l’information additionnelle
    • Classification des stations en fonction du profil de disponibilité de leurs vélos
    • Prédiction de la disponibilité des vélos en stations à court terme
  • Visualisation des données
    • Affichage des données géo-référencées dans QGIS
    • Conception d’un API Web simple pour visualiser les données d’une base

DURÉE

3 jours

PRÉ-REQUIS

Aisance en langage Python

Connaissances en bases de données et du langage SQL

Connaissance des formats de données les plus communs (csv, json)

Notions de programmation Web (scrapping, réalisation d’API simples)

Les prochaines sessions inter-entreprise auront lieu aux dates suivantes (Lyon ou Paris):

.

N’hésitez pas à nous contacter pour des formations intra-entreprise, pour avoir le choix dans les dates et permettre un contenu adapté à vos besoins.

Vous souhaitez participer à cette formation ?

Merci de nous donner les détails ci-dessous si vous le pouvez:

* Sur la formation

Veuillez nous indiquer le lieu de la formation , le nombre de personnes concernées, le niveau initial des participants, les contraintes de calendrier, les attentes particulières.

* Vos coordonnées

Organisation, Adresse, Personne contact, Email, TVA intracommunautaire.

Nous vous répondrons dans les meilleurs délais.