SYNOPSIS

Sujet récurrent et en plein essor depuis ces dernières années, la Data Science, ou science des données, recouvre des domaines à l’interface entre les statistiques, le machine learning, l’informatique et le domaine métier. Les méthodes du Machine Learning, ou apprentissage automatique, se caractérisent par l’utilisation d’algorithmes permettant la résolution de problèmes mathématiques à partir des données.
Cette formation se focalise sur l’emploi des outils de la Data Science dans le domaine des Systèmes d’Information Géographique. Associés aux outils propres aux SIG, ceux-ci font de Python un outil extrêmement puissant pour l’analyse des données géospatiales.
Les stagiaires seront principalement conduits à expérimenter par eux-mêmes l’ensemble de l’éco-système associé.

OBJECTIFS

Grâce à cette formation, vous pourrez acquérir les compétences suivantes :

  • Savoir utiliser les outils de la Data Science avec des données géospatiales
  • Maîtriser l’utilisation des bibliothèques pandas pour l’analyse de données, scikit-learn pour l’implémentation des méthodes de Machine Learning et des différentes bibliothèques OpenSource dans le domaine des SIG

PROGRAMME

Ce programme est donné à titre indicatif. Il peut être adapté selon les besoins.

  • Configuration de son espace de travail
    • Installation de Python, de l’interpréteur ipython et de jupyter-notebook
    • Présentation des gestionnaires de paquets (pip, conda…)
    • Installation des bibliothèques dédiées à l’analyse de données (numpy, pandas, matplotlib, seaborn, Luigi)
    • Installation des bibliothèques de SIG (psycopg2, pyproj, pyosmium, folium)
    • Installation de postgres et postgis
  • Collecte des données géospatiales
    • Lecture/écriture de/vers le format CSV
    • Lecture/écriture de/vers le format json
    • Lecture/écriture de/vers une base de données avec psycopg2 et Luigi
    • Lecture de données OpenStreetMap avec pyosmium
  • Analyse de jeux de données géospatiales
    • Statistiques élémentaires et compréhension des variables en présence
    • Manipulation des données avec pandas
    • Application d’algorithmes de machine learning avec scikit-learn
    • Visualisation des données avec matplotlib et seaborn
  • Cartographie
    • Rendu cartographique en Python avec folium
    • Rendu cartographique sur QGIS

DURÉE

3 jours

PRÉ-REQUIS

Bonne connaissance du langage Python

Connaissances en calcul scientifique et en Data Science

Notions en SQL pour le requêtage de base de données

Notions en SIG

Les prochaines sessions inter-entreprise auront lieu aux dates suivantes (Lyon ou Paris):

.

N’hésitez pas à nous contacter pour des formations intra-entreprise, pour avoir le choix dans les dates et permettre un contenu adapté à vos besoins.

Vous souhaitez participer à cette formation ?

Merci de nous donner les détails ci-dessous si vous le pouvez:

* Sur la formation

Veuillez nous indiquer le lieu de la formation , le nombre de personnes concernées, le niveau initial des participants, les contraintes de calendrier, les attentes particulières.

* Vos coordonnées

Organisation, Adresse, Personne contact, Email, TVA intracommunautaire.

Nous vous répondrons dans les meilleurs délais.

DS2: PYTHON POUR LE CALCUL SCIENTIFIQUE and DS3 : FORMATION DATA SCIENCE EN PYTHON)

  • Notions in SQL (database requesting)
  • Notions in GIS

 

The next courses (Lyon or Paris):

.

Contact us for on-site trainings (dates are flexible to your needs).

You want to participate in this training ?

Please give us the details below if you can:

* Training

Place of training, Number of people involved, Initial level of participants, Time constraints, Specific expectations

* Contact details

Organization, Address, Contact, Email, Intracommunity VAT