SYNOPSIS
Sujet récurrent et en plein essor depuis ces dernières années, la Data Science, ou science des données, recouvre des domaines à l’interface entre les statistiques, le machine learning, l’informatique et le domaine métier. Les méthodes du Machine Learning, ou apprentissage automatique, se caractérisent par l’utilisation d’algorithmes permettant la résolution de problèmes mathématiques à partir des données.
Cette formation se focalise sur l’emploi des outils de la Data Science dans le domaine des Systèmes d’Information Géographique. Associés aux outils propres aux SIG, ceux-ci font de Python un outil extrêmement puissant pour l’analyse des données géospatiales.
Les stagiaires seront principalement conduits à expérimenter par eux-mêmes l’ensemble de l’éco-système associé.
OBJECTIFS
Grâce à cette formation, vous pourrez acquérir les compétences suivantes :
-
- Maîtriser l’utilisation des bibliothèques numpy et pandas pour l’analyse de données, scikit-learn pour l’implémentation des méthodes de Machine Learning
- Connaître les différentes bibliothèques Python pour le domaine des SIG
- Savoir appliquer les outils de la Data Science avec des données géospatiales, de la collecte des données jusqu’à la production d’une analyse cartographique
PROGRAMME
Ce programme est donné à titre indicatif. Il peut être adapté selon les besoins.
- Rappels
- Rappels des bases du traitement de données (bibliothèques numpy, pandas)
- Rappels de la typologie des algorithmes de machine learning, et applications possibles aux données géographiques (scikit-learn)
- Rappels des bases du traitement de données avec PostgreSQL, et principales opérations de traitement de données géospatiales avec PostGIS
- Découverte des formats de données pour l’analyse géospatiale en Python
- Données vecteur, du json au geojson (geojson, fiona)
- Projections géographiques (pyproj)
- Données vecteur, manipuler des géométries en Python (shapely, geopandas)
- Données raster, pixels et métadonnées (GDAL, rasterio)
- Rendu cartographique
- Produire une carte en Python (Folium)
- Vers des analyses cartographiques plus poussées ; utilisation de QGIS.
- Étude de cas 1 : la base OpenStreetMap
- Comment lire les (méta-)données d’OpenStreetMap, revue des solutions
- Exploiter la base OpenStreetMap dans une problématique Data Science
- Étude de cas 2 : à déterminer (à partir d’une plateforme d’Open Data, ou d’un cas client, au choix)
- Conduire une analyse statistique complexe à partir de données géoréférencées (ex: prédiction des disponibilités des vélos en libre-service, à l’échelle d’une ville)
DURÉE
3 jours
PRÉ-REQUIS
Bonne connaissance du langage Python
Connaissances en calcul scientifique et en Data Science
Notions en SQL pour le requêtage de base de données
Notions en SIG
Les prochaines sessions inter-entreprise auront lieu aux dates suivantes (Lyon ou Paris):
.
N’hésitez pas à nous contacter pour des formations intra-entreprise, pour avoir le choix dans les dates et permettre un contenu adapté à vos besoins.
Vous souhaitez participer à cette formation ?
Merci de nous donner les détails ci-dessous si vous le pouvez:
* Sur la formation
Veuillez nous indiquer le lieu de la formation , le nombre de personnes concernées, le niveau initial des participants, les contraintes de calendrier, les attentes particulières.
* Vos coordonnées
Organisation, Adresse, Personne contact, Email, TVA intracommunautaire.
Nous vous répondrons dans les meilleurs délais.
DS2: PYTHON POUR LE CALCUL SCIENTIFIQUE and DS3 : FORMATION DATA SCIENCE EN PYTHON)
- Notions in SQL (database requesting)
- Notions in GIS
The next courses (Lyon or Paris):
.
Contact us for on-site trainings (dates are flexible to your needs).
You want to participate in this training ?
Please give us the details below if you can:
* Training
Place of training, Number of people involved, Initial level of participants, Time constraints, Specific expectations
* Contact details
Organization, Address, Contact, Email, Intracommunity VAT