Formation - Data scraping : collecter des données à grande échelle sur le web Présentiel
Dernière mise à jour : 25/03/2026
Objectifs de la formation
- Comprendre le fonctionnement et les limites du scraping
- Connaître les bases de programmation en Python
- Programmer un robot simple en Python
- Collecter automatiquement des données en ligne
Public visé
Programme
Jour 1
- Présentation du formateur et tour de table
- Définition du scraping et de ses différents niveaux de difficulté sur plusieurs supports (depuis le web, depuis du papier, depuis des PDF)
- Passage en revue d'utilisation du scraping dans des projets pour bien comprendre l'intérêt d'une telle pratique ainsi que ses limites
- L'environnement légal : découverte de ce qu'il est autorisé de scrapper et de ce qui ne l'est pas
- L'architecture d'internet : pour scraper des sites, il faut avant tout savoir comment Internet fonctionne
- Qu'est ce qu'un « client » ? Qu'est qu'un « serveur » ? Pourquoi est-ce important ?
- Utiliser des données déjà structurées au travers d'une API
- Sur Internet, les échanges utilisent HTTP et HTML : comment impactent-t-ils nos scrapers ?
- Comprendre comment fonctionne le HTML pour mieux extraire des informations. Qu'est qu'une balise HTML ? Un attribut ? Comme identifier certains éléments avec une CLASS ou un ID ?
- Initiation au Python, le langage le plus répandu pour coder un scraper : les fichiers, les variables, l'affichage d'information, les conditions et les boucles
- Utiliser des fonctions et manipuler des CSVs pour lire et enregistrer des données
- Prise en main d'outils spécifiquement dédiés au scraping : Beautiful Soup – pour automatiser les opérations les plus courantes – et CSS Select – pour mieux cibler les éléments à extraire
Jour 2
- Mise en pratique sur un scraper simple (requêtes GET, pages séquencées)
- Identifier la stratégie à adopter pour naviguer sur le site
- Travail individuel pour coder du scraper
- Analyse des résultats obtenus et des difficultés rencontrées
- Mise en pratique sur un scraper complexe : envoyer des données à un site Internet pour obtenir des résultats plus complexes
- Identifier la stratégie à adopter en fonction du site
- Travail individuel pour coder le scraper
- Analyse des résultats obtenus et des difficultés rencontrées
- Débrief de la session et évaluation à chaud de la formation par les participant·es
Témoignages
"Introduction vraiment intéressante au web data scraping avec beaucoup de mise en oeuvre pratique."
Xavier
"Bases théoriques + mise en application sur des problématiques que nous avons à traiter dans notre métier : répond parfaitement à la demande initiale !"
Thomas
"Trouver des solutions pour récupérer des donnés plus rapidement ou de façon récurrente."
Maude, responsable data
Modalités pédagogiques
En présentiel ou en classe virtuelle synchrone en fonction de l'affluence
Les concepts sont expliqués dans des présentations et mis en pratique sur des cas concrets, du plus simple au plus compliqué.
Théorie : environ 20%. Exercices pratiques : environ 80%.
Prérequis
Matériel requis
Modalités d'évaluation et de suivi
1- Positionnement
Un questionnaire en ligne est adressé aux participant·e·s avec la convocation de manière à évaluer leur niveau initial et leurs attentes.
2-Evaluation des acquis
Au cours de la formation, les exercices réalisés permettent au formateur ou à la formatrice d'évaluer l'acquisition des compétences
3- Attestation
Une attestation des acquis de fin de formation est adressée par mail aux apprenants suite à la session
Moyens et supports pédagogiques
Formateurs et formatrices
Victor ALEXANDRE
Je suis datajournaliste au Parisien depuis 2015. Au quotidien, j’interviens sur le data management, le knowledge management, les datavisualisations, les statistiques, le rich media, les longs formats et les enrichissements interactifs. Je forme au datajournalisme et aux bases du webscraping avec R, y compris les publics les plus novices.
Informations sur l'accessibilité
Informations sur l'admission
Dès la validation de votre souhait, un devis vous sera proposé. A la validation de votre inscription, une convention ou un contrat de formation vous sera adressé.
Chez Samsa.fr, votre inscription est l'affaire de quelques heures - mais attention aux délais complémentaires qui peuvent être demandés par vos financeurs ! Nous sommes là pour vous accompagner dans vos démarches, n'hésitez pas à nous contacter pour toutes questions !