Nom de fichier: | Udemy – Ingénierie des données : Python, Machine Learning, ETL, Web Scraping |
Source du contenu: | https://www.udemy.com/course/data-engineering-pythonmachine-learningetlweb-scraping/ |
Taille du fichier: | 3,2 Go |
Éditeur: | udemie |
Mis à jour et publié: | 27 juillet 2024 |
Bienvenue dans ce cours. qui est conçu pour vous doter des compétences et des connaissances essentielles nécessaires pour exceller dans le domaine en évolution rapide de l’ingénierie des données. Que vous soyez un débutant ou un professionnel expérimenté souhaitant élargir vos compétences, ce cours propose une approche détaillée et pratique de la maîtrise de l’ingénierie des données.
Aperçu du cours:
L’ingénierie des données est l’épine dorsale de la science et de l’analyse des données modernes, fournissant la base de la collecte, du traitement et de l’analyse de grands ensembles de données. Ce cours commence par les bases et progresse progressivement vers des sujets plus complexes, garantissant une solide compréhension de chaque concept avant de passer au suivant.
Section 1:Aperçu de l’ingénierie des donnéesNous commençons par une introduction à l’ingénierie des données, couvrant son rôle au sein de l’écosystème des données. Vous découvrirez les concepts clés, la terminologie et le flux de travail typique d’un ingénieur de données, de la collecte de données à l’analyse. Cette section prépare le terrain pour les aspects plus techniques à venir.
Section 2: Configuration de l’environnement PythonPython est un outil fondamental pour les ingénieurs de données. Dans cette section, vous apprendrez comment configurer votre environnement Python sur Windows et macOS, y compris la création et l’activation d’environnements virtuels. Nous couvrirons également des outils essentiels tels que Jupyter Notebook et des éditeurs de texte populaires, vous préparant à une programmation Python et à une manipulation de données efficaces.
Section 3 : Fondamentaux de la programmation PythonUne fois votre environnement configuré, nous plongeons dans la programmation Python. En commençant par les expressions et instructions de base, vous progresserez vers des sujets plus complexes tels que les types de données, les variables, les listes, les tuples, les dictionnaires, les instructions de flux de contrôle et les fonctions. Cette section garantit que vous disposez d’une base solide en Python, ce qui est crucial pour les tâches d’ingénierie des données.
Section 4: Manipulation et visualisation de données avec PythonApprenez à exploiter la puissance des Pandas pour la manipulation des données. Vous découvrirez comment créer et gérer des séries et des DataFrames, charger et inspecter des ensembles de données, nettoyer et transformer des données et visualiser des données à l’aide de diverses techniques. À la fin de cette section, vous serez apte à préparer et analyser des données pour obtenir des informations.
Section 5:Les bases de l’apprentissage automatiqueCette section vous présente les bases de l’apprentissage automatique. Vous en apprendrez davantage sur le prétraitement des données, la gestion des valeurs manquantes, l’encodage des variables catégorielles et l’ingénierie des fonctionnalités. Nous vous guiderons tout au long de la formation et de l’évaluation des modèles d’apprentissage automatique, en faisant des prédictions et en visualisant les résultats. Vous apprendrez également à enregistrer et charger des modèles pour une utilisation future.
Section 6: Création et exécution de packages ETL avec SSIS et SQL ServerExplorez le monde des processus d’extraction, de transformation et de chargement (ETL) à l’aide de SQL Server Integration Services (SSIS). Vous apprendrez à créer et à gérer des packages ETL, à gérer des données provenant de diverses sources et à automatiser les flux de travail de données. Cette section fournit des compétences pratiques pour gérer des tâches d’intégration de données à grande échelle.
Section 7: Extraction de données à l’aide du Web ScrapingEnfin, nous abordons les techniques de web scraping utilisant BeautifulSoup et Scrapy. Vous apprendrez à extraire des données de sites Web, à écrire et tester des scripts de web scraping et à enregistrer les données récupérées pour analyse. Cette section vous permet d’acquérir les compétences nécessaires pour collecter des données sur le Web, un atout précieux pour tout ingénieur de données.
Apprenants prévus:
Ce cours est idéal pour les futurs ingénieurs de données, analystes de données, développeurs de logiciels, étudiants, passionnés de technologie et professionnels en transition vers des rôles d’ingénierie de données. Aucune expérience préalable n’est requise, ce qui le rend accessible aux débutants.
Pourquoi s’inscrire ?
En vous inscrivant à ce cours, vous acquerrez une expérience pratique et concrète des outils et techniques utilisés par les ingénieurs de données. Vous apprendrez à créer des pipelines de données robustes, à manipuler et analyser des données, ainsi qu’à créer et déployer des modèles d’apprentissage automatique. Notre approche étape par étape garantit que vous pouvez appliquer ces compétences en toute confiance dans des scénarios du monde réel, ce qui fait de vous un atout précieux dans le secteur axé sur les données.
Rejoignez-nous dans ce voyage pour maîtriser l’ingénierie des données et libérer la puissance des données!