Objectifs de la formation
Dans le cadre de ce cours, vous découvrirez comment utiliser Amazon EMR afin de traiter des données grâce à l'écosystème Hadoop. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift et Amazon Kinesis, Amazon QuickSight, Amazon Athena et à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.Clientèle visée
Personnes en charge de la conception et de l'implémentation de solutions de Big Data, comme les architectes de solutions ainsi que les analystes de données souhaitant découvrir les solutions de Big Data sur AWS.Préalables
• Avoir des connaissances de base sur les technologies Big Data, notamment Apache Hadoop et HDFS Pig, Hive et MapReduce.
• Savoir utiliser les principaux services AWS et l'implémentation de cloud public.
• Les participants doivent avoir suivi le cours "Notions de base AWS" ou posséder un niveau d'expérience équivalent.
• La compréhension des concepts d'entrepôt de données, de système de base de données relationnelle et de conception de base données est recommandée.
Formateurs
Gains pour les participants
Comprendre les applications Apache Hadoop dans le contexte d’Amazon EMR
Identifier les composants d’un cluster Amazon EMR
Lancer et configurer un cluster Amazon EMR
Utiliser les frameworks de programmation courante disponibles pour Amazon EMR notamment Hive, Pig and Streaming
Utiliser Hue pour améliorer la facilité d’utilisation de Amazon EMR
Utiliser les analyses en mémoire avec Spark sur Amazon EMR
Identifier les avantages de l’utilisation de Amazon Kinesis pour les processus Big Data proches du temps réel
Utiliser Amazon Redshift pour stocker et analyser efficacement les données
Comprendre et gérer les coûts et la sécurité d’une solution Big Data
Sécuriser une solution Big Data
Identifier les options pour récupérer, transférer et compresser des données
Comprendre Amazon Athena pour les analyses de requêtes ad-hoc
Utiliser le logiciel de visualisation pour représenter les données et les requêtes via Amazon QuickSight
Orchestrer le flux de la Big Data via AWS Data Pipeline.
Architecture de la formation
Introduction à la Big Data sur AWS
-
Vue d’ensemble de la Big data
-
Récupérer et transférer la Big Data
-
Streaming Big Data et Amazon Kinesis
-
Solutions de stockage Big Data
-
Process Big Data et Analyse
L'écosystème Hadoop
-
Apache Hadoop et Amazon EMR
-
Utiliser Amazon EMR
-
Frameworks de programmation Hadoop
-
Inetrfaces Web sur Amazon EMR
-
Apache Spark sur Amazon EMR
Big Data et AWS
-
Amazon Redshift et Big Data
-
Visualiser et Orchestrer la Big Data
-
Gérer les coûts de la Big Data
-
Sécuriser les déploiements de votre Amazon
-
Modèles de conception Big Data.
Si vous avez des questions sur les modalités d'inscription, d'annulation, les horaires, la langue d'enseignement, etc. vous trouverez des réponses dans notre FAQ.
Détails pédagogiques
Type de cours
Formation privée en entreprise
Vous êtes plusieurs à vouloir suivre une formation en particulier dans votre entreprise? Si vous êtes plus de 8 personnes, nous pouvons nous déplacer à vos bureaux pour vous donner votre formation en privé. Contactez-nous pour plus de détails ou demandez-nous une soumission en ligne.
Demander une soumissionFormation privée en entreprise
Vous êtes plusieurs à vouloir suivre une formation en particulier dans votre entreprise? Si vous êtes plus de 8 personnes, nous pouvons nous déplacer à vos bureaux pour vous donner votre formation en privé. Contactez-nous pour plus de détails ou demandez-nous une soumission en ligne.
Demander une soumission