AWS Glue pour Apache Spark annonce le lancement de six nouveaux connecteurs de base de données : Teradata, SAP HANA, Azure SQL, Azure Cosmos DB, Vertica et MongoDB. Ces connecteurs natifs permettent aux utilisateurs de lire et d’écrire efficacement des données à partir de ces systèmes sans avoir besoin d’installer ou de gérer des bibliothèques de connecteurs. Les utilisateurs peuvent ajouter ces bases de données en tant que source ou cible dans l’interface visuelle sans code par glisser-déposer d’AWS Glue Studio ou utiliser le connecteur directement dans une tâche de script AWS Glue ETL.

Pour Teradata, SAP HANA, Azure SQL et Vertica, les utilisateurs peuvent spécifier une seule table ou saisir une requête personnalisée pour sélectionner leurs données. Pour MongoDB, ils peuvent spécifier la collection de documents. Pour Azure Cosmos DB, ils peuvent spécifier le conteneur et éventuellement fournir une requête personnalisée. Lors de la création de tâches ETL visuelles, ils peuvent prévisualiser leur ensemble de données source pour trouver plus rapidement les bonnes données. Les utilisateurs peuvent également utiliser ces bases de données comme cibles dans leurs pipelines ETL pour écrire le résultat des étapes de transformation.

Ces fonctionnalités permettent aux développeurs ETL de travailler avec AWS Glue et les bases de données prises en charge dans diverses situations de données au sein d’une seule interface. Pour commencer, créez une nouvelle connexion dans AWS Glue à la base de données de votre choix et ajoutez-la comme source ou cible à votre tâche Glue ETL.

Cette fonctionnalité est disponible dans toutes les régions AWS commerciales où AWS Glue est disponible.

Vous pouvez lire l’article original (en Angais) sur le siteaws.amazon.com