Vous pouvez désormais accélérer le traitement et l’analyse des données avec les applications Apache Spark jusqu’à 4,0 fois plus que les données dans S3 Standard en utilisant Amazon EMR et la classe de stockage Amazon S3 Express One Zone. S3 Express One Zone est une classe de stockage hautes performances à zone de disponibilité unique, spécialement conçue pour fournir un accès cohérent aux données en millisecondes à un chiffre pour vos données les plus fréquemment consultées et vos applications sensibles à la latence.

Amazon EMR est la solution Big Data cloud leader du secteur pour le traitement des données, l’analyse interactive et l’apprentissage automatique sur des frameworks open source optimisés pour une échelle de pétaoctets sur AWS. Si vous avez des charges de travail critiques en termes de performances avec des accords de niveau de service (SLA), par exemple pour les exigences de temps d’exécution des tâches pour les mises à jour des lacs de données, ou si vous avez besoin d’un temps de réponse rapide pour les rapports du tableau de bord BI, utilisez S3 Express One Zone lorsque vous exécutez des applications EMR Spark sur EC2. grappe.

S3 Express One Zone est disponible avec Amazon EMR version 6.15.0 dans les régions AWS où S3 Express One Zone est disponible. Pour commencer, déplacez vos données vers le stockage S3 Express One Zone et utilisez le connecteur S3a dans votre code Spark pour lire et écrire des données. S3a est le connecteur utilisé par EMR pour traiter les objets S3 et est requis avec les compartiments S3 Express One Zone. Pour en savoir plus, consultez Utilisation d’EMR avec des données dans S3 Express One Zone dans la documentation Amazon EMR.

Vous pouvez lire l’article original (en Angais) sur le siteaws.amazon.com