Amazon EMR sur AWS Outposts

Pourquoi choisir EMR sur Outposts ?

AWS Outposts offre les services, l’infrastructure et les modèles d’exploitation AWS à la quasi-totalité des centres de données, des espaces d’hébergement d’infrastructures ou des installations sur site. Amazon EMR est disponible sur AWS Outposts, vous permettant de configurer, déployer, gérer et dimensionner des clusters Apache Hadoop, Apache Hive, Apache Spark et Presto dans vos environnements sur site, comme vous le feriez dans le cloud. Amazon EMR offre une capacité économique dans Outposts, tout en automatisant les tâches administratives fastidieuses, notamment l'allocation de l'infrastructure, la configuration des clusters, la configuration ou le réglage de l'infrastructure, vous permettant ainsi de vous concentrer sur vos applications.

Vous pouvez créer rapidement et facilement des clusters EMR gérés sur site à l'aide des mêmes AWS Management Console, API et CLI pour EMR. Les clusters EMR lancés dans un Outpost apparaîtront dans la console AWS comme tout autre cluster, mais seront exécutés dans votre Outpost.

Avantages

Une fois votre Outpost configuré, vous pouvez lancer un nouveau cluster EMR sur site et vous connecter au stockage HDFS existant en quelques minutes. Cela vous permet de réagir rapidement lorsque les systèmes sur site ont besoin d'une capacité de traitement supplémentaire. L'ajout de capacité aux clusters Hadoop et Spark sur site permet de répondre aux demandes de charge de travail en période de forte utilisation et de respecter les contrats de niveau de service (SLA).
Apache Hadoop, Apache Hive, Apache Spark et Presto sont couramment utilisés pour traiter, transformer et analyser des données faisant partie d'une architecture de données plus large. Pour les données qui doivent rester sur site pour des raisons de gouvernance, de conformité ou pour d'autres raisons, vous pouvez utiliser EMR pour déployer et exécuter des applications telles qu'Apache Hadoop et Apache Spark sur site, à proximité de vos données. Cela réduit la nécessité de déplacer d'importantes quantités de données sur site vers le cloud, réduisant ainsi le temps global nécessaire pour traiter ces données.
Si vous êtes en pleine migration de données et de charges de travail Apache Hadoop vers le cloud et que vous souhaitez commencer à utiliser EMR avant la fin de votre migration, vous pouvez utiliser AWS Outposts pour lancer des clusters EMR sur site qui se connectent à votre stockage HDFS existant. Vous pouvez ensuite migrer progressivement vos données vers Amazon S3 dans le cadre d'une évolution vers une architecture cloud.