Presto sur Amazon EMR
Fonctionnalités et avantages
Réussite client
Témoignages de réussite de Netflix
Netflix a choisi Presto comme moteur de requêtes interactif compatible ANSI SQL pour le Big Data. Presto est correctement dimensionné et open source, et s'intègre à Hive Metastore et Amazon S3, la dorsale de l'environnement d'entrepôt Big Data de Netflix. Netflix exécute Presto sur des clusters Amazon EMR permanents pour interroger rapidement et avec souplesse les données stockées dans son magasin de données Amazon S3 d'une capacité d'environ 25 Po. Netflix est un contributeur actif de Presto, et Amazon EMR donne à Netflix la possibilité d'exécuter sa propre version de Presto sur des clusters Amazon EMR. En moyenne, Netflix exécute environ 3 500 requêtes par jour sur ses clusters Presto.
Témoignages de réussite de Jammp
Jampp est une plateforme de marketing pour applications mobiles qui utilise des techniques avancées de reciblage publicitaire pour encourager les utilisateurs engagés à utiliser des applications. Pour ce faire, Jampp achète un inventaire mobile via son propre moteur d'enchères en temps réel basé sur la conversion, qui enchérit de façon dynamique sur l'inventaire sur 18 échanges d'enchères en temps réel et plus de 150 réseaux publicitaires mobiles. Jampp utilise Presto sur Amazon EMR pour l'analyse ad hoc avancée de journaux, en associant des données provenant de plusieurs sources et des calculs de segment de reciblage complexes. La base d'utilisateurs de Jampp a augmenté de 600 %, tout comme la demande de requêtes analytiques complexes. L'entreprise a abandonné son application Python multicœur complexe exécutée sur MySQL au profit de Presto, ce qui a multiplié par douze ses performances. Jampp utilise actuellement Presto sur Amazon EMR pour traiter 40 To de données par jour.
Témoignages de réussite de Cogo Labs
Incubateur de start-up, Cogo Labs exploite une plateforme d'analyse marketing et d'informatique décisionnelle utilisée par ses sociétés de portefeuille et ses équipes internes. Pour prendre en charge un environnement OLAP caractérisé par un fort taux d'innovation, l'entreprise s'est conformée à la norme SQL pour assurer l'interaction avec les données. Cogo Labs a choisi Presto pour ses performances de requêtes en temps réel, sa prise en charge de la norme ANSI SQL et sa capacité à traiter les données directement depuis Amazon S3. Lorsqu'il est exécuté sur Amazon EMR, le moteur Presto permet à plus de 100 développeurs et analystes d'exécuter des requêtes SQL sur plus de 500 To de données stockées sur Amazon S3 pour l'exploration de données, l'analyse ad hoc et la génération de rapports. Cogo Labs utilise une combinaison de clusters à courte durée de vie et permanents, et s'appuie sur l'intégration d'Amazon EMR aux instances Spot pour réduire ses coûts.
Témoignages de réussite d’OpenSpan
OpenSpan propose des solutions d'automatisation et d'informatique décisionnelle qui aident à relier les personnes, les processus et la technologie pour avoir un aperçu de la productivité des employés, simplifier les transactions et impliquer les employés et les clients. OpenSpan a migré depuis HBase vers Presto sur Amazon EMR et stocke ses données dans Amazon S3. OpenSpan a choisi Presto en raison de son interface SQL et de sa capacité à interroger les données en temps réel directement depuis Amazon S3 ; le moteur permet à l'entreprise d'explorer rapidement de grandes quantités de données et d'itérer rapidement les prochains produits de données. OpenSpan utilise le format de fichier Parquet et fait appel à PrestogreSQL pour se connecter à Presto. OpenSpan a choisi Amazon EMR et Amazon S3 pour traiter de façon rentable les gigaoctets de données transmis chaque jour par ses clients.
Témoignages de réussite de Kanmu
Kanmu est une start-up japonaise opérant dans le secteur des services financiers. Elle propose à ses clients des offres qui dépendent de l'utilisation de leur carte de crédit. Kanmu a migré de Hive vers Presto sur Amazon EMR en raison de la capacité de Presto à exécuter des analyses exploratoires et itératives à une vitesse interactive, de ses bonnes performances avec Amazon S3 et de son évolutivité permettant d'interroger de grands ensembles de données. Kanmu utilise Fluentd-plugin-s3 pour transférer des données vers Amazon S3, le format en colonnes en lignes optimisé (ORC) pour stocker des données et utilise shib, un client Web basé sur node.js, pour exécuter des requêtes SQL.