Una novità assoluta nel settore, con cui Oracle rende le prestazioni del lakehouse identiche a quelle delle query eseguite nel database
Oracle ha annunciato la disponibilità generale per i suoi clienti di MySQL HeatWave Lakehouse: una novità assoluta nel settore, che consente ai clienti di lanciare query sui dati conservati nell’object storage con la stessa rapidità delle query sui dati presenti all’interno del database.
MySQL HeatWave Lakehouse supporta una varietà di formati di file di object storage quali CSV, Parquet, permette di esportare file da altri database e può combinare file dati da storage a oggetti e dati dai database transazionali MySQL nella medesima query. Le query sui file object store sono eseguite direttamente da HeatWave senza copiare i dati nel database MySQL. Di conseguenza, MySQL HeatWave Lakehouse stabilisce nuovi standard di scalabilità e prestazioni per quanto riguarda l’elaborazione delle query, la velocità di caricamento dei dati, il tempo di provisioning del cluster e l’automazione per eseguire query sui dati nell’object storage.
“Più dell’80% dei dati è memorizzato in file system e questa percentuale sta crescendo. I clienti desiderano integrare e analizzare questi diversi dati esterni con i propri dati transazionali interni, ma spesso è un processo troppo complesso o costoso” ha commentato Edward Screven, Chief Corporate Architect di Oracle. “MySQL HeatWave Lakehouse consente ai clienti di ottenere facilmente preziose informazioni in tempo reale combinando i propri dati nell’object storage con i dati del database; allo stesso tempo le prestazioni delle query sono notevolmente più elevate, i dati sono caricati molto più velocemente e il costo è inferiore”
Query sui dati in object storage rapide quanto le query nel database
Come dimostrato da un benchmark TPC-H da 10 TB, con MySQL HeatWave Lakehouse l’esecuzione di query sui dati in object storage salvati formati di file più diffusi è veloce quanto l’esecuzione di query sui dati nel database MySQL. Ciò è possibile grazie a MySQL Autopilot, una funzionalità integrata di MySQL HeatWave che offre un’automazione basata su machine learning, capace di apprendere via via dall’esecuzione delle query e migliorare quindi il piano di esecuzione delle query successive. MySQL Autopilot è un’innovazione di MySQL HeatWave che non è disponibile in altre soluzioni presenti sul mercato. MySQL HeatWave su Oracle Cloud Infrastructure (OCI) è supportato dai processori AMD EPYC™.
“I team di progettazione di AMD e MySQL HeatWave collaborano strettamente per ottimizzare e sfruttare al meglio le nuove funzionalità dei nostri processori EPYC” ha dichiarato Forrest Norrod, Executive Vice President e General Manager, Data Center Solutions Business Group di AMD. “Grazie a questa collaborazione, i clienti MySQL che eseguono MySQL HeatWave su istanze OCI basate su CPU AMD EPYC godono di un eccezionale vantaggio in termini di rapporto costi-prestazioni per i carichi di lavoro business-critical – anche per le funzioni di analytics eseguite in tempo reale sulle enormi quantità di dati memorizzati nell’object storage”.
Le migliori prestazioni per i casi d’uso sui lakehouse
Come dimostrato da un benchmark TPC-H da 500 TB, le performance delle query di MySQL HeatWave Lakehouse sono:
- 9 volte più veloci di Amazon Redshift
- 17 volte più veloci di Snowflake
- 17 volte più veloci di Databricks
- 36 volte più veloci di Google BigQuery
Le prestazioni per caricare i dati memorizzati in object storage con MySQL HeatWave Lakehouse sono:
- 9 volte più veloci di Amazon Redshift
- 2 volte più veloci di Snowflake
- 6 volte più veloci di Databricks
- 8 volte più veloci di Google BigQuery
Le prestazioni ineguagliabili di MySQL HeatWave sono il risultato della sua architettura di scale-out che consente un elevato parallelismo per eseguire il provisioning del cluster, caricare i dati e elaborare le query con un massimo di 512 nodi. Inoltre, i miglioramenti apportati a MySQL Autopilot automatizzano la creazione di metadati per i file degli oggetti e si adattano dinamicamente alle prestazioni dell’object storage sottostante, con le migliori prestazioni in qualsiasi cloud region OCI.
MySQL HeatWave è l’unico servizio cloud che fornisce elaborazione delle transazioni, analytics in tempo reale, machine learning, esecuzione di query sui data-lake e automazione basata su apprendimento automatico – tutto all’interno di un unico servizio database MySQL. MySQL HeatWave, componente fondamentale della strategia di cloud distribuito di Oracle è disponibile, oltre che su OCI, anche in maniera nativa su Amazon Web Services, all’interno del servizio cloud Oracle Database Service per gli utenti di MS Azure e, attraverso OCI Dedicated Region Cloud at Customer, nei datacenter dei clienti.
Le opinioni di clienti, partner e analisti
“I dati stanno crescendo in modo esponenziale e lo stesso vale per la quantità di dati che memorizziamo nel nostro data lake. La possibilità di utilizzare la sintassi standard MySQL per eseguire query sui dati nel nostro database e nello storage a oggetti per ottenere informazioni in tempo reale è molto importante per Natura&Co.” ha dichiarato Fabricio Rucci, Solution Architect di Natura&Co (NdR gruppo di cosmesi tra i primi al mondo, che ha tra suoi marchi The Body Shop e Avon). “Ci offre nuove opportunità per analizzare tutti questi dati più velocemente della nostra concorrenza, il che può offrirci un vantaggio competitivo”.
“HeatWave Lakehouse ha una scalabilità davvero elevata per caricare dati di object storage ed eseguire query su di essi” ha dichiarato Henry Tullis, leader Cloud Infrastructure and Engineering di Deloitte Consulting. “Il tempo di caricamento e i tempi di query sono pressoché costanti man mano che la dimensione dei dati cresce e la dimensione del cluster HeatWave aumenta. Questa scalabilità di HeatWave Lakehouse per la gestione dei dati è fondamentale per elaborare in modo efficiente grandi quantità di dati”.
“Da quando esistono i Big Data si dà per scontato che le query Big Data/Lakehouse siano sostanzialmente più lente delle query transazionali” ha dichiarato Holger Mueller, VP e Principal Analyst di Constellation Research. “MySQL HeatWave pone fine a questa situazione una volta per tutte, dimostrando che le prestazioni di Lakehouse possono essere identiche alle prestazioni delle query transazionali: un fatto inaudito e persino impensabile. Grazie alla parità delle prestazioni delle query, HeatWave consente ai top manager di non preoccuparsi più della posizione in cui inserire i dati e di come eseguirne le query. L’ingrediente segreto è l’Autopilot di HeatWave che ottimizza le query. Ancora una volta, il team HeatWave ha consegnato a questo settore una novità assoluta”.