Si rafforza la collaborazione con Databrick per supportare le aziende nell’elaborazione scalabile dei dati in cloud
Talend ha annunciato il supporto della nuova soluzione Delta Lake, un nuovo progetto storage open source di Databrick. Talend Cloud, una piattaforma di integrazione as-a-service (iPaaS) unificata, completa e altamente scalabile, integrerà in modo nativo i dati provenienti da qualsiasi fonte verso e da Delta Lake, fornendo un ambiente unificato affidabile per i dati batch e streaming in modo scalabile e abilitare così un’ampia gamma di casi d’uso analitici e operativi.
Talend Cloud integrerà i dati da e verso un progetto Delta Lake, sfruttando la sua conformità ACID, gli spostamenti temporali (versioning dei dati) e l’elaborazione unificata in batch e in streaming. Oltre al collegamento a un’ampia gamma di fonti di dati, incluse le più diffuse app SaaS e piattaforme cloud, Talend consentirà agli utenti di Delta Lake di godere di complete funzionalità di data quality e governance dei dati per supportare machine learning e analisi avanzate, sfruttando in modalità nativa la potente tecnologia Apache Spark alla base di Delta Lake.
“L’affidabilità dei dati nei data lake ha impedito alle aziende di realizzare appieno il potenziale dei loro dati,” ha affermato Ali Ghodsi, co-fondatore e CEO di Databricks. “Delta Lake, in quanto Open Source Project, offre un ambiente prospero per l’innovazione alla comunità per creare soluzioni che affrontino le sfide relative alla qualità dei dati all’interno dei data lake. Talend è sempre stata all’avanguardia nell’integrazione open source e non vediamo l’ora di avere il loro contributo. La nostra partnership continuativa consente ai nostri clienti comuni di accelerare i loro progetti di data engineering e machine learning”.
Il supporto esteso di Talend per i connettori Spark fornirà numerosi benefici ai progetti Delta Lake, tra cui:
- Una migliore coerenza dei dati sfruttando le funzionalità native di data quality di Talend con le transazioni ACID Delta Lake
- Facile ripristino dello stato precedente e rielaborazione grazie all’integrazione di Talend Delta Lake Time Travel e le funzionalità di controllo delle versioni dei dati
- Elaborazione di grandi volumi in scala grazie al supporto di Talend dell’architettura scale-out di Delta Lake.
Delta Lake porta affidabilità ai data lake gestendo le transazioni di dati di streaming e batch e per diverse istanze in lettura e scrittura simultanee. Un progetto Delta Lake può facilmente sfruttare qualsiasi data lake esistente, permettendo alle aziende di ottenere dati affidabili con modifiche minime alle loro architetture dati. Come risultato, gli sviluppatori possono avere centinaia di applicazioni che caricano e interrogano i dati in scala in modo affidabile.
“Il supporto di Talend per Delta Lake è un’estensione naturale della nostra competenza nell’unificare dati batch e streaming per le aziende,” ha affermato Mike Tuchen, CEO, di Talend. “Da sempre Talend adotta tecnologie innovative che facilitano la transizione ad architetture dati moderne. Il nostro impegno è volto a continuare ad aiutare le aziende a elaborare i dati su larga scala nel cloud e Delta Lake risponde a un divario significativo nell’ottimizzazione dell’analisi per pipeline di dati di grandi dimensioni”.
Talend Cloud offre una singola suite di app per l’integrazione e l’integrità dei dati per aiutare le aziende a raccogliere, governare, trasformare e condividere i dati. Con una singola interfaccia, le aziende possono utilizzare funzionalità di integrazione dei dati e dei big data e qualità dei dati per fornire dati affidabili e regolamentati all’interno dell’organizzazione. I clienti di qualsiasi settore si affidano a Talend Cloud per i loro progetti data lake e data warehouse cloud poiché offre oltre 900 connettori e componenti, funzionalità di data quality incorporate, supporto nativo per le più recenti tecnologie cloud e big data e supporto SDLC (Software Development LifeCycle) per le aziende, a un prezzo prevedibile. Talend Cloud è integrato sia con Azure Databricks che con Databricks for AWS.