Description
๐ ๐ฑ๐ฎ๐๐ฎ ๐น๐ฎ๐ธ๐ฒ ๐ฒ ๐น'๐ฒ๐ฐ๐ผ๐๐ถ๐๐๐ฒ๐บ๐ฎ ๐ฑ๐ฒ๐ถ ๐ป๐๐ผ๐๐ถ ๐ฐ๐ผ๐บ๐ฝ๐ผ๐ป๐ฒ๐ป๐๐ถ ๐ฒ ๐๐ฒ๐ฐ๐ป๐ผ๐น๐ผ๐ด๐ถ๐ฒ ๐ผ๐ฝ๐ฒ๐ป๐๐ผ๐๐ฟ๐ฐ๐ฒ ๐ฎ ๐๐๐ฝ๐ฝ๐ผ๐ฟ๐๐ผ โ ๐ฃ๐ฎ๐ฟ๐๐ฒ ๐๐
ENTRAMBI I TALKS SARANNO IN INGLESE, maggiori dettagli nella descrizione degli abstract
********** BOTH TALKS WILL BE IN ENGLISH, more details in the descriptions below
18:15 - 18:20 Benvenuto
18:20 - 18:30 Modern Data Archiecture: considerazioni su trend ed evoluzioni future (Stefano Pampaloni)
18:30- 19:00 Project Nessie: A Git-like Experience for Cloud Data Lakes (Ryan Murray)
19:00-19:30 Soda: Monitoring and testing data quality (Albin Kjellin, Vijay Kiran)
19:30 - 19:45 Q&A e Networking finale
๐ฃ๐ฟ๐ผ๐ท๐ฒ๐ฐ๐ ๐ก๐ฒ๐๐๐ถ๐ฒ: ๐ ๐๐ถ๐-๐น๐ถ๐ธ๐ฒ ๐๐
๐ฝ๐ฒ๐ฟ๐ถ๐ฒ๐ป๐ฐ๐ฒ ๐ณ๐ผ๐ฟ ๐๐น๐ผ๐๐ฑ ๐๐ฎ๐๐ฎ ๐๐ฎ๐ธ๐ฒ๐
Concetti tipici dei database come transazione commit e rollback, necessari per il workload nei tradizionali data warehouse, non sono sufficienti per le moderne piattaforme di dati e le aziende data-driven. Project Nessie รจ un nuovo meta-store open source basato su formati di tabelle come Apache Iceberg e Delta Lake per svolgere transazioni multi-table e multi-engine. Inoltre, Nessie offre per i datalake una semantica simile a Git, compresi commit, tag e branch. Utilizzando i concetti del versioning, gli utenti possono lavorare in un modo completamente nuovo, sperimentando o preparando i dati senza andare ad impattare la visione live dei dati un mondo di possibilitร concrete per un approccio DataOps su DataLake.
**********While database concepts like transactions, commits and rollbacks are necessary for traditional data warehousing workloads, they're not sufficient for modern data platforms and data-driven companies. Project Nessie is a new open source metastore that builds on table formats such as Apache Iceberg and Delta Lake to deliver multi-table, multi-engine transactions. In addition, Nessie delivers Git-like semantics for data lakes, including commits, tags and branches. By using versioning concepts, users can work in an entirely new way, experimenting or preparing data without impacting the live view of the data, opening a whole world of possibilities for true DataOps on the data lake.
๐ฅ๐๐ฎ๐ป ๐ ๐๐ฟ๐ฟ๐ฎ๐ รจ ๐ข๐ฝ๐ฒ๐ป ๐ฆ๐ผ๐๐ฟ๐ฐ๐ฒ ๐๐ป๐ด๐ถ๐ป๐ฒ๐ฒ๐ฟ๐ถ๐ป๐ด ๐๐ฒ๐ฎ๐ฑ @๐๐ฟ๐ฒ๐บ๐ถ๐ผ. In precedenza ha lavorato nel settore dei servizi finanziari facendo di tutto, dal trader di obbligazioni al responsabile Data Engineering. Ryan ha un dottorato in fisica teorica ed รจ un attivo contributore open source.
๐ฆ๐ผ๐ฑ๐ฎ: ๐ ๐ผ๐ป๐ถ๐๐ผ๐ฟ๐ถ๐ป๐ด ๐ฎ๐ป๐ฑ ๐๐ฒ๐๐๐ถ๐ป๐ด ๐ฑ๐ฎ๐๐ฎ ๐พ๐๐ฎ๐น๐ถ๐๐
Vediamo come i Data Teams in genere gestiscono le problematiche legate alla qualitร dei dati che impattano grandi Dataset, data lake e Data warehouse! Utilizzando la piattaforma Soda e i tools open source messi a disposizione di sviluppatori, Data Engineer, Product Owner, Consumer e Producer sono in grado di monitorare, testare e risolvere problemi sui dati prima che essi vadano ad impattare sui data products.
**********Vijay and Albin will provide an overview into how data teams are improving data quality issues and delivering trusted analytics and data products. Using the Soda platform and open source developer tools, Albin will demonstrate how data engineers, product owners, consumers and producers, are enabled to monitor, test, and resolve data issues before they have a downstream impact.
๐๐น๐ฏ๐ถ๐ป ๐๐ท๐ฒ๐น๐น๐ถ๐ป รจ ๐ฆ๐ผ๐น๐๐๐ถ๐ผ๐ป๐ ๐๐ป๐ด๐ถ๐ป๐ฒ๐ฒ๐ฟ @๐ฆ๐ผ๐ฑ๐ฎ. Ha lavorato nell'IT di aziende di dimensione enterprise per oltre 10 anni, e come solution architect and engineer presso MuleSoft e Sony Ericsson. In Soda, fa parte del team che crea per la comunity soluzioni tecniche per clienti e partner.
๐ฉ๐ถ๐ท๐ฎ๐ ๐๐ถ๐ฟ๐ฎ๐ป รจ ๐ฃ๐ฟ๐ผ๐ฑ๐๐ฐ๐ ๐๐ฒ๐ฎ๐ฑ @ ๐ฆ๐ผ๐ฑ๐ฎ ๐ฆ๐ค๐. Esperto in Big Data Engineering con una passione per Scala, Clojure e le metodologie Agile. ร il Product Lead di Soda SQL
Unisciti al nostro gruppo anche su @Linkedin : bit.ly/XStreamData-Lin
#AperiTech รจ un'iniziativa di @Codemotion in collaborazione con @LVenture Group e @LUISS EnLabs