Tratta la gestione e governance di dataset di grandi dimensioni utilizzando moderni sistemi distribuiti. Il corso esplora tecnologie NoSQL e NewSQL, framework di elaborazione su larga scala come Apache Hadoop e Apache Spark, e strategie di integrazione dei dati. Include metodologie per garantire qualità dei dati, sicurezza e querying efficiente in ambienti su larga scala.