Im Modul Datenbanktechnologien Bestand im Wintersemester 21/22 die Aufgabenstellung darin, eine Hausarbeit zu NoSQL oder SQL-Themen zu erstellen. Dieses sollte explizit im Rahmen eines GitHub Repositories erfolgen.
Als Thema wurde eine grundlegende Einführung in Apache Spark gewählt. Der Fokus lag hierbei in der Vermittlung grundlegender Zusammenhänge um Sinn und Zweck von Apache Spark auch nicht Experten nahe zu bringen. Kleine Beispiele auf Basis eines Python Notebooks runden die Einführung ab.
Die Hausarbeit inklusive der Notebooks kann hier auf GitHub eingesehen werden.