Im Modul Datenbanktechnologien des WS2021/22 wurde als Prüfungsleistung eine Hausarbeit zu NoSQL oder SQL-Themen gefordert. Dieses sollte explizit im Rahmen eines GitHub Repositories umgesetzt werden.
Als Thema wurde hier eine grundlegende Einführung in Apache Spark gewählt. Der Fokus lag hierbei in der Vermittlung grundlegender Zusammenhänge im Kontext nicht mit der Thematik vertrauter Personen. Die Ergänzung mit kleineren Beispiele auf Basis eines Python Notebooks runden die Einführung ab. Die Hausarbeit inklusive der Notebooks kann auf GitHub eingesehen werden.