Projekt Details
Laufzeit:
1.11.2023-31.8.2025
Die Plattform IS RenAIssance unterstützt Personen, die im Bereich Data-Science, KI und Machine-Learning arbeiten, bei ihren Experimenten. Sie ist eine Alternative zu anderen Plattformen wie z.B. Google Colab. Außerdem handelt es sich um eine österreichische Lösung, die dementsprechend dann auch DSGVO-konform ist. Speziell im Bildungsbereich kann sie wertvolle Unterstützung leisten. Eine Verwendung an Fachhochschulen ist angedacht. Für den Standort Niederösterreich stellt die Plattform eine wichtige Unterstützung dar, weil Experimente und Software-Entwicklungen damit durchgeführt werden können und sie außerdem DSGVO-konform ist. Die Daten verlassen österreichische Server nicht.
Die Plattform steht als Open-Source-Bibliothek zur Verfügung und kann somit frei verwendet werden. Abgesehen davon, soll sie aber auch im Rahmen einer Cloud-Lösung als Software-as-a-Service vertrieben werden. Angestrebte erste Kund*innen sind dabei Bildungseinrichtungen, wie beispielsweise Fachhochschulen, die die Plattform im Rahmen ihrer Lehrveranstaltungen einsetzen können.
Das Ziel dieses Projekt besteht darin, eine kollaborative Programmierumgebung für Data-Science und KI-Anwendungen, die bereits in einem Vorprojekt mit Hilfe von Open-Source-Komponenten gebaut wurde, weiterzuentwickeln. Das umfasst die Erforschung von Möglichkeiten, inwieweit Datenvisualisierung
integriert werden kann und soll, immer dem Bedarf unseres Auftraggebers entsprechend. Die Visualisierungs-Pipeline soll dabei unterstützen, große Datenmengen zu analysieren, Modelle zu generieren und ein Fine-Tuning dieser umzusetzen.
Data-Science und KI sind wertvolle Methoden im Bereich der Produktion, des IoT und der Industrie5.0, wo sie helfen, Prozesse zu
verstehen und zu optimieren (z.B. Stichwort „Predictive Maintenance“). Die Plattform unterstützt Personen und Einrichtungen aus diesem Bereich durch ihre niedrigschwellige Verfügbarkeit. Sie kann z.B. von Bildungseinrichtungen (z.B. die FH St. Pölten hat einen Schwerpunkt im Bereich Data-Science) oder Unternehmen gewinnbringend eingesetzt werden.
Zentrale Lösung statt lokale Entwicklungsumgebungen
Bei der Durchführung von Experimenten und Software-Entwicklung im Bereich Data-Science, KI, Data-Engineerung und Machine-Learning wird oft ein Ansatz verfolgt, bei dem iterative Prototypen erzeugt werden und unterschiedliche Parametrisierungen von Modellen miteinander verglichen werden. Es lohnt sich daher, einen dementsprechende Entwicklungsumgebung einzusetzen, die speziell an diese Bedarfe angepasst ist. Oft werden solche Entwicklungsumgebungen von Mitarbeiter*innen lokal installiert, also jeweils auf deren eigenen Laptops und Desktop-Rechnern. Die Daten und Modelle liegen dann aufgespaltet auf unterschiedlichen Rechnern und sind nur schwer zusammenführbar. Eine Zentrale Lösung ist daher sinnvoll.
Im Rahmen eines Vorprojekts wurde eine ebensolche Plattform entwickelt, die im vorliegenden Projekt um eine weitere wichtige Komponente ergänzt werden soll. Die Plattform aus dem Vorprojekt soll um eine Datenvisualisierungs-Pipeline erweitert werden, die die Mitarbeiter*innen dabei unterstützt, die Daten zu sichten, zu verstehen, und aus ihnen wertvolle Erkenntnisse zu ziehen. Diese Pipeline soll sich nahtlos in das bestehende System einfügen und darin integriert sein. Ein wichtiger Aspekt des Projekts ist dabei die Verwendung von existierenden Open-Source-Lösungen, damit die resultierende Plattform einen offenen Charakter hat. Weiters ist angedacht, die Plattform als Software-as-a-Service anzubieten. Dieser doppelte Ansatz bedient zwei Bedarfe: auf der einen Seite kann sie von Personen aus dem Bereich gratis verwendet werden. Dies hat jedoch den Nachteil, dass die Lösung dann selbst gewartet werden muss. Für robustere Anwendungen, wie beispielsweise dem Einsatz in einer Bildungseinrichtung, kann gegen Bezahlung auf eine gehostete Lösung zugegriffen werden, wo kein eigenständiges Hosting und keine Wartung notwendig sind.