Auch dieses Jahr lag der Fokus wieder auf der Verbesserung meiner Programmierskills mit Fokus auf Python, aber auch im R bin ich ein paar Schritte weitergekommen. Die Basis für die Fortschritte bildet weiter DataCamp - hier motivieren kompakte Kurse, Challenges und Projekte zu regelmässigen, kleinen Fortschritten. 2022 bot die Möglichkeit wieder vor Ort an Konferenzen teilzunehmen - vor allem die 9. Swiss Conference on Data Science SDS2022 in Luzern und Zürich bot viele Möglichkeiten für Austausch und neue Kontakte. Aber auch die Jahrestagung des Instituts für Versicherungswirtschaft an der HSG mit Schwerpunkt KI Ethik I.VW2022 brachte viele Einblicke in die Prozesse und Fortschritte führender Versicherungsunternehmen. Daneben konnte ich im Sommer auch endlich selbst wieder vor Ort auf einer internationalen Konferenz zu Machine Learning Themen sprechen. Aber auch innerhalb der Suva boten sich zahlreiche Möglichkeiten zu Analyticsthemen und KI-Ethik zu sprechen. In diesem Blog-Post will ich wie jedes Jahr kurz reflektieren, welche zentralen Entwicklungsschritte ich auf meiner Data Science Reise machen konnte.
Title Image by: Markus Spiske on Unsplash
Python
Für mein Team haben wir seit diesem Jahr einen Zugang zu datacamp.com. Mit kompakten Kurses, regelmässigen Challenges und Anwenderprojekten konnte ich auch dieses Jahr permanent dazulernen, mit MLOps-Themen haben mich vorrangig beschäftigt. Wichtig waren mir hier Software Engineering mit Python, objekt-orientiertes Programmieren und effizienter Code. Meine Grundlagen zu MLOps konnte ich mit dem grossartigen IntroducingMLOps von Mark Treveil und dem Dataiku Team festigen. Hier finde ich vor allem wichtige Einblicke in zentrale Abläufe, Rollen und die unbedingte Wichtigkeit von definierter und befolgter Struktur als Basis zur Skalierung von Machine Learning Algorithmen in Prozessen und Organisationen. Diese Insights haben uns schon jetzt geholfen, die Struktur unseres eigenen Entwicklungsteams zu schärfen und die nächsten Anpassungen für 2023 vorzubereiten. Vor allem im Zusammenspiel mit Scrum und den zentralen Artefakten lässt sich DevOps auf Machine Learning Themen erweitern. Möglichst automatische Buildprozesse, Iterationen, Versionierung des Codes und der Daten sowie kontinuierliches Deployment, Monitoring und Testing bilden die Grundlage um Machine Learning use cases sicher und effizient zu skalieren. Mein eigenes kleines Projekt rund um die Nachrichtenportale srf.ch, tagesanzeiger.ch und tagesschau.de habe ich auch in 2022 erweitert news processing project. Die Datenbasis enthält nunmehr über 3 Jahre Schlagzeilen und deckt damit einschneidende Ereignisse wie den Beginn und Verlauf der Coronapandemie oder das Aufflammen des Krieges in der Ukraine ab. Neben den technischen Fortschritten des crawling-Services und in der grafischen Darstellung ist es vor allem der internationale Vergleich der Nachrichtenpublikationen, der im längeren Zeitverlauf sehr spannend ist. Einzelne Themen kommen und gehen, allerdings gibt es bedeutsame Unterschiede welches Gewicht die Websites den einzelnen Ereignissen einräumen und vor allem wie lang sie diese Aufmerksamkeit aufrechterhalten. Die Corona-Pandemie verdrängte lange alle anderen Themen in den Randbereich, der Ukrainekrieg hingegen taugt den Nachrichtenseiten nicht zur monothematischen Dominanz.
Photo by Karl Solano on Unsplash
Design Thinking Certification
Eine wichtige Erkenntnis kommt mir in Workshops und vor allem in den Communities zum Design Thinking immer wieder: wie wenig Entwickler und Coder in diese Themen eingebunden werden, wie wenig sich Softwareentwickler an den Diskussionen und dem Austausch beteiligen. Ich hoffe, das ist in anderen Industrien anders, für die Versicherungsbranche bestätigt sich das mehr oder weniger bei jedem Event. Der direkte Einbezug des Kunden endet allerdings nicht bei der Ideation, Ideenfindung oder nach dem Prototyp oder MVP. Customer Feedback muss in die Applikationen eingebaut werden, es muss automatisiert erzeugt und wieder in den Entwicklungsprozess zurückfliessen. Nur so lassen sich die Auswirkungen von Änderungen wirklich evaluieren, nur so kann die Applikation entlang der Kundenbedürfnisse weiterentwickelt und erfolgreich betrieben werden. Feedback zu Applikationen ist nicht Aufgabe interner oder externer Marktforschung sondern des Product-Teams jeder Applikation. Durch meinen Hintergrund in der Marktforschungsindustrie beschäftigen mich diese Themen seit Beginn meines erstes Jobs, allerdings drehen sich auch hier die Entwicklungen wirklich schnell. Im Herbst konnte ich an der Hochschule Luzern einen Customer Experience Management Lehrgang bei Hannes Felber und Isa Hauser abschliessen, der mich vor allem im Bereich des Prototyping und bei strukturierten Interviews wirklich voran gebracht hat. Es ist essentiell immer am Thema dran zu bleiben, sich auszutauschen und bei allen Entwicklungen und Produkten Design Thinking einfliessen zu lassen. Die beiden Publikationen DesignThinkingPlaybook und DesignThinkingToolbook bieten mir dafür einen täglich nutzbaren Werkzeugkasten.
KI Ethik
“Forget Killer Robots - Bias Is the Real AI Danger”. Mit diesem Zitat lässt sich die Diskussion um die Gefahren von künstlicher Intelligenz sehr gut zusammenfassen. Ich meinem blogpost habe ich im Frühjahr den Stand der Debatte versucht zu skizzieren. Entscheidend zum heutigen Zeitpunkt ist vor allem, dass die Debatte in Wissenschaft und Gesetzgebung angekommen ist, bei den Verantwortlichen in vielen Unternehmen hingegen nicht. Grosse Player leisten sich Chief Ethicists und grosse Teams, die zum Thema forschen (die dann allerdings - wie bei Twitter geschehen - auch als erste einer Entlassungswelle zu Opfer fallen) - kleinere und nicht genuin digital basierte Unternehmen stehen hier meist noch ganz am Anfang. Sie laufen Gefahr von den unentdeckten oder unreflektierten Problemen ihrer eigenen Algorithmen und Geschäftsmodelle und den neu entstehenden regulatorischen Anforderungen “überrascht” zu werden. Gerade die Möglichkeiten von DIY-KI, LLMs und die technisch immer weniger komplexe Integration kompletter KI-Algorithmus-Bausteine in die Geschäftsprozesse vieler Unternehmen hat grosses Potential für die Erkenntnis, dass es dann doch so einfach war, wie von den einschlägigen Cloud-Anbietern versprochen. Garbage in - Garbage out kann mit Bias in - Bias out für Modelle maschinellen Lernens erweitert werden.
Zusammenfassung
Auch dieses Jahr hat mich auf meiner Data Science Journey wieder einen Schritt vorangebracht. Vor allem die Themen KI-Ethik und MLOps werden mich ganz sicher im nächsten Jahr noch viel intensiver beschäftigen als in diesem Jahr. Interessanter Austausch auf einschlägigen Konferenzen wird ganz sicher wieder Raum finden genau wie die Verfeinerung meiner Coding-Skills.
Thank you, and a happy new year everyone!