Sprachmodelle: Was KI heute schon leisten kann und wo sie an ihre Grenzen gerät
29.09, 16:00–17:30 (Europe/Berlin), Vortragssaal II
Sprache: Deutsch

Große Sprachmodelle wie GPT sind von zentraler Bedeutung für die Entwicklung von künstlicher Intelligenz, da sie die Fähigkeit haben, menschliche Sprache sowohl zu verarbeiten als auch zu erzeugen. Neue Arten der Sprachsynthese haben das Potenzial, eine Vielzahl von Anwendungen zu revolutionieren, von automatisch erzeugten Texten bis hin zu Chatbots und virtuellen Assistenten. Letztere erlauben uns, wie das viel gehypte ChatGPT von OpenAI, auf natürliche Weise mit KI-Modellen zu interagieren.

Doch trotz ihrer beeindruckenden Leistungen haben große Sprachmodelle auch einige Herausforderungen, wie Vorurteile und Fehlinterpretationen, die es zu überwinden gilt. Gerade die Fehler machen jedoch die unmittelbare Anwendung im Journalismus und der Forschung schwierig.

Auf diesem Panel wollen wir folgende Fragen diskutieren:

  • Was sind die wichtigsten Funktionen und Anwendungen von großen Sprachmodellen?
  • Welche Herausforderungen gibt es beim Training von großen Sprachmodellen und wie können sie gelöst werden?
  • Wie können Wissenschaftler und Journalisten zusammenarbeiten, um sicherzustellen, dass Sprachmodelle verantwortungsvoll und ethisch eingesetzt werden?
  • Was sind die größten Herausforderungen, denen große Sprachmodelle gegenüberstehen, und wie kann man sie überwinden?
  • Was können wir durch die Nutzung von Sprachmodellen über die menschliche Intelligenz lernen?
  • Wie weit sind wir noch von einer echten künstlichen Intelligenz entfernt, wenn sich Chatbots heute schon so menschlich anfühlen?

Diese Erörterung dieser Fragen sollen dabei helfen, zu verstehen, warum große Sprachmodelle so revolutionär sind und wo sie heute schon eingesetzt werden können.

Jan Eggers arbeitet als Datenjournalist und Redakteur beim Hessischen Rundfunk – in der Pandemie vor allem an der Aufarbeitung der Zahlen und Daten zu Covid-19. Er hat im hr das Inforadio und das Social-Media-Management mit aufgebaut und arbeitet als Reporter unter anderem zu Themen im Grenzbereich zwischen Technik und Journalismus. Als Trainer sind seine Schwerpunkte Crossmedia, Social Media, digitale Recherche und alles, was mit computergestützten Tools zu tun hat.

Diese(r) Vortragende hält außerdem:

Steffen Kühne arbeitet als Tech Lead für das AI + Automation Lab des Bayerischen Rundfunks. Schwerpunkt seiner Arbeit ist die Automatisierung von journalistischen Inhalten und die Entwicklung von Werkzeugen, welche Journalisten bei ihrer täglichen Arbeit unterstützen. In seiner Rolle als Tech Lead beschäftigt sich Steffen Kühne damit, wie man künstliche Intelligenz sinnvoll und verantwortungsbewusst für öffentlich-rechtliche Medien einsetzen kann und welche Infrastruktur dafür notwendig ist.

Für BR Data, dem datenjournalistischen Teams des BR, entwickelt er investigativen Datenanalysen, Visualisierung und interaktive Storytelling-Formate. Nach einem Studium der Journalistik studierte Steffen Kühne Medieninformatik, um dann ein Volontariat als Datenjournalist und digitaler Designer bei der Süddeutschen Zeitung zu beginnen. Bis 2015 arbeitete er dort in der Entwicklungsredaktion. Außerdem ist Steffen Kühne als Trainer für verschiedene Medien und Journalistenschulen tätig.

Diese(r) Vortragende hält außerdem:

Gerhard Paaß studierte Mathematik und Informatik an der Universität Bonn und promovierte über die Prognosegenauigkeit ökonometrischer Modelle. Er kam zur Gesellschaft für Mathematik und Datenverarbeitung (GMD), dem heutigen Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, in Sankt Augustin. Er leitete eine Reihe von Forschungsprojekten über unsicheres Schließen, multimediale neuronale Netze und Prognoseunsicherheit und gründete die Text Mining Gruppe des IAIS. Dr. Paaß arbeitete im Rahmen diverser Forschungsaufenthalte an Universitäten im Ausland (China, USA, Australien, Japan). Er ist Autor zahlreicher Publikationen und hat mehrere Best-Paper-Awards im Bereich der KI erhalten.

Darüber hinaus ist er seit vielen Jahren als Dozent tätig und hat im Rahmen der Fraunhofer-Allianz Big Data und Künstliche Intelligenz maßgeblich dazu beigetragen, das neue Berufsbild des Data Scientist zu definieren und auch in Deutschland erfolgreich zu etablieren. Er ist Autor eines Buches zum Thema "Künstliche Intelligenz", das in Kürze auch in englischer Sprache erscheinen wird. Die Entwicklungen im Bereich der generativen KI beschreibt er ausführlich in seinem aktuellen Buch „Foundation Models for Natural Language Processing -- Pre-trained Language Models Integrating Media“. Als Lead Scientist am Fraunhofer IAIS ist Dr. Paaß an der Entwicklung zahlreicher Curricula und Forschungsprojekte in diesem Bereich beteiligt und ist Mitautor der LEAM-Studie „Large AI Models for Germany“ des Bundesministeriums für Wirtschaft und Klimaschutz.

Ana Moya ist eine Datenwissenschaftlerin und Analytics-Expertin. Ihre Karriere begann mit einer soliden Grundlage in Statistik und Datenwissenschaft, die in einem Doktortitel von der Technischen Universität Dortmund gipfelte. Während ihrer mehr als 12-jährigen Tätigkeit bei der FUNKE Media Group arbeitete sie an einer Vielzahl von Projekten, darunter Datenintegrationen, die Entwicklung von Data- und Text-Mining-Algorithmen sowie die Anwendung statistischer und fortschrittlicher KI-Modelle. In ihrer aktuellen Position als Leiterin der Abteilung Data Science & Analytics bei der Handelsblatt Media Group arbeitet sie mit interdisziplinären Teams und nutzt statistische und fortschrittliche KI-Modelle, um umfangreiche Nutzerdaten zu analysieren und strategische Empfehlungen abzuleiten. Ana Moya ist nicht nur in der Unternehmenswelt tätig, sondern auch in der akademischen Welt aktiv. Seit 2018 lehrt sie im Bereich Data Science und Business Intelligence an der International School of Management in Deutschland. Sie ist auch Autorin von Buchkapiteln und datenjournalistischen Zeitungsartikeln, in denen sie die Anwendung statistischer Methoden im Bereich des Datenjournalismus erforscht.