BMBF-Ausschreibung: Erzeugung von synthetischen Daten für KI

Mit der vorliegenden Richtlinie wird das BMBF interdisziplinäre ­Vorhaben fördern, die die Verbesserung von Methoden und (Simulations-)Modellen oder die grundlagenorientierte Entwicklung neuer Methoden zur Erzeugung von realistischen und möglichst allgemein verwendbaren Datensätzen für relevante Anwendungsgebiete, die für die Erzeugung und Validierung von KI-Modellen genutzt werden können, zum Ziel haben.

Ein weiterer Anwendungsfall ist die Anonymisierung gegebener personen­bezogener Datenbestände. Mit der Förderung von Verbundprojekten soll der Transfer zwischen Wissenschaft und Wirtschaft zum Vorteil beider Parteien verstärkt werden.

Grundsätzlich sind vier Arten von Projekten möglich, die auch kombiniert werden können:

  • Grundlagenorientierte, interdisziplinäre Projekte, die durch eine Zusammenarbeit vor allem der Fachgebiete Physik, Mathematik und Informatik insbesondere im Bereich numerischer und statistischer Modelle zustande kommen. Hiermit sind explizit Projekte gemeint, die sich auch mit neuen Herangehensweisen beschäftigen, ohne auf bisherige Methoden oder Tools zurückzugreifen.
  • Methodenentwicklungsprojekte, die sich mit der essentiellen Weiterentwicklung schon bestehender Ideen beschäftigen. Hierbei sollen Projekte im Fokus stehen, die Methoden entscheidend verbessern oder durch neue Verfahren erweitern.
  • Werkzeugentwicklungsprojekte, die sich mit der Neuentwicklung von Werkzeugen für die Datenerzeugung beschäftigen. Damit sind allerdings keine reinen statistischen Werkzeuge gemeint, sondern intelligente Tools mit neuen Kenngrößen, die Daten in ausreichender Güte und Repräsentativität erzeugen.
  • Validierungswerkzeugprojekte, die sich mit der Neuentwicklung von Methoden und Werkzeugen für die Validierung der datenbasierten KI-Modelle (Benchmarking) beschäftigen. Die Ergebnisse der Validierungswerkzeugprojekte sollen nach Möglichkeit einfach auf verschiedene Domänen übertragbar sein.

In der Fördermaßnahme wird die Durchführung von FuE-Vorhaben gefördert, die Bezüge zu einem oder mehreren der folgenden Themen aufweisen:

  • Datensynthetisierung: Techniken zur Erzeugung synthetischer Daten aus Simulations- oder Repräsentations­modellen. Hierbei geht es um grundlegende Methoden der Mathematik und Physik zur Entwicklung von Modellen einschließlich der Software-Entwicklung auf entsprechenden Simulationssystemen. Gegenstand der Förderung sind grundlegende Algorithmen. Methoden, die High Performance Computing (HPC) benötigen, sind nicht Gegenstand der Förderung.
  • Statistische Methoden: Innovative Methoden und robuste, alltagstaugliche Techniken und Werkzeuge zur Analyse der erzeugten Daten. Diese müssen ein Mindestmaß an Qualität und Heterogenität aufweisen. Idealerweise sollten diese Kriterien in die Simulationsmodelle integriert werden. Aufgrund der Komplexität solcher Modelle müssen entsprechende Methoden noch entwickelt werden.
  • Kenngrößen zur Messung von Eignung, Güte oder Bias-Freiheit der Daten: Innovative Methoden zur Klassifikation von Daten. Adressierbar sind hier Ansätze, die neue Kenngrößen einführen, um die Eignung, den Bias oder die Güte von Daten zu messen. Hierbei sind unter Umständen neue Techniken notwendig, die über die üblichen statistischen Kenngrößen hinausgehen.
  • Sichere Anonymisierung bestehender Datensätze: Die Anonymisierung von Datensätzen soll verhindern, dass ­natürliche Personen, deren Daten in den Datensätzen enthalten sind, identifiziert werden können. Im Rahmen der Bekanntmachung sollen einfach anzuwendende Methoden und Werkzeuge entwickelt werden, die eine sichere Anonymisierung bestehender Datensätze garantieren, ohne die für die Modellbildung relevanten Eigenschaften im Datensatz zu beeinflussen. Weiterhin sollen diese Werkzeuge/Methoden das Maß der Sicherheit beschreibbar bzw. messbar machen können.

Die Realisierbarkeit jeder Idee soll in einer Anwendung, beispielsweise aus dem industriellen Umfeld, demonstriert werden. Eine konkrete industrielle Anwendung soll aber nicht der alleinige Treiber des Projektes sein. Die Neuentwicklung von ausschließlich innerbetrieblich genutzten Basiskomponenten ist grundsätzlich nicht Gegenstand der Förderung.

In der ersten Verfahrensstufe sind dem beauftragten Projektträger bis spätestens 15. September 2020 zunächst Projektskizzen in schriftlicher und elektronischer Form vorzulegen. 

Weitere Infos finden Sie unter  https://www.bmbf.de/foerderungen/bekanntmachung-3068.html