Die aktuell unter dem Schlagwort „künstliche Intelligenz“ (KI) betriebenen Modelle wurden quasi ausschließlich auf Daten des 21. Jahrhunderts trainiert. Daher sind sie in hohem Maße ungeeignet für den Einsatz in historischen oder von der westlichen Welt kulturell differenten Kontexten. Die Bereitstellung von Daten aus dem Kulturerbe-Bereich schafft hier nicht einfach Abhilfe. Zwar sind solche Datensätze meist von hoher Qualität und zeichnen sich durch ihre historische Tiefe, ihren kulturellen Reichtum und ihre Diversität aus. Sie enthalten aber oft problematische Inhalte, die der Weltsicht vergangener Zeiten entstammt, und bedürfen daher einer umfassenden Dokumentation, um machine learning-Modelle präziser, leistungsfähiger und geeignet für den Einsatz in verschiedenen kulturellen Kontexten sowie dem Gemeinwohl dienlich zu machen.
Dieser Leitfaden fokussiert auf ethische, soziale und rechtliche Aspekte bei der Dokumentation von Kulturerbe-Daten, die für das Training von machine learning-Modellen benutzt werden. Er konzentriert sich insbesondere darauf, wie diese Modelle möglicherweise historische oder statistische Verzerrungen („biases“) perpetuieren. Die Analyse wandert entlang der verschiedenen Phasen des gesamten machine learning workflows und arbeitet eine Reihe von neuralgischen Punkten heraus, an denen biases entstehen können. Darüber hinaus wird auf die Rolle von Kulturerbe-Einrichtungen abgehoben. Diese Einrichtungen verfügen sowohl über umfangreiches Erfahrungswissen bei der Etablierung von Dokumentationsverfahren als auch über wertvolle Datensätze. Sie sind daher in besonderem Maße dazu qualifiziert, durch mustergültige Dokumentationen begleitete Datensätze zu publizieren. Die Bereitstellung von Kulturerbe-Daten unter Einbeziehung ethischer Erwägungen kann dazu beitragen, für die Gesellschaft kritische Inhalte in einer Art und Weise aufzubereiten, dass die Entwicklung von KI-Anwendungen stimuliert und gesellschaftlich nachteilige Effekte vermieden werden. Der Leitfaden schließt mit einem Plädoyer für einen interdisziplinären Ansatz, um die aufgezeigten Probleme anzugehen, und er betont die Notwendigkeit proaktiver Maßnahmen von Kulturerbe-Einrichtungen, um in den Daten vorhandene Stereotype und Vorurteile zu dokumentieren und so einen positiven Beitrag zur KI-Ethik leisten zu können. Damit eröffnet dieser Leitfaden nicht nur die Möglichkeit, zur Entwicklung kleiner, in hohem Maße für spezifische Aufgaben im Kulturerbe-Bereich geeigneter Modelle mit einem hohen Kosten-Nutzen-Verhältnis beizutragen, sondern auch die vorhandenen großen Mehrzweckmodelle robuster, effizienter, kontextsensitiver, genauer und nachhaltiger zu machen. Die Publikation von hochqualitativen Kulturerbe-Datensätzen inklusive Dokumentation schärft das Profil der Kulturerbe-Einrichtung, macht sie als Partner:innen der Forschung attraktiv und eröffnet die Möglichkeit, an der Einwerbung von Forschungsmitteln teilzuhaben.
| Persistent URI: | https://commons.nfdi4objects.net/resources/6127f5d3-cf3c-4b58-87d8-2e5ab12faf8a/ |
| DOI: | 10.5281/zenodo.16418346 |
| Lizenz | Creative Commons Attribution 4.0 (CC BY 4.0) |
|---|---|
| BibTeX |
|
| Kategorien | Empfehlung |
| Tags | Datenanalyse CARE |