Einleitung


Niemand wird heute mehr bezweifeln, dass die Digitalisierung eine der wichtigsten gesellschaftlichen und wirtschaftlichen Entwicklungen unserer Zeit darstellt. Was auch immer man konkret im Auge hat, wenn man von digitalem Wandel oder digitaler Transformation spricht, von Big Data, dem Internet of Things oder Industrie 4.0. In jedem Fall geht damit immer eine massenhafte Datennutzung einher.

Den gewaltigen Chancen der Datennutzung für unterschiedlichste Bereiche Gesundheit, Umwelt und Klima, Energie, Verkehrs- und Städteplanung stehen dabei nicht nur technische und ökonomische, sondern auch rechtliche Herausforderungen und Risiken gegenüber.

Diese manifestieren sich in allen Bereichen des menschlichen Miteinanders, sei es bei der Entwicklung rechtlicher Rahmenbedingungen des autonomen Fahrens, bei Haftungsfragen im Bereich der künstlichen Intelligenz und der Diskussion um die Rechtsfähigkeit autonomer Softwareagenten als neue elektronische Personen (E-Person). Das Wettbewerbs- und Kartellrecht steht vor der Frage, wann regulierend eingegriffen werden muss, um eine Monopolisierung von Daten durch marktmächtige Unternehmen wie Amazon oder Google zu verhindern bzw. die Transparenz für den Verbraucher zu erhalten, wenn Algorithmen als Instrument der Preisbildung eingesetzt werden.

Unter dem Stichwort „Legal Tech“ schreitet die Ersetzung juristischer Denkprozesse durch Maschinen voran, die einzelne Arbeitsschritte oder gar gesamte Rechtsberatungsbereiche übernehmen. Etablierte Märkte wie das Bankenwesen unterliegen im Zuge von „FinTech“ disruptiven Veränderungen, gleiches gilt auch für die Versicherungswirtschaft („InsurTech“), die zunehmend Systeme zur automatischen Schadensregulierung entwickelt. Mit sog. „Smart Contracts“, die Bedingungen eines Vertrages computerbasiert kontrollieren und einzelne Vertragsbestandteile automatisiert ausführen, soll Technologie, etwa nach dem Blockchain-Prinzip, als Garant für die Integrität und Verlässlichkeit der Daten das gegenseitige Vertrauen der Vertragspartner in ihre individuellen Absprachen ersetzen. Im Bereich des öffentlichen Rechts werden zunehmend dezentrale Datenbanken, etwa auf Basis der Blockchain diskutiert, z. B. als Ersatz für Grundbücher oder Handelsregister.

Alle diese Beispiele – und es gibt derer unzählig mehr – verdeutlichen, dass eine digitale Gesellschaft einen verlässlichen Rechtsrahmen für den rechtssicheren und grundrechtskonformen Umgang mit Daten braucht.

Data Literacy als die Fähigkeit, Daten auf kritische Art und Weise zu sammeln, zu managen, zu bewerten und anzuwenden, ist dabei eine zentrale Zukunftskompetenz. Diese zu vermitteln, stellt ganz neue Anforderungen an die Lehre, gerade weil es ein Querschnittsthema ist, das Fragestellungen ganz unterschiedlicher Fachdisziplinen vereint. Dass diese unterschiedlichen Fachdisziplinen ihrerseits Daten nach ganz verschiedenen Kriterien kategorisieren, macht die Sache nicht leichter.

In den folgenden Kapiteln möchte ich Ihnen einen Einblick in einige der Rechtsfragen im Zusammenhang mit Daten geben und dabei hoffentlich den Blick dafür schärfen, ob und inwieweit
• das geltende Recht Leitlinien für die Datennutzung bereitstellt, anhand derer im digitalen Zeitalter neu auftretende Fragestellungen beantwortet werden können bzw.
• der Gesetzgeber aufgerufen ist, den Herausforderungen durch neue rechtliche Regelungen zu begegnen.

Teil 1 Der juristische Datenbegriff
A. Begriffsbestimmungen in den einzelnen Rechtsgebieten
Eine einheitliche juristische Definition, was unter Daten zu verstehen ist, existiert nicht, obwohl Rechtsfragen im Zusammenhang mit Daten an zahlreichen Stellen eine Rolle spielen. Gesetzliche Definitionen von Daten – sog. Legaldefinitionen – finden sich in ganz unterschiedlichen Normen auf dem Gebiet des Öffentlichen Rechts, des Strafrechts und des Zivil- und Wirtschaftsrechts.

Öffentliches Recht – Datenschutzrecht
Der in der öffentlichen Wahrnehmung wohl naheliegendste Bereich ist dabei das Datenschutzrecht. Personenbezogene Daten sind legaldefiniert in:
Art. 4 Nr. 1 Halbsatz 1 DSGVO
„alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person (im Folgenden ‚betroffene Person‘) beziehen“

Der datenschutzrechtliche Datenbegriff ist damit technikoffen und bezieht sich auf alle Formate sowie alle Speichermöglichkeiten.¹ Sein Zweck ist nicht der Schutz des Datums als Zeichen, sondern nach Art. 1 Abs. 1 DSGVO der Schutz von Informationen über natürliche Personen. Er ist Ausfluss des allgemeinen Persönlichkeitsrechts in Form des Rechts auf informationelle Selbstbestimmung.

Schutzgegenstand des Datenschutzrechts sind nur personenbezogene Daten. Nicht personenbezogene Daten können ohne Einschränkung verwertet werden. Die Abgrenzung voneinander ist aber nicht einfach, denn nach Art. 4 Nr. 1 Halbsatz 2 DSGVO ist maßgebend, ob eine natürliche Person direkt oder indirekt, insbesondere mittels Zuordnung zu einer Kennung wie einem Namen, zu einer Kennnummer, zu Standortdaten, zu einer Online-Kennung oder zu einem oder mehreren besonderen Merkmalen, die Ausdruck der physischen, physiologischen, genetischen, psychischen, wirtschaftlichen, kulturellen oder sozialen Identität dieser natürlichen Person sind, identifiziert werden kann. Hierunter können etwa auch IP-Adressen oder technische Messdaten fallen, wenn mit diesen die Identifizierung einer Person möglich ist. Der Anteil der echten Rohdaten ist daher auch bei Entwicklungen im Bereich der KI wohl kleiner, als man das bislang angenommen hat.

Für die Bestimmung des Begriffs der „Daten“ ist die DSGVO wenig hilfreich, da sie wegen ihres weiten Schutzbereichs Daten und Informationen begrifflich gleichsetzt.

II. Strafrecht
Im Bereich des Strafrechts geht es vorrangig um den Schutz von Daten vor Datenveränderung. Strafrecht greift ein, wenn es um die Verletzung der Integrität der Daten geht. Gegen Verfälschung wird auf strafrechtlichem Weg über § 303a Schutz gewährt. Wer rechtswidrig Daten löscht, unterdrückt, unbrauchbar macht oder verändert, wird mit Freiheitsstrafe bis zu zwei Jahren oder mit Geldstrafe bestraft. Daten finden weiterhin Erwähnung im Bereich des Computerbetrugs in § 263a und den §§ 268–270 StGB, die sich u. a. mit der Fälschung von technischen Aufzeichnungen und im Bereich der Datenverarbeitung beschäftigen.

Der zweite Aspekt des Schutzes ist der Geheimnisschutz. Er erfolgt strafrechtlich in § 203 StGB, der den Geheimnisverrat sanktioniert, sowie in den neueren Regelungen der §§ 202a–d zum Ausspähen und Abfangen von Daten sowie der Datenhehlerei. In all diesen Fällen geht es um Fälle, in denen sich jemand unzulässig Daten verschafft, sei es durch Softwarediebstahl, aber auch durch unbefugten Zugang zu besonders gesicherten Daten unter Überwindung von Sicherheitsvorkehrungen, d. h. durch das „Hacken“ von Computern.

Daten sind in diesem Bereich im zweiten Absatz einer Norm genannt, die das Ausspähen von Daten unter Strafe stellt. Hierauf verweisen die meisten anderen Strafrechtsnormen.
§ 202a Abs. 2 StGB
Daten im Sinne des Absatzes 1 sind nur solche, die elektronisch, magnetisch oder sonst nicht unmittelbar wahrnehmbar gespeichert sind oder übermittelt werden.

Der Begriff ist relativ eng und erfasst nur maschinenlesbare, codierte Angaben, aus denen erst durch bestimmte kognitive Vorgänge dann Informationen werden. Dabei handelt es sich daher nicht um eine Legaldefinition für jede Art von Daten im Strafrecht, sondern vielmehr nur um eine normbezogene Begriffsanpassung. Ansonsten gilt aber ein allgemeinerer Datenbegriff, der Daten als „durch Zeichen oder kontinuierliche Funktionen kodierte Informationen“² beschreibt, also gleichfalls Daten und Informationen einander annähert.

III. Zivilrecht
In den beiden zuvor genannten Bereichen werden Daten über Abwehrrechte gegenüber Eingriffen geschützt. Das Zivilrecht tut sich mit der Einordnung von Daten schwerer. Je nach Regelungs- und Schutzzweck der entsprechenden Normen kann es um Daten im Sinne der DSGVO gehen, aber auch um bloße maschinenlesbare, codierte Angaben. Ersteres gilt etwa für den Umgang mit Arbeitnehmerdaten im Bereich des Arbeitsrechts oder den Zugriff der Erben oder Angehörigen auf die Daten des/r Verstorbenen in sozialen Netzwerken.

Eine klare Zuweisung von Daten zu einer bestimmten Kategorie ist aber oftmals kaum möglich, was auch daran liegt, dass man nach ganz unterschiedlichen Aspekten differenzieren kann. Neben der Unterscheidung nach personenbezogenen und nicht personenbezogenen Daten, ist die Unterscheidung nach dem semantischen Inhalt gängig, wobei man aus juristischer Sicht dann zumeist unterscheidet zwischen Daten, die sich auf natürliche Personen beziehen, Daten, die sich auf juristische Personen (Unternehmen) beziehen und unter die etwa auch Geschäftsgeheimnisse gefasst werden, und reinen Sach- oder Rohdaten. Letztere stehen in keinem unmittelbaren Bezug zu Menschen oder Unternehmen, etwa Maschinen-, Industrie- oder Sensorikdaten.

Andere Differenzierungen beziehen sich auf die Art der Schöpfung der Daten und unterscheiden zwischen vom Nutzer³ freiwillig gelieferten – nutzergenerierten – Daten, z. B. bei seiner Registrierung für einen bestimmten Dienst oder beim Klicken eines Like-Buttons, und maschinengenerierten Daten, die von den Dienstleistern selbst erstellt werden, z. B. als Nutzungs- oder Bewegungsprofile mittels Internet-Logs und Cookies.⁴

Weitere denkbare Einteilungen betreffen etwa die Aktualität der Daten (Echtzeitdaten oder historische Daten), die Aufbereitung (strukturierte, halbstrukturierte und unstrukturierte Daten) oder den Einsatzzweck.

Wie schwierig die Abgrenzung und wie groß der „Graubereich“ rechtlich nicht eindeutig einer bestimmten Kategorie zuzuordnender Daten ist, zeigt sich beispielhaft im vieldiskutierten Bereich der Datennutzung im Automobilsektor.

Im Fahrzeug anfallende Datenarten – die Übergänge sind fließend:⁵
– Fahrzeugkennung (z. B. Kfz-Kennzeichen)
– technische Fahrzeugeigenschaften (z. B. Reifendruck, Kilometerstand, Füllstände, Fehlerprotokolle)
– Bewegungsdaten (z. B. Strecke, Geschwindigkeit, Pausen, Anzahl der Insassen)
– Merkmale des Fahrers (z. B. biometrische Daten für Authentifikation oder Müdigkeitserkennung, Passwörter)
– Fahrverhalten (z. B. Lenkbewegungen, Beschleunigung, Auffahrverhalten)
– Komfortfunktionen und Servicenutzung (z. B. Sitzeinstellungen, Internetnutzung oder eingestellte Radiosender)
– Umfeldinformationen (z. B. Witterungsbedingungen, Straßenverhältnisse, Verkehrsaufkommen, Fahrzeuge in der Nähe)

Die verschiedenen Datenarten zeigen, dass doch die meisten der von Fahrzeugen erhobenen und gesammelten Daten als solche einzuordnen sind, die sich über einen Account, über Zertifikate oder Standortdaten auf den Fahrzeughalter oder den Fahrer rückbeziehen lassen.

 


Teil 2 Rechte an Daten im Zivilrecht
A. Grundlagen
„Meine Daten gehören mir!“ – das hört man häufiger, aber stimmt das auch so bzw. was verbirgt sich letztlich dahinter? Beinhaltet das nur die Befugnis, andere vom Zugriff auf die eigenen Daten abzuhalten oder auch positive Befugnisse, etwa die eigenen Daten „zu Geld“ zu machen? Dass Daten das neue „Öl“, der „Treibstoff für die digitale Wirtschaft“ sind, wird an vielen Stellen als Beispiel für die große Bedeutung angeführt, die den Daten beigemessen wird.6 So ganz passt der Vergleich nicht, denn Daten lassen sich im Unterschied zu Öl beliebig oft verwerten, denn anders als physische Rohstoffe nutzen sich Daten nicht ab. Während ein Barrel Rohöl nur ein einziges Mal verkauft und verarbeitet werden kann, können Daten potentiell mehrfach veräußert und (gleichzeitig) in unterschiedlichen Anwendungen verarbeitet werden. In jedem Fall ist eine Eigentumszuordnung bei Daten viel schwieriger als bei Öl als einer körperlichen Sache. Denn um als ein Rechtsgut im Sinne des Zivilrechts Gegenstand von Rechtsgeschäften zu sein, müssen Daten abgrenzbar und übertragbar sein. Das Zivilrecht kennt einerseits „Sachen“ und andererseits „Rechte“. Sachen im Sinne des Gesetzes sind nach § 90 BGB nur körperliche Gegenstände. Mangels Körperlichkeit handelt es sich bei Daten mithin nicht um Sachen. Bei den Rechten gibt es einen festen Katalog, einen sog. „numerus clausus“ dinglicher Rechte, wobei hier vor allem die Immaterialgüterrechte (Patent, Gebrauchsmuster, Design, Marke und Urheberrecht) in Betracht kommen. Zwar können Daten, die eine persönliche geistige Schöpfung beinhalten, durch das UrhG geschützt sein. Weiter spielt im Urheberrecht der Schutz von Datenbanken eine erhebliche Rolle.7 Daten als solche, insbesondere Rohdaten, fallen aber in diese Kategorie nicht ohne weiteres. Bei ihnen fehlt es naturgemäß bereits an einer bestimmten natürlichen Person, die als Urheber der Daten identifiziert werden könnte, jedenfalls aber an der schöpferischen Leistung.

B. Zuordnung von Daten
In der Geschichte stand das Recht schon öfter vor der Situation, über die Zuordnung neuer werthaltiger Güter entscheiden zu müssen, die erst durch neue Technologien entstanden sind, man denke etwa an die Elektrizität oder in jüngerer Zeit an Internet-Domains, die ebenfalls wie Wirtschaftsgüter gehandelt werden. Zahlreiche Stimmen aus Wissenschaft, Wirtschaft und Gesellschaft haben sich zu der Frage eines sog. „Data Ownership“ geäußert. Bis heute gibt es aber weder in der Wissenschaft, noch in Berlin oder Brüssel eine klare Antwort auf die Frage, wem welche Rechte an Daten zustehen sollen. Diese Tatsache dürfte nicht mangelnden Anstrengungen oder Ideen, sondern vielmehr der Erkenntnis geschuldet sein, dass es angesichts der Komplexität der Problemstellungen eine einfache und allgemeingültige Lösung schlichtweg nicht gibt. Die Schwierigkeiten beginnen bereits bei der Frage, wer denn letztlich als der sog. „Data Owner“ zu ermitteln ist. Verschiedene Vorschläge haben sich dabei als nicht tragfähig erwiesen. • Keine Lösung bringt es, wie bei Sachen, auf das Eigentum am Datenträger abzustellen. Dagegen spricht zum einen die weitgehend dezentrale Speicherung von Daten, denn wenn Daten auf einem „fremden“ Datenträger gespeichert werden, können sie hierdurch nicht in das Eigentum des Sacheigentümers übergehen. Besonders deutlich wird das bei Cloud-Dienstleistungen, wo der Eigentümer des Servers in keiner Beziehung zu den darauf gespeicherten Daten steht. • Auch der Dateninhalt ist kein taugliches Kriterium. Die Anknüpfung am Dateninhalt als schutzfähiges Werk versagt bei den ohne geistige Leistung erzeugten Messdaten. Aber auch bei personenbezogenen Daten würde der Urheberschutz überdehnt, wenn jedes Datum unabhängig von der Schöpfungshöhe dem Urheberschutz unterläge. • Damit bleibt nur die Möglichkeit, beim Datenerzeuger anzuknüpfen – aber wer ist das? Teilweise stellt man nur technisch auf die Codierung der Daten ab, den sog. „Skripturakt“, der die unmittelbare Erstellung und Speicherung der Daten auslöst.8 Das berücksichtigt aber nicht, wer wirtschaftlich für die Datenerstellung verantwortlich ist und die Kosten für die Entwicklung, die Produktion und die laufenden Kosten für den datengenerierenden Gegenstand und den benötigten Speicherplatz trägt. Der Datenerzeuger muss folglich im Einzelfall aus einer kombinierten Betrachtung mehrerer tatsächlicher, rechtlicher und ökonomischer Indizien ermittelt werden. Im Beispiel des vernetzten Kfz zeigt sich sehr schnell die Komplexität derartiger Überlegungen. Zu den verschiedenen, im vernetzten Kfz anfallenden Datenarten siehe das Beispiel im Teil 1.

  1. Mögliche Zuordnungsberechtigte sind etwa:

  • Automobilhersteller,

  • Vertragshändler,

  • Zulieferer,

  • Werkstätten- und Pannenhilfsdienste

  • Fahrer, Halter und Eigentümer (vor allem im Fall des Leasings abweichend)

  • Sachverständige und staatliche Stellen (Bußgeldstellen, Strafverfolgungsbehörden, Gerichte)

  • Kfz-Versicherungen

  • Serviceprovider und sonstige Diensteanbieter

  1. Als datenrelevante Vorgänge kommen beispielsweise in Betracht:

  • lokale Generierung und Speicherung von Daten durch Fahrzeugsysteme

  • Transfer von Daten aus Fahrzeugsystemen zum Hersteller und von da ggf. zu weiteren Dritten

  • Empfang und Speicherung von Daten durch andere Verkehrsteilnehmer, Verkehrsinfrastrukturbetreiber, Mobilitätsdiensteplattformen (z. B. Fahrdienste- oder Carsharing-Anbieter)

Ausgehend von durchschnittlich 80 elektronischen Geräten pro Pkw, mit steigender Tendenz wächst die Menge der in einem Kfz erhobenen Daten und die Zahl der verschiedenen hieran Interessierten stetig an. Einfache Lösungen gibt es daher kaum. So gehören personenbezogene Fahrerdaten zwar sicherlich dem Fahrer, ebenso wie selbst eingebrachte Nutzungsdaten wie Navigationsziele, Adress- oder Telefondaten. Denkt man an Carsharing-Fälle, Mietwagen etc. stellt sich die Frage des Zugriffs aber schon als schwierig dar. Fahrzeugzustandsdaten können je nach Konstellation dem Halter, dem Eigentümer oder ggf. auch dem Fahrer zugeordnet werden, etwa wenn es um Rückschlüsse auf einen bestimmten Fahrstil geht. Wie greift aber eine dieser Personen auf die Daten zu, wenn sich diese auf einem Datenträger befinden, den der Hersteller durch Zugriffsschutzmechanismen geschützt hat oder diese unmittelbar auf dessen Servern gespeichert werden? Zwar hat der Eigentümer das Kfz einschließlich der Datenverarbeitungsgeräte erworben, der Hersteller hat diese jedoch eingebaut und er stellt ihre Funktionsfähigkeit sicher, zudem haftet er auch im Rahmen der Gewährleistung für Fehler des Fahrzeugs, ist daher an den Daten interessiert, um die Fahrzeuge weiterzuentwickeln und die Beweise für Haftungsfälle zu sichern. Die Fernüberwachung des Fahrzeugzustands dient aber auch dem Fahrer, der so auf dringende Reparaturen und notwendige Wartung hingewiesen werden kann. Im Rahmen der Wartung und Reparatur sind wiederum die Werkstätten auf die Ergebnisse der Diagnosegeräte angewiesen, wobei freie Werkstätten in der Regel keinen Zugriff auf die Daten haben. Das Bundesministerium für Verkehr und digitale Infrastruktur hat in einer umfangreichen Fallstudie zu einer „Eigentumsordnung für Mobilitätsdaten“9 verschiedene Zuordnungen vorgeschlagen. So sollen etwa die lokal in Fahrzeugsystemen gespeicherten Daten dem Eigentümer des Kfz zuzuordnen sein, weil der Aufwand des jeweiligen Fahrers bei maschinengenerierten Daten zu vernachlässigen und Investitionen des Herstellers typischerweise mit dem Kaufpreis abgegolten seien. Ganz davon abgesehen, dass damit die rechtliche Zuordnung rein von einer technischen Umsetzung – nämlich der lokalen oder dezentralen Datenspeicherung – abhängig gemacht wird, entspricht eine solche Zuordnung jedenfalls nicht der derzeitigen Rechtswirklichkeit. Der Zugang zu den Fahrzeugdaten und die Datenhoheit, um eine Freigabe an Dritte zu steuern und von der Vermarktung für datenbasierte Geschäftsmodelle zu profitieren, liegt derzeit bei den Herstellern.

C. Dateneigentum
Ein Dateneigentum, das die Daten mit Wirkung gegenüber jedermann einer bestimmten Person zuweist, könnte nicht nur bei den Fahrzeugdaten die selbstbestimmte Nutzung des Fahrzeugeigentümers ermöglichen, sondern auch in vielen anderen Bereichen für klarere Lösungen sorgen. Ein solches Recht kann mangels Sachqualität der Daten letztlich nur durch den Gesetzgeber geschaffen werden. Gegen seine Einführung bestehen aber erhebliche Bedenken. Denn der Vermögenswert von Daten wird nicht durch das Recht, sondern vorrangig durch die Marktverhältnisse bestimmt. Schafft man mit dem Dateneigentum ein Ausschließlichkeitsrecht, das die Daten bei einer bestimmten Person monopolisiert, greift man damit in den Markt ein. Ein solcher Eingriff in den Markt ist da notwendig, wo nur auf diese Weise Innovationsschutz gewährt werden kann.10 Das ist etwa das Prinzip des Patentrechts – Innovation kann nur stattfinden, wenn sicher ist, dass die Kosten, die in die Entwicklung geflossen sind, sich durch die Zuweisung des Rechts für eine bestimmte Zeit amortisieren. Eine solche Anknüpfung an den Amortisationskosten würde daher eher auf die Hersteller von Datenverarbeitungssystemen als „Eigentümer“ der Daten abzielen – ein Konzept, das wiederum mit dem Schutz personenbezogener Daten und den damit verbundenen Abwehrrechten natürlicher Personen nur schwer in Einklang zu bringen wäre. Bei der Schaffung von rechtlichen Rahmenbedingungen für ein Datenrecht ist man daher auf politischer Ebene, von dem Gedanken eines Dateneigentums inzwischen weitgehend wieder abgerückt.11 Für den gesamten Bereich des Datenwirtschaftsrechts herrscht die Auffassung vor, dass die Schaffung eines absoluten Rechts, das andere Parteien von der Nutzung der Daten ausschließt, eher einen Hemmschuh für Innovationen darstellt. Insbesondere fürchtet man, ohne die Möglichkeit von Big-Data-Analysen auf dem zukunftsträchtigen Markt der künstlichen Intelligenz ins Hintertreffen zu geraten. Der ursprüngliche Gedanke, ein Eigentumsrecht an Daten auf europäischer Ebene zu schaffen, wird daher von der Europäischen Kommission nicht mehr weiterverfolgt. Beim Aufbau einer Europäischen Datenwirtschaft setzt man deshalb auch im Bereich der Roh- und Maschinendaten vielmehr auf das Prinzip des „free flow of non personal data“.12 Das anstelle eines Dateneigentums angedachte „Datenproduzentenrecht“ wird in der Literatur weiter intensiv diskutiert,13 Schritte zu einer Umsetzung, die sich etwa am bestehenden Datenbankherstellerrecht des UrhG orientieren könnte,14 wurden aber seit 2017 nicht unternommen.

D. Datenmacht
Ist mithin – jedenfalls in nächster Zeit – eine absolute Zuordnung von Daten an bestimmte Personen nicht zu erwarten, bleibt es bei der auch heute bereits vielgenutzten Möglichkeit der Beteiligten, über schuldrechtliche Vereinbarungen die Zuordnung der Daten zu regeln, die anders als das Eigentum nicht absolut, sondern nur relativ zwischen den jeweiligen Vertragsparteien gelten. Allerdings liegen Daten heute vorwiegend in der Cloud und auf sich ständig ausbreitenden marktmächtigen Plattformen. Man kann daher daran zweifeln, ob in solchen multipolaren Rechtsbeziehungen das auf Zweipersonenverhältnisse zugeschnittene Vertragsrecht wirklich noch hinreichenden Schutz gewährleistet. In der Praxis entscheidet vielfach die faktische, technische Zugriffsmöglichkeit auf die Daten15 darüber, wer die Vertragsbedingungen vorgibt. Dem Vertragspartner bleibt nur noch die Möglichkeit, auf diese Bedingungen einzugehen oder vom Vertragsschluss Abstand zu nehmen. Angesichts dieser Gefahren wird die Forderung nach sektorspezifischen kartellrechtlichen Regelungen erhoben, die einer Monopolisierung der Daten durch Großunternehmen wie Google oder Facebook Einhalt gebieten, den Datenhandel regulieren und diese zur „Herausgabe“ der von ihnen erhobenen Daten verpflichten sollen.16

E. Daten als Gegenleistung
In der digitalen Welt können die im Zusammenhang mit einem bestimmten Vertrag oder Nutzungsvorgang generierten Daten weit über den ursprünglichen Kontext hinaus Bedeutung erlangen.17 Die systematische Auswertung großer, automatisiert und als Nebenprodukt der Maschinennutzung oder der Interaktion von Menschen und Maschinen erzeugter Datenmengen lässt vielfältige, ökonomisch wertvolle Verwendungsmöglichkeiten zu. Nutzungs- und Nutzerprofile können u. a. gezielt zu Werbezwecken eingesetzt werden. Im Fallbeispiel des vernetzten Kfz verdeutlicht das etwa eine Untersuchung des ADAC zur Datenauswertung und -übertragung.18 Anhand von Daten zu Strecken, Fahrstil und Fahrer können konkrete Nutzungsprofile erstellt werden, die beispielsweise auflisten:

  • die gefahrenen Kilometer auf Autobahn, Landstraße und in der Stadt

  • die Anzahl der einzelnen Fahrtstrecken, aufgeschlüsselt nach Kilometern

  • die Lade- und Entladezyklen mit Uhrzeit, Datum, Kilometerstand

  • die Einsatzdaten des Elektro- bzw. Verbrennermotors bei Plug-in-Hybriden

  • die Betriebsstunden der Fahrzeugbeleuchtung, getrennt nach einzelnen Lichtquellen

  • die Zahl der elektromotorischen Gurtstraffungen, um festzustellen, wie oft heftig gebremst wird

  • die Einträge für zu hohe Motordrehzahl oder -temperatur

  • die Dauer, wie lange der Fahrer die verschiedenen Modi des Automatikgetriebes (Manuell/Sport) nutzt

  • die Zahl der Verstellvorgänge des elektrischen Fahrersitzes

  • die Anzahl der eingelegten Medien in das CD-/DVD-Laufwerk

  • die Dauer und den Zeitpunkt der Telefongespräche

Dass ganz unterschiedliche Adressaten an solchen Informationen Interesse haben, wird dabei ebenso deutlich wie der Umstand, dass Fahrer, Halter und/oder Eigentümer ein berechtigtes Interesse daran haben können, dass diese – überwiegend personenbezogenen – Daten nicht weitergegeben werden. Allerdings lässt sich in diesem Bereich ein gewisses Paradoxon erkennen. Während einerseits im Bereich der Nutzung personenbezogener Daten als Wirtschaftsgut zu Recht auf das Datenschutzrecht verwiesen wird, gehen viele Verbraucher andererseits mit ihren persönlichen Daten sehr freizügig um. Daten werden dabei verbreitet als Tauschmittel für digitale Inhalte oder vermögenswerte Vorteile im E-Commerce eingesetzt. Um die Rechte von Verbraucherinnen und Verbrauchern zu schützen, hat der nationale Gesetzgeber zum 1.1.2022 neue Regelungen für Verträge über digitale Produkte in das BGB aufgenommen.19 Das Gesetz markiert nicht nur den „Beginn des digitalen Zeitalters im BGB“20, sondern verzahnt auch erstmalig Vertragsrecht und Datenschutzrecht. Der Anwendungsbereich beschränkt sich allein auf personenbezogene Daten, die erstmals in § 327 Abs. 3 BGB als Gegenleistung eines Vertrags ausdrücklich anerkannt werden. Sofern Verbraucher digitale Angebote wie Video-, Audio- oder Musikdateien, digitale Spiele, elektronische Bücher oder ähnliches in Anspruch nehmen, die in einer Cloud-Computing-Umgebung oder in sozialen Medien zur Verfügung gestellt werden, gelten vertragliche Rechte wie z. B. die Möglichkeit des Rücktritts, der Nacherfüllung oder der Minderung wie beim Kauf körperlicher Sachen. Dies gilt nicht nur für den Fall, dass hierfür ein Preis gezahlt wird, sondern auch dann, wenn die Gegenleistung ganz oder teilweise in der Zurverfügungstellung von personenbezogenen Daten besteht. Der erste Schritt hin zu einer rechtlichen Anerkennung des ökonomischen Werts von Daten ist damit getan. Wie dieser Wert letztlich im konkreten Fall zu bemessen ist, wird der Markt bestimmen. Für den Gesetzgeber bleibt weiterhin zu erwägen, ob eine Anerkennung von Daten als Gegenleistung künftig auch (1) für nicht-digitale Produkte, (2) für nicht-personenbezogene Daten und (3) für andere Personen als Verbraucher gelten soll.


Teil 3 Der Schutz elektronischer Datenbanken durch das UrhG
A. Bedeutung
Datenbanken, insbesondere elektronische Datenbanken, haben in den vergangenen Jahrzehnten einen enormen Bedeutungszuwachs erfahren. Sie liegen Suchmaschinen aller Art zugrunde und durchziehen alle Lebensbereiche, sei es in Form von Flug- oder Automobilbörsen, Immobilienmärkten, Preisvergleichsportalen, Fahrplänen etc. Ebenso benötigten alle Banken, Versicherungen, und jedes Internet-Unternehmen mit Bestellungen, von der Lagerverwaltung bis zum Rechnungswesen Datenbanken als unverzichtbare Grundlage seiner Geschäftstätigkeit. Auch soziale Netzwerke aller Art würden ohne die Nutzung von Datenbankfunktionen gar nicht funktionieren. Für Studierende hat sich die Möglichkeit der Literaturrecherche durch die elektronischen Angebote von Verlagen deutlich verbessert. Es ist offensichtlich, dass mit der Erstellung und Pflege elektronischer Datenbanken ein erheblicher Kostenaufwand verbunden ist. Über deren Schutz besteht trotzdem vielfach Unsicherheit. Neben dem Wettbewerbsschutz, der hier naturgemäß ebenfalls eine große Rolle spielt, hält das UrhG zwei verschiedene Schutzsysteme für Datenbanken bereit.

B. Begriff der Datenbank
Es gilt ein weiter Datenbankbegriff, der als gemeinsame Voraussetzung von § 4 UrhG und §§ 87a UrhG nach Art. 1 Abs. 2 DatenbankRL vollharmonisiert ist. Als Datenbank schutzfähig sind danach:
➢ Sammlungen von Werken, Daten oder anderen unabhängigen Elementen,
➢ die systematisch und methodisch angeordnet und
➢ einzeln mit elektronischen Mitteln oder auf andere Weise zugänglich sind.

C. Die verschiedenen Schutzmechanismen
I. Werkschutz nach § 4 UrhG
Um einen Schutz als Datenbankwerk nach § 4 UrhG zu genießen, muss der Urheber mit der Auswahl oder Anordnung eine eigene geistige Schöpfung vollbracht haben. In die Sammlung können nicht nur Werke im urheberrechtlichen Sinne, sondern auch jegliche Art wahrnehmbaren Materials, etwa Texte, Töne, Bilder, Zahlen und Daten eingestellt werden. Der EuGH bejaht die erforderliche Originalität dann, wenn der Urheber bei der Auswahl und Anordnung freie und kreative Entscheidungen trifft und der Datenbank damit eine persönliche Note verleiht. Fußballspielpläne sind danach beispielsweise nicht als Datenbankwerk schutzfähig, weil technische Erwägungen, Regeln oder Zwänge keine künstlerische Freiheit bei der Erstellung lassen, auch wenn dabei ein erheblicher Arbeitsaufwand und bedeutende Sachkenntnis erforderlich waren. Sofern ein Schutz zu bejahen ist, ist der Urheber vor einem Eingriff in alle Verwertungsrechte geschützt, insbesondere kann er sich gegen eine Vervielfältigung und öffentliche Zugänglichmachung der Datenbank durch Dritte zur Wehr setzen. Allerdings erfüllt auf der Basis dieser strengen Kriterien kaum eine Datenbank den Werkcharakter.

II. Schutz „sui generis“ – Das Datenbankherstellerrecht der §§ 87a ff. UrhG
Dass der Werkschutz für Datenbanken unzureichend ist, hat man auf europäischer Ebene schon recht früh erkannt und im Rahmen der EG-Datenbankrichtlinie – für das Jahr 1998 sehr fortschrittlich – ein eigenes übertragbares Immaterialgüterrecht für den Hersteller einer Datenbank geschaffen, welches der Gesetzgeber in §§ 87a ff. UrhG umgesetzt hat.

  1. Schutzgegenstand
    Geschützt wird durch diese Vorschriften das Amortisationsinteresse des Datenbankherstellers sowie die in der Datenbank verkörperte wesentliche Investition von Kapital oder Arbeit bei der Beschaffung, Überprüfung oder Darstellung der Daten. Es war und ist für das deutsche UrhG eigentlich systemfremd, nicht die schöpferische Leistung, sondern die Investition zu schützen. Aber die Entwicklung der letzten Jahre zeigt anhand von ähnlichen Regelungen, z. B. zum Leistungsschutzrecht für Presseverleger, um diese vor den großen Suchmaschinen zu schützen, dass sich das UrhG von seinem Blickwinkel des Kreativschutzes mehr und mehr löst und auch handfeste wirtschaftliche Interessen bedient.

  2. Schutzvoraussetzungen
    a) Datenbank
    Ebenso wie bei § 4 UrhG muss es sich zunächst um eine Datenbank im Sinne der genannten Definition handeln.
    b) Investition
    Für die Zwecke der Beschaffung, Überprüfung oder Darstellung der Daten muss nach § 87a Abs. 1 UrhG eine Investition erforderlich gewesen sein. Darunter fallen auch Daten, wie z. B. Wetterdaten, die grundsätzlich bereits in der Natur vorhanden sind, aber durch Messung gesammelt werden. Eine wichtige Einschränkung nimmt der EuGH insofern vor, als kein Schutz gewährt wird, soweit es um die Erzeugung neuer Daten geht.22 D. h. Kosten der Datengenerierung sind nicht berücksichtigungsfähig; wohl aber die Investitionskosten etwa für die Software, mit der die Daten für Zwecke der Datenbank erfasst und dargestellt werden einschließlich deren Programmierung. Die Abgrenzung ist im Einzelnen schwierig, wenn der Hersteller der Datenbank auch bei der Datengenerierung aktiv tätig wird.
    c) Nach Art oder Umfang wesentlich
    Um nicht jede noch so kleine Datenbank zu schützen, verlangt § 87a Abs. 1 UrhG, dass es sich um eine nach Art oder Umfang wesentliche Investition handelt. Die Rechtsprechung unterscheidet hierbei zwischen quantitativ wesentlichen Mitteln, die sich ihrem Umfang nach bemessen lassen, insbesondere solchen finanzieller Art, und qualitativ wesentlichen Mitteln etwa in Form geistiger Anstrengungen, erheblichen Energieverbrauchs oder sonstiger besonderer Auswendungen. So kann etwa in einer Datenbank den besonders schwer zu beschaffenden oder besonders aktuellen Daten ein qualitativ höherer Wert zukommen, auch wenn sie quantitativ keinen wesentlichen Bestandteil der Datenbank bilden. Die Auslegung des unbestimmten Rechtsbegriffs der Wesentlichkeit der geforderten Investition muss durch die Rechtsprechung im Einzelfall erfolgen. Die hierzu ergangenen Entscheidungen zeigen hinsichtlich des quantitativen Aufwands eine große Spannbreite: keine Bedenken bestanden etwa in Bezug auf eine Automobilbörse bei 3,8 Mio. EUR jährlich für die Bereitstellung der technischen Infrastruktur der Datenbank und deren Erhaltung, Pflege und Wartung.23 Ausreichend wurden aber auch bereits Kosten i. H. v. insgesamt 34.900 EUR für eine Gedichtsammlung erachtet.24 Was die qualitativen Faktoren angeht, ist von Investitionen von „substantiellem Gewicht“ die Rede. Diese wurden etwa bejaht hinsichtlich des Personalaufwands für die Überprüfung von 3500 Bewertungen von Patienten für 800 registrierte Zahnärzte.25

  3. Schutzsubjekt
    Datenbankhersteller im Sinne dieses Gesetzes ist nach der Legaldefinition in § 87a Abs. 2 UrhG derjenige, der die Investition im Sinne des Abs. 1 vorgenommen hat. Inhaber des sog. „sui-generis“-Rechts ist mithin nicht wie im Urheberrecht zwingend derjenige, der die Datenbank konzipiert hat, sondern derjenige, der die Initiative ergreift, das Risiko trägt, die Organisationsgewalt über den Datenbankaufbau hat und die hierfür notwendigen Verträge schließt.26

  4. Schutzdauer
    Im Unterschied zu dem 70-jährigen Schutz des Urheberrechts beträgt der Leistungsschutz der Datenbank nur 15 Jahre, § 87d UrhG, wobei allerdings spätere wesentliche Investitionen ein neues Schutzrecht begründen können.

  5. Schutzumfang
    Die Regelung des § 87b Abs. 1 UrhG weist dem Inhaber der Datenbank die Verwertungsrechte der Vervielfältigung, Verbreitung und öffentlichen Wiedergabe einschließlich der öffentlichen Zugänglichmachung zu. Die Vervielfältigung entspricht inhaltlich dem in der Richtlinie verwendeten und eigentlich griffigeren Begriff der „Entnahme“ von Daten.
    a) Verwertung eines nach Art oder Umfang wesentlichen Teils, S. 1
    Der Hersteller kann gegen die Entnahme eines nach Art oder Umfang wesentlichen Teils der Datenbank vorgehen. Auch hier ist nicht allein auf den quantitativen Umfang abzustellen, da sonst große Datenbanken einen geringeren Schutz erfahren als kleine. Daher sind sowohl die quantitative Wesentlichkeit zu prüfen, wobei 10 % wohl noch nicht als ausreichend erachtet werden, als auch die qualitative Wesentlichkeit des entnommenen Teils, d. h. die Frage, ob aus der Entnahme speziell dieser Teile ein erheblicher Schaden des Amortisationsinteresses zu resultieren droht. Entscheidend ist, ob gerade in den übernommenen Datensätzen ein wesentlicher Teil der Investition in die Datenbank verkörpert ist, z. B. weil immer die aktuellen Daten entnommen werden zur Erstellung einer Änderungsliste.
    b) Systematische oder wiederholte Verwertung unwesentlicher Teile, S. 2
    Um zu verhindern, dass durch eine mehrfache Entnahme kleinerer Datenmengen auf Dauer die gesamte Datenbank ausgeplündert wird, enthält S. 2 einen Auffangtatbestand, der auch dieses Vorgehen verbietet, sofern es planmäßig erfolgt. Diskutiert wird dies vor allem beim Einsatz sog. Screen-Scraping-Software, mit der etwa Flugbörsen oder Automobilbörsen systematisch durchsucht werden. Erfolgt dies durch den einzelnen Endnutzer, können die für sich genommen jeweils zulässigen Nutzungen nur dann zu einer insgesamt unzulässigen Nutzung zusammengerechnet werden, wenn die Nutzer – was regelmäßig nicht der Fall ist – die Datenbank gemeinschaftlich, also in bewusstem und gewolltem Zusammenwirken vervielfältigen würden. Problematischer ist der Fall, dass eine derartige Software von Unternehmen eingesetzt wird, beispielsweise indem die frei zugänglichen Datenbanken kopiert und indexiert werden, um sie sodann den Nutzern in der eigenen spezialisierten Internet-Suchmaschine zum Durchsuchen anzubieten. Der EuGH betont in diesem Fall, dass ein ausgewogenes Gleichgewicht der beteiligten legitimen Interessen hergestellt und dabei insbesondere auf die potenzielle Beeinträchtigung der Investitionen der Datenbankhersteller abgestellt werden muss. Es ist daher nunmehr stets ein Interessenausgleich und die Darlegung der Hersteller, dass die angegriffenen Handlungen die Amortisation der eigenen Investition gefährden können, erforderlich.

Im Fallbeispiel des vernetzten Kfz zeigt sich sehr schnell, dass das Datenbankherstellerrecht zwar in gewissem Umfang Schutz gewähren kann, aber auch sehr schnell an seine Grenzen gerät.
– Abgrenzung von Datensammlung und Datenerzeugung
Schwierigkeiten bereitet zunächst die vom EuGH betonte Begrenzung auf „bereits vorhandene Daten“, die von jedem Dritten mit gleichem Aufwand gesammelt werden können. Dagegen sind erzeugte Daten ihrer Natur nach nur dem Datenerzeuger selbst bekannt. Für solche Daten greift der Schutz der §§ 87a ff. UrhG nicht. Ob die sensorgestützte Datenerhebung im vernetzten Kfz der Datensammlung zugeordnet werden kann, weil sie sich auf bereits existierende Informationen bezieht, die lediglich gemessen werden, oder die maschinenerzeugten Daten zunächst nur dem Betreiber bekannt und daher der Datenerzeugung zuzuordnen sind, ist nicht leicht zu beantworten. Jedenfalls für einen großen Teil der Rohdaten, die unsortiert gespeichert werden, lässt sich kein Investitionsschutz über die bestehenden Regelungen des UrhG begründen.
– Herstellereigenschaft
In vernetzten Wertschöpfungsketten kommen unterschiedliche Zuordnungsberechtigte in Bezug auf die Daten in Betracht (s. o.). Am ehesten wird als Datenbankhersteller der Hersteller des Kfz anzusehen sein, der die Software einbauen lässt und die Herstellungs- und Entwicklungskosten trägt. Schwieriger wird die Beurteilung, wenn die erhobenen Maschinendaten nicht beim Hersteller gespeichert, sondern unmittelbar an dritte Dienste oder Unternehmen weitergeleitet werden, die ihrerseits nur geringen Aufwand durch das Sammeln der Daten haben. Hier Rechte zuzuweisen, lässt zudem auch die vertraglichen Beziehungen unberücksichtigt, die etwa bestehen, wenn Dienstleister Daten im Auftrag des Produzenten erheben, Daten in verschiedenen Datenbanken und Datenbankclustern gespeichert und verarbeitet werden, die dann unterschiedliche Hersteller haben.
– Big-Data-Analysen
Geht man davon aus, dass die Daten aus dem vernetzten Kfz in systematischer Weise gesammelt wurden und damit eine Datenbank des Herstellers im Sinne des UrhG entstanden ist, stellt sich sodann die Frage, wie eine Bearbeitung dieser Daten zu bewerten wäre. Richtigerweise werden durch eine Aggregierung und Veredelung von Daten neue Daten produziert, die ihrerseits dann einer neuen Datenbank des bearbeitenden Unternehmens zuzurechnen wären. Für die Weiterverwendung der Daten wäre dann die Zustimmung des Herstellers der Datenbank erforderlich, der die Daten entnommen wurden,31 es sei denn, diese dienen zu Forschungszwecken. Je nach Art der Datenanalysen könnten hierbei mehrere, aufeinander aufbauende Datenbanken mit unterschiedlichen Herstellern entstehen.

Resümee: Ob und in welchem Umfang ein Datenbankherstellerrecht bei Datensammlung in vernetzten Kfz besteht, ist im Einzelfall zu klären und mit einigen Unsicherheiten behaftet. Daher kann den beteiligten Akteuren derzeit nur eine vertragliche Absicherung ihrer Interessen angeraten werden. Angesichts der Monopolstellung, die ein Datenbankherstellerrecht vermittelt, erscheint für Maschinendaten jedenfalls die bestehende Schutzdauer von 15 Jahren als zu lang.


Teil 4 Datengestützte Forschung
A. Bedeutung
In allen Bereichen des täglichen Lebens bilden Datensammlungen heute den „Rohstoff“, aus dem durch Datenanalysen neue Erkenntnisse gewonnen werden. Diese haben nicht nur im Zusammenhang mit der wissenschaftlichen Forschung hohe Bedeutung, sondern sie werden auch in großem Umfang sowohl von privaten als auch öffentlichen Einrichtungen eingesetzt, um große Datenmengen in verschiedenen Lebensbereichen und zu unterschiedlichen Zwecken zu analysieren. Insbesondere die Entwicklung von Algorithmen im Bereich künstlicher Intelligenz bedarf einer großen Menge von Trainingsdaten. Der europäische Gesetzgeber trägt diesem Umstand Rechnung, indem er durch neue Schrankenregelungen zum sog. Text und Data Mining Rechtssicherheit für die automatisierte Auswertung von Daten mit Hilfe von Algorithmen geschaffen hat. Für eine Datenanalyse, die nicht auf urheberrechtlich geschützte Daten zugreift, sondern auf reine, ungeordnete Rohdaten, bedarf es naturgemäß keiner Erlaubnis eines Urhebers oder Datenbankherstellers. Die in Teil 3 aufgezeigten Schwierigkeiten bei der Frage, ob Daten im Einzelfall einem Datenbankschutz unterliegen, relativieren sich aber durch die Freistellung des Data-Mining jedenfalls in gewissem Umfang.

B. Begriff des Text- und Data-Mining (TDM)
Der Begriff ist in Art. 2 Nr. 2 der DSM-Richtlinie legal definiert.
Text und Data Mining bezeichnet eine Technik für die automatisierte Analyse von Texten und Daten in digitaler Form, mit deren Hilfe Informationen unter anderem — aber nicht ausschließlich — über Muster, Trends und Korrelationen gewonnen werden können.
Der deutsche Gesetzgeber formuliert etwas abweichend, aber in der Sache identisch in § 44b Abs. 1 UrhG:
Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.
Data Mining verläuft dabei in mehreren Phasen, von der Identifizierung und Extrahierung relevanter Datensätze, über die Filterung bis hin zur eigentlichen Analyse mit Hilfe eines für die Fragestellung entwickelten Algorithmus.

C. Urheberrechtliche Zulässigkeit
Erforderlich war eine gesetzliche Regelung, weil die Daten mithin für jede automatisierte Analyse zumindest kurzfristig in den Arbeitsspeicher eines Computers geladen und dadurch vervielfältigt werden. Dieser Vorgang greift in das Vervielfältigungsrecht des Urhebers nach § 16 UrhG ein und ist grundsätzlich nur mit dessen Zustimmung zulässig. Art. 3 und Art. 4 der DSM-Richtlinie stellen daher klar, dass Text und Data Mining keine urheberrechtlich relevante Handlung ist. Der deutsche Gesetzgeber hat dies in den neuen §§ 44b UrhG und § 60d UrhG umgesetzt.

I. § 60d UrhG
So erklärt § 60d UrhG Vervielfältigungen für Text und Data Mining für Zwecke der wissenschaftlichen Forschung für zulässig, sofern diese durch Forschungsorganisationen, d. h. Hochschulen, Forschungsinstitute oder sonstige Einrichtungen, die wissenschaftliche Forschung betreiben, erfolgen. Diese müssen zudem (1) nicht kommerzielle Zwecke verfolgen, (2) sämtliche Gewinne in die wissenschaftliche Forschung reinvestieren oder (3) im Rahmen eines staatlich anerkannten Auftrags im öffentlichen Interesse tätig sein. Auch öffentliche Bibliotheken, Museen, Archive und schließlich auch der einzelne Forscher, der nicht kommerzielle Zwecke verfolgt, darf die Datensammlungen analysieren und die Vervielfältigungen anderen Personen für deren gemeinsame wissenschaftliche Forschung sowie Dritten zur Überprüfung der Qualität wissenschaftlicher Forschung zur Verfügung stellen. Sie dürfen folglich solange aufbewahrt werden, wie es für die jeweiligen Zwecke notwendig ist. Dies ist wichtig, da Forschungsergebnisse zur Wahrung guter wissenschaftlicher Praxis reproduzierbar und nachprüfbar gestaltet werden müssen, um Anschlussforschung zu ermöglichen. Um im Gegenzug die Daten gegen Missbrauch zu sichern, ist eine Aufbewahrung in Forschungsdatenrepositorien zu empfehlen.

II. § 44b UrhG
Neben dieser privilegierten Nutzung für Forschungszwecke erweitert die neue allgemeine Text-und-Data-Mining-Ausnahme des § 44b UrhG den Kreis der Berechtigten auf „Jedermann“, um damit vor allem die Innovationsbereitschaft privater Unternehmen zu steigern. Diese dürfen auch kommerzielle Zwecke verfolgen. Anders als im Bereich der Forschung sind die Vervielfältigungen aber zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind. Schwierigkeiten kann dies gerade für das Training von KI-Algorithmen bereiten, bei denen eine stetige Interaktion mit Nutzern notwendig ist und im Evaluationsprozess auch auf ältere Daten zurückgegriffen werden muss. Da nicht ganz eindeutig ist, wie die Erforderlichkeit in § 44b Abs. 2 UrhG zu bewerten ist, wenn der eigentliche Mining-Prozess bereits abgeschlossen ist, kann es sich empfehlen, bei umfangreichen Vorhaben zur Sicherheit dennoch Lizenzvereinbarungen mit den Rechteinhabern zu schließen (sofern dies bei vielfältigen Datenquellen praktikabel ist). Schließlich darf der Rechteinhaber nach § 44b Abs. 3 UrhG einen Nutzungsvorbehalt erklären, um weiterhin Lizenzen für das Text und Data Mining vergeben zu können. Um der Datenanalysen im Internet Rechnung zu tragen, muss ein solcher Vorbehalt dann aber – etwa in den Metadaten oder den Geschäftsbedingungen – in maschinenlesbarer Form erklärt werden.

D. Geltung für Datenbanken
Dass die Befugnis zu automatisierten Datenanalysen auch für Datenbanken gilt, hat der Gesetzgeber in § 87c Abs. 1 Ziff. 4 und 5 UrhG klargestellt. Danach ist die Vervielfältigung eines nach Art oder Umfang wesentlichen Teils einer Datenbank u. a. zulässig, wenn sie zu Zwecken des Text und Data Mining gemäß § 44b UrhG oder zu Zwecken des Text und Data Mining für Zwecke der wissenschaftlichen Forschung gemäß § 60d UrhG erfolgt. Stets zu beachten ist, dass sich die Zulässigkeit des Text und Data Mining nur auf Werke oder Datenbanken bezieht, die dem Nutzer „rechtmäßig zugänglich“ sind. Das trifft z. B. auf frei im Internet zugängliche Werke wie öffentliche Websites zu, Werke, für die der Nutzer über eine entsprechende Lizenz verfügt oder die unter Open-Access-Bedingungen veröffentlicht wurden. Die Text-und-Data-Mining-Ausnahme schafft folglich kein Recht auf Zugang zu Daten, sondern setzt diesen voraus. Die schwierige Frage, wem welche Rechte an Daten zustehen und wem die Daten zuzuordnen sind, wird dadurch nicht beantwortet, sondern muss vor der Durchführung von Datenanalysen im Wege des Data Mining beantwortet werden.