Web-Scraping als Geschäftsmodell
Web-Scraping ist ein Geschäftsmodell, das im Rahmen des Internets entstanden ist und auf der Nutzung eines Computerprogramms basiert, das Daten von einer Website extrahiert, um sie auf einer anderen darzustellen. Dies ermöglicht es dem Endverbraucher, zwischen verschiedenen Angeboten auf unterschiedlichen Websites zu vergleichen und auszuwählen.
Diese Technik des Screen-Scrapings ermöglicht es, Daten oder Informationen im Web zu finden und auszuwählen, indem fremde Informationen übertragen oder wiederverwendet werden, wobei die Eigentümer dieser Informationen dies möglicherweise als schädlich für ihre Interessen empfinden.
Die Rechtmäßigkeit dieser Praxis ist eine komplexe Frage, da sie von verschiedenen Faktoren abhängt, wie z. B. der Funktionsweise, der Originalität oder Nicht-Originalität der Datenbank, ob eine erhebliche Investition qualitativ oder quantitativ vorgenommen wurde, sei es in finanziellen Mitteln, Zeitaufwand oder Anstrengung.
Wie kann eine Datenbank geschützt werden?
Artikel 12.2 des Urheberrechtsgesetzes bietet Schutz für sowohl originale Datenbanken als auch Datenbanken sui generis.
“(…) Datenbanken sind Sammlungen von Werken, Daten oder anderen unabhängigen Elementen, die systematisch oder methodisch angeordnet sind und einzeln durch elektronische oder andere Mittel zugänglich sind.“
Aber wie kann eine Datenbank als original betrachtet werden? Dies hängt von den Kriterien ab, die für die Auswahl oder Anordnung ihrer Inhalte verwendet werden. Der Schutz betrifft die Struktur der Datenbank, jedoch nicht ihren Inhalt.
Um jedoch Schutz zu genießen, muss eine Datenbank nicht zwangsläufig original sein, sondern kann auch durch das Recht sui generis geschützt werden. Das bedeutet, dass eine Datenbank, die zwar keine Originalität aufweist, weil die Auswahl oder Anordnung ihrer Inhalte von jedem vorgenommen werden könnte, dennoch aus wirtschaftlicher Sicht oder aufgrund des in ihre Erstellung investierten Aufwands Schutz genießen kann. Aus diesem Grund schützt das Gesetz diese als sui generis Datenbank, obwohl sie einen geringeren Schutz als eine originale Datenbank hat.
Das Recht sui generis auf Datenbanken
Artikel 133 des Urheberrechtsgesetzes besagt:
“Das Recht ‚sui generis‘ auf eine Datenbank schützt die erhebliche Investition, die ihr Hersteller, sei es durch finanzielle Mittel, Zeitaufwand, Energie oder ähnliche Mittel, für die Beschaffung, Verifizierung oder Präsentation des Inhalts aufwendet.“
Daher wird nicht jede nicht-originale Datenbank geschützt, sondern nur solche, die eine erhebliche Anstrengung oder Investition bei ihrer Erstellung darstellen, sei es durch die Menge der Informationen oder deren Wert.
Das Recht auf die Datenbank entsteht, wenn der Herstellungsprozess abgeschlossen ist und erlischt nach 15 Jahren, vorbehaltlich späterer Aktualisierungen.
Der Inhaber der Datenbank muss nicht zwingend die Person sein, die die Daten eingibt, sondern der Hersteller, der in Artikel 133.3 des Urheberrechtsgesetzes als die Person definiert wird, die die Initiative ergreift und das Risiko trägt, die wesentlichen Investitionen zu tätigen, um den Inhalt zu beschaffen, zu überprüfen oder darzustellen. Die bloße Finanzierung einer von einem Dritten erstellten Datenbank ohne direkte Beteiligung des Finanzierers am Erstellungsprozess bestimmt nicht die Urheberschaft.
Daher kann der Hersteller einer sui generis Datenbank die Extraktion und/oder Wiederverwendung des gesamten Inhalts oder eines wesentlichen Teils der Datenbank verbieten, wenn die Beschaffung, Verifizierung oder Präsentation des Inhalts eine wesentliche Investition darstellt.
Somit schützt das Recht sui generis an einer Datenbank sowohl das moralische als auch das wirtschaftliche Eigentum, indem es Plagiat und unbefugte Nutzung verbietet.
Der Hersteller ist jedoch nicht berechtigt, das Extrahieren und/oder Wiederverwenden von nicht wesentlichen Teilen des Inhalts zu verbieten, wenn dies nicht zu einer normalen Ausnutzung der Datenbank führt und keine unberechtigten Schäden an den Interessen des Herstellers verursacht.
Auf der anderen Seite kann der Benutzer wesentliche Teile der Datenbank ohne Erlaubnis des Herstellers extrahieren, wenn dies für private Zwecke einer nicht-elektronischen Datenbank, für Unterrichtszwecke, wissenschaftliche Forschung oder im Rahmen von Sicherheitsvorkehrungen oder Verwaltungs- oder Gerichtsverfahren erfolgt, wobei die Quelle angegeben wird.
Ist die Aktivität des Screen-Scrapings rechtmäßig?
Wenn wir uns auf die Urteile des Obersten Gerichtshofs beziehen, sehen wir, wie dieser sich zu spezifischen Fällen geäußert hat, wie den zwischen der Fluggesellschaft Ryanair und verschiedenen Online-Buchungsagenturen wie Atrápalo oder Lastminute.
Es kann geschlossen werden, dass der Oberste Gerichtshof in diesen Fällen die Verletzung von Urheberrechten an der Ryanair-Datenbank verneinte, da die erforderlichen Bedingungen für Originalität oder eine sui generis Datenbank nicht erfüllt waren:
“Es ist ein Minimum an Originalität erforderlich, das im geordneten Flugkatalog auf der Website von Ryanair nicht vorliegt.“
Sowohl das Handelsgericht Nr. 2 von Barcelona als auch das Berufungsgericht von Barcelona stellten fest, dass:
“Ryanair keine Investition außer in die Generierung eigener Daten (Flüge, Ziele, Zeiten, Preise, etc.) und in die notwendige IT-Verarbeitung zur Gewährleistung der Systemzuverlässigkeit und Zugänglichkeit getätigt hatte.“
Der EuGH stellt fest, dass für den Schutz sui generis: „(…) die erforderlichen Bedingungen für den Schutz sui generis erfüllt sein müssen, die in einer erheblichen Investition bestehen, nicht in der Erstellung oder Generierung von Daten, sondern in deren Beschaffung, Verifizierung oder Präsentation.“
Daher, da die Ryanair-Datenbank nicht durch das Recht sui generis geschützt ist, hält der Oberste Gerichtshof es nicht für erforderlich, zu prüfen, ob eine wesentliche Extraktion oder Wiederverwendung der Ryanair-Website erfolgt ist.
Das Handelsgericht Nr. 2 von Barcelona stellte jedoch fest, dass, selbst wenn die Ryanair-Website durch das Recht sui generis geschützt wäre, die Online-Reiseagentur keine wesentliche Extraktion oder Wiederverwendung von Inhalten vorgenommen habe, da „ein oder mehrere konkrete Daten unter den Tausenden, die die Datenbank der Klägerin bilden, keinen wesentlichen Teil darstellen, weder quantitativ noch qualitativ“, und weil es auch nicht als „wiederholte oder systematische Extraktion“ eines nicht wesentlichen Teils angesehen wurde.
Weitere Gründe, sich gegen die Praxis des Screen-Scrapings zu wehren
Es gibt jedoch auch andere Argumente, auf denen Inhaber wie Ryanair ihre Ansprüche stützen, unabhängig davon, ob die Datenbank durch Urheberrecht geschützt ist.
Einer dieser Gründe beruht auf einem Vertragsverstoß aufgrund der Nichteinhaltung der allgemeinen Nutzungsbedingungen der Website (die die Nutzung von Scraping untersagten).
Für den Obersten Gerichtshof perfektioniert die bloße Navigation auf der Website keinen Vertrag mit denen, die diese Bedingungen nicht akzeptieren und den Endverbrauchern lediglich Zugang zu bestimmten Inhalten verschaffen. Er lehnt daher die Existenz eines „Browse-wrap-Vertrags“ zwischen der Fluggesellschaft und den Käufern ab.
“Die Beklagte hat ihre Zustimmung zu den Navigationsbedingungen auf der Website der Klägerin nicht erteilt, die den Nutzern ‚die Nutzung eines automatisierten Systems oder Software zur Extraktion von Daten dieser Website und deren Anzeige auf anderen Websites‘ verbieten.“
Der EuGH entschied jedoch am 15. Januar 2021, dass die EU-Vorschriften nicht der Festlegung von Verboten der Wiederverwendung durch Dritte entgegenstehen, wenn die Datenbank nicht durch Urheberrecht geschützt ist, vorbehaltlich des nationalen Rechts.
Ein weiteres Argument, das von den Inhabern vorgebracht wurde, um die Verletzung durch Scraping zu untermauern, basiert auf dem Vorwurf der unlauteren Konkurrenz aufgrund der unrechtmäßigen Ausnutzung fremder Anstrengungen und Nachahmungsakte.
Im Fall von Ryanair hielt die Klägerin, dass eine systematische Extraktion und Bereitstellung der Inhalte von Ryanairs Website durch Screen-Scraping-Techniken und das Erheben eines „Aufschlags“ vorlag, was eine unlautere Handlung der unrechtmäßigen Ausnutzung des Wettbewerbsaufwands der Klägerin darstelle, um Flüge zu den günstigsten Preisen ohne Zwischenhändler anzubieten, die die Preise unlauter und ohne Genehmigung überhöhten, indem ein parasitäres Geschäft aufgebaut wurde.
Jedoch wies das Gericht dies zurück, da die Tätigkeit der Beklagten als eine normale Vermittlungstätigkeit gerechtfertigt wurde und davon ausging, dass „keine Datenbank und folglich keine ‚Extraktion‘ dieser existiert und der Kunde der Reiseagentur und nicht diese die Daten generierte und in andere Formate übertrug.“
Was sagt die neue EU-Verordnung zur Künstlichen Intelligenz über Web-Scraping? Ist es verboten?
Die EU-Verordnung zur Künstlichen Intelligenz verbietet in Artikel 5.1 e) das „Scraping“ nicht generell, sondern konzentriert sich auf spezifische Anwendungen, die als „unacceptable risk“ für die Grundrechte und die Privatsphäre gelten. Insbesondere verbietet dieser Artikel den Handel, die Bereitstellung oder Nutzung von KI-Systemen, die durch unbefugtes Web-Scraping Datenbanken für Gesichtserkennung erweitern oder schaffen.
“e) Der Handel, die Bereitstellung zu diesem spezifischen Zweck oder die Nutzung von KI-Systemen, die Datenbanken für Gesichtserkennung durch die nicht selektive Extraktion von Gesichtsaufnahmen aus dem Internet oder CCTV-Aufzeichnungen erstellen oder erweitern.“
Es ist wichtig zu betonen, dass das Verbot sich auf die Nutzung dieser Technik für Gesichtserkennung und den Schutz der Privatsphäre bezieht und nicht auf alle Arten von Scraping, die andere Zwecke haben und verschiedenen Vorschriften unterliegen können.
Das Scraping ist im Allgemeinen:
- nicht verboten, solange es sich nicht auf bestimmte Einzelpersonen oder Gruppen konzentriert.
- verboten, wenn das Scraping auf Gesichtserkennung abzielt.
Es ist wichtig zu beachten, dass diese Regelung der KI-Verordnung sich auf die groß angelegte biometrische Identifikation konzentriert und nicht auf die Extraktion von Daten aus Datenbanken, die durch geistiges Eigentum geschützt sind.