Fakten für Mensch und Maschine: Wikimedia baut Wissensdatenbank Wikidata

 

Der Verein Wikimedia Deutschland will mit Wikidata eine Datenbank schaffen, die von Menschen und Maschinen gelesen werden kann. Laut Verein ist es das erste neue Wikimedia-Projekt seit 2006. Bisher können Computer das in der Online-Enzyklopädie Wikipedia gespeicherte Wissen nicht ohne Weiteres weiterverarbeiten.

Der Verein Wikimedia Deutschland will mit Wikidata eine Datenbank schaffen, die von Menschen und Maschinen gelesen werden kann. Laut Verein ist es das erste neue Wikimedia-Projekt seit 2006. Bisher können Computer das in der Online-Enzyklopädie Wikipedia gespeicherte Wissen nicht ohne Weiteres weiterverarbeiten. Aus den Informationen in Wikidata können Maschinen Übersichten wie Listen und Diagramme erstellen oder Fragen beantworten, die heute kaum automatisiert beantwortet werden können.

Auf Internetseite des Projekts erklärt Wikimedia den Unterschied zwischen Wikipedia und Wikimedia wie folgt: "Wikidata sammelt strukturierte Daten. Im Unterschied zu Wikimedia Commons, wo Mediendateien gesammelt werden, oder der Wikipedia, wo enzyklopädische Artikel gesammelt werden, sammelt Wikidata Daten in strukturierter Art. Dadurch wird die Weiternutzung dieser Daten in anderen Wikimedia-Projekten und von Dritten ermöglicht, indem Computer diese leicht verarbeiten und 'verstehen' können."

Im Zuge des Projekts sollen die mehr als 280 Sprachversionen von Wikipedia eine einzige gemeinsamen Datenquelle bekommen. Das soll die Qualität und Übereinstimmung der Artikeln verbessern. Wikidata wird eine formularbasierte Schnittstelle haben, in der Autoren Daten so eingeben können, dass sie weiterverarbeitet werden können.

Auch Google spendet

Der Vorstand von Wikimedia Deutschland, Pavel Richter, bezeichnet Wikidata als das "größte technische Projekt, das jemals eine der 40 Länderorganisationen der Wikimedia-Bewegung in Angriff genommen" habe. Finanziert wird es mittels einer Spende von 1,3 Mio Euro. Zur Hälfte stammt das Geld vom Allen Institute for Artificial Intelligence, das der Microsoft-Mitgründer Paul Allen ins Leben rief, zu jeweils einem Viertel von der Gordon and Betty Moore Foundation und Google.

Mark Greaves, Vizepräsident des Allen Institute for Artifical Intelligence: "Es wird die Art und Weise verändern, wie enzyklopädische Daten veröffentlicht, zugänglich gemacht und von Menschen weltweit verwendet werden können." Dabei baue Wikidata auf semantischen Technologien auf. Chris DiBona, der bei Google den Bereich Open Source leitet, hofft, "dass damit erhebliche Mengen strukturierter Daten der Allgemeinheit zur Verfügung gestellt werden können."

Schlüsselübergabe im März 2013

In einer ersten Phase sollen bis August 2012 Links zwischen verschiedenen Sprachversionen von Wikipedia zentral gesammelt werden. In der zweiten Phase können Nutzer Daten verwenden und neue hinzufügen. Die dritte Phase wird die automatische Erstellung von Listen und Grafiken erlauben. Nach Abschluss der dritten Phase, voraussichtlich im März 2013, übergibt Wikimedia Deutschland den Betrieb und die Wartung von Wikidata an die Wikimedia Foundation. Das Team aus acht Software-Entwicklern wird von Denny Vrandečić geleitet. Er wechselte vom Karlsruher Institut für Technologie zu Wikimedia Deutschland.

Ihre Kommentare
Kopf
Inhalt konnte nicht geladen werden.