Wikidata wächst und gedeiht

Wikidata ist zur Zeit vermutlich das spannendste Wikimediaprojekt. Umso schöner, dass es offensichtlich nicht nur eine Kopfgeburt ist, sondern von den aktiven Nutzern sehr gut angenommen wird. Im Wikimediablog sind nun erste Zahlen zur Nutzung zu lesen:

Vor einem Monat wurden Aussagen in Wikidata verfügbar gemacht. Inzwischen sind zu mehr als 660.000 Objekten auch Aussagen hinzugefügt worden, was im Endergebnis mehr als 1,4 Millionen Aussagen bedeutet. Das Objekt mit den meisten Aussagen ist das Objekt “Vereinte Nationen (Q1065)“, welches alle Mitgliedsstaaten auflistet. Das Wachstum der Aussagenmenge ist großartig und übertrifft unsere Erwartungen.

Bisher haben wir mehr als 22 Millionen Links zu Wikipedia Artikeln. Es gibt etwas 24 bis 25 Millionen Wikipedia-Artikel, was also bedeutet, dass wir bereits mehr als 90% aller Links in Wikidata haben. Angenommen die Bots arbeiten weiterhin so effizient wie bisher, sollten alle Links in einem oder zwei Monaten übertragen sein. Danach ist es zu erwarten, dass das Wachstum in der Anzahl der Objekte erheblich zurückgeht.

Es sind aber auch schon über zwei Millionen manuelle Edits durchgeführt worden.

Wer sich unter Wikidata nichts vorstellen kann, sollte sich einfach ein paar Beispieldatensätze ansehen (zum Beispiel Ranganathan, Academic Library, Nordhorn oder Harry Potter and the Philosopher’s Stone) oder auch Lydia Pintschers Vortrag zu Wikidata ansehen.

Wikidata.org ist online

Lydia Pintscher gab in der Wikidata-Mailingliste den Launch von Wikidata.org bekannt:

The Wikidata team is excited to let you know that http://wikidata.org is now online and running the repository code \o/

You can now create items and add language links to the various Wikipedias to them. Thank you to everyone who helped.

There are some caveats! We’re still testing things and fixing minor bugs. Please let us know about any problems you find and go easy on the new wiki.

Wer einen Single-User-Login für die Wikimedia-Projekte hat – hier steht, wie das funktioniert – kann sich auf der Projektseite schon einloggen.

You can already edit, but beware that any content may be lost in case we have to reset the database.

Wer viel Zeit in die Daten stecken möchte, sollte diese Warnung ernst nehmen.

Pressemitteilung zu Wikidata

Quelle: Pressemitteilungen/PM 3 12 Wikidata, CC: BY-SA

Die Zukunft der Wikipedia

Wikidata wird das erste neue Wikimedia-Projekt seit 2006

Vom 30. März bis 1. April findet in Berlin die jährliche Wikimedia Conference mit Teilnehmern aus 40 Ländern statt. Zeitgleich startet Wikimedia Deutschland mit Wikidata ein völlig neues Wikimedia-Projekt. Wikidata wird eine offene Datenbank für das Wissen der Welt werden, an der jeder mitarbeiten kann. Das erste Ziel des Projekts ist es, die mehr als 280 Sprachversionen von Wikipedia mit einer einzigen gemeinsamen Datenquelle auszustatten. Damit können weltweit die Daten der Artikel in allen Sprachen der freien Enzyklopädie ergänzt und zentral gepflegt werden. Aber auch außerhalb von Wikipedia können die Daten verwendet werden, zum Beispiel in Blogs oder auf Webseiten. Das Prinzip einer gemeinsamen Datenquelle soll die Qualität und Übereinstimmung von Wikipedia-Artikeln verbessern. Durch Wikidata werden mehr Informationen in kleineren Sprachversionen von Wikipedia verfügbar gemacht. Gleichzeitig wird es für Zehntausende freiwillige Wikipedia-Autoren erheblich einfacher, Daten in der Enzyklopädie aktuell zu halten.

Der Vorstand von Wikimedia Deutschland, Pavel Richter, erklärt : “Wir betreten Neuland. Wikidata ist das größte technische Projekt, das jemals eine der 40 Länderorganisationen der Wikimedia-Bewegung in Angriff genommen hat. Wikimedia Deutschland widmet sich mit Begeisterung der Aufgabe, durch Wikidata die Datenverwaltung der größten Wissenssammlung der Menschheit deutlich zu verbessern.”

Neben den Wikimedia-Projekten werden auch zahlreiche externe Anwendungen von den Daten profitieren. Mit Wikidata können Daten vernetzt und annotiert werden, was beispielsweise für wissenschaftliche und öffentliche Daten von großer Bedeutung ist. Die Wikidata-Inhalte werden unter einer freien Creative Commons-Lizenz veröffentlicht.

Das Projekt wird mittels einer Großspende von 1,3 Millionen Euro finanziert, die zur Hälfte vom Allen Institute for Artificial Intelligence ([ai]²) stammt. Das Institut wurde 2010 von Paul G. Allen, Mitgründer von Microsoft, ins Leben gerufen und unterstützt langfristige Forschungsarbeiten, die den Fortschritt auf dem Gebiet der Künstlichen Intelligenz beschleunigen sollen.

“Wikidata ist eine einfache wie kluge Idee und ein bedeutender nächster Schritt in der Entwicklung von Wikipedia”, sagt Dr. Mark Greaves, Vizepräsident des Allen Institute for Artifical Intelligence. “Es wird die Art und Weise verändern, wie enzyklopädische Daten veröffentlicht, zugänglich gemacht und von Menschen weltweit verwendet werden können. Wikidata baut auf semantischen Technologien auf, die wir seit Langem unterstützen. Das Projekt wird den Takt wissenschaftlicher Entdeckungen beschleunigen und der Welt eine außergewöhnliche neue Datenquelle bereitstellen.”

Ein Viertel der Entwicklungskosten von Wikidata ist durch eine Spende der Gordon and Betty Moore Foundation gesichert. Die Vision der Gordon and Betty Moore Foundation ist es, messbare, nachhaltige und weitreichende Erfolge in Umweltschutz und Wissenschaft zu erzielen.

“Wikidata ist für die Forschung bedeutend”, sagt Chris Mentzel vom wissenschaftlichen Programm der Gordon and Betty Moore Foundation. “Das Projekt wird ein wichtiges Datenangebot für Wikipedia sein. Zusätzlich können beispielsweise Wissenschaftler die einfach bedienbare Wikidata-Software herunterladen. Wikidata ermöglicht ihnen, ständig wachsende und komplexe wissenschaftliche Datenmengen zu verwalten und daraus wertvolle Schlüsse zu ziehen.”

Google, Inc. stellt ein weiteres Viertel der Wikidata-Finanzierung bereit. Chris DiBona, Leiter des Bereichs Open Source, sagt: “Googles Auftrag ist es, die Informationen der Welt überall zugänglich und sinnvoll verwendbar zu machen. Darum freuen wir uns, am Projekt Wikidata teilzuhaben. Wir hoffen, dass damit erhebliche Mengen strukturierter Daten der Allgemeinheit zur Verfügung gestellt werden können.”

Wikidata wird in drei Phasen entwickelt. Der Abschluss der ersten Phase erfolgt voraussichtlich bis August 2012. Darin werden Links zwischen verschiedenen Sprachversionen von Wikipedia zentral an einer Stelle gesammelt. In der zweiten Phase können Nutzer Daten verwenden und neue hinzufügen. Die Ergebnisse der Auswertung werden hierfür im Dezember 2012 veröffentlicht. Die dritte und letzte Phase wird die automatische Erstellung von Listen und Grafiken erlauben.

Wikimedia Deutschland führt die drei Phasen aus und übergibt anschließend den Betrieb und die Wartung von Wikidata an die Wikimedia Foundation. Geplanter Übergabetermin ist März 2013. Das Team von acht Software-Entwicklern wird von Dr. Denny Vrandečić geleitet. Er wechselte vom Karlsruher Institut für Technologie zu Wikimedia Deutschland. Zusammen mit Dr. Markus Krötzsch von der University of Oxford hat er das Semantic-MediaWiki-Projekt gegründet. Der Projektvorschlag für Wikidata wurde mit finanzieller Unterstützung des EU-Projekts RENDER entwickelt, an dem Wikimedia Deutschland als einer der Anwendungspartner ebenfalls beteiligt ist.


Links

Wikimedia sucht Mitarbeiter für Wikidata

Wikimedia stellt ein. Gesucht werden insgesamt 11 MitarbeiterInnen für das Wikidata-Projekt:

Early 2012, Wikimedia Germany e.V. will start the development of WikiData, an ambitious project that we hope will change the Web once again. We are currently looking for a number of people to help us with realizing this goal. The team will be based in Berlin, Germany, and the project aims to be implemented in one year. After completion of the project, we expect many more interesting software projects inspired by this one, so follow-up projects might be possible. In all positions it is a plus to understand Wikipedia and collaborative community processes and communities in general, to speak English and further languages, and to appreciate the scale of a project like Wikipedia.

Gesucht werden:

  • Project director (m/f)
  • Project manager (m/f)
  • Wikimedia community communication (m/f)
  • Quality assurance lead (m/f)
  • System administrator (m/f)
  • 6 Developers (m/f)

Details zu den Positionen und zur Bewerbung gibt es auf der Ausschreibungsseite. Die durchschnittlichen Infobib-LeserInnen sollten für die eine oder andere Stelle in Frage kommen. Also hurtig, fix bewerben! Das Arbeitsklima soll gut sein und das Projekt klingt äußerst spannend.