Assessing the Quality of Wikipedia Pages Using Edit Longevity and Contributor Centrality

Qin, Xiangju; Cunningham, Pádraig (2012): Assessing the Quality of Wikipedia Pages Using Edit Longevity and Contributor Centrality. In: The 23rd Irish Conference on Artificial Intelligence and Cognitive Science, S. 3–11.

In this paper we address the challenge of assessing the quality of Wikipedia pages using scores derived from edit contribution and contributor authoritativeness measures. The hypothesis is that pages with significant contributions from authoritative contributors are likely to be high-quality pages. Contributions are quantified using edit longevity measures and contributor authoritativeness is scored using centrality metrics in either the Wikipedia talk or co-author networks. The results suggest that it is useful to take into account the contributor authoritativeness when assessing the information quality of Wikipedia content. The percentile visualization of the quality scores provides some insights about the anomalous articles, and can be used to help Wikipedia editors to identify Start and Stub articles that are of relatively good quality.

Link: http://arxiv.org/abs/1206.2517

Bots vs. Wikipedians, Anons vs. Logged-Ins

Steiner, Thomas (2014): Bots vs. Wikipedians, Anons vs. Logged-Ins. In: Web Science Track of the 23rd International World Wide Web Conference. 23rd International World Wide Web Conference (WWW2014). Seoul, Korea.

Wikipedia is a global crowdsourced encyclopedia that at time of writing is available in 287 languages. Wikidata is a likewise global crowdsourced knowledge base that provides shared facts to be used by Wikipedias. In the context of this research, we have developed an application and an underlying Application Programming Interface (API) capable of monitoring realtime edit activity of all language versions of Wikipedia and Wikidata. This application allows us to easily analyze edits in order to answer questions such as “Bots vs. Wikipedians, who edits more?”, “Which is the most anonymously edited Wikipedia?”, or “Who are the bots and what do they edit?”. To the best of our knowledge, this is the first time such an analysis could be done in realtime for Wikidata and for really all Wikipedias–large and small. Our application is available publicly online at the URL this http URL, its code has been open-sourced under the Apache 2.0 license.

Link: http://arxiv.org/pdf/1402.0412

"Wer liest Wikipedia?" & "Botikel in der Wikipedia"

Nicht nur in der deutschsprachigen Wikipedia wird seit langem über Sinn und Unsinn von sogenannten “Botikeln” gestritten, siehe z.B. hier und hier im Wikipediakurier vom Juni 2013. Gemeint sind damit automatisch generierte Artikel, die besonders in der schwedischen und der niederländischen Wikipedia zu rasantem Artikelwachstum geführt haben. Wikidata wird m.E. dazu führen, dass mehr und mehr Wikipedias auf Bots zur Generierung von Minimal-Artikel setzen. Siehe dazu auch diese ganz aktuelle Mail auf Wikidata-l über den Reasonator.

Eine kleine, unsystematische und absolut nicht repräsentative Umfrage in meinem KollegInnen- und Bekanntenkreis ergab, dass die deutliche Mehrheit lieber einen Miniatur-Artikel findet, in dem man erfährt, das Aakashshah ein Asteroid ist, als gar keine Informationen oder solche aus nicht oder schwer einschätzbaren Quellen. Etwas überrascht war ich nach einer kleinen Recherche, dass ich kaum Literatur zum Thema fand. Überhaupt sind die Leser recht schwach erforscht. Die wenigen brauchbaren Artikel, die mir vor die Füße fallen, möchte ich jetzt und später hier unter dem Tag “botikel” und “wikipedialeserschaft” notieren.

Hintergrund: Ich vermute einen Unterschied zwischen den Vorstellungen und Bedürfnissen der Kernautorenschaft und denen der (Gelegenheits-)Leserschaft.

Hinweise auf spannende Literatur nehme ich natürlich gerne entgegen!