Blekko: Grep the Web

Letzten Monat hat Blekko den Web-Grepper angekündigt:

The way it works is simple. Everyday, we will run 2 map jobs against our crawl of 4 billion pages. These will be greps for strings, patterns, regex expressions that blekko users submit to us and decide are cool. Got a grep you want to run? Submit it here. If enough people agree with you that this grep is interesting (by voting it up), we’ll run it. And we’ll post the results here. We make the top 500 results for every grep available for free to anyone who wants it. Pretty cool, eh?

Auf den Seiten von Blekko kann man Web-Greps sowohl vorschlagen als auch einen kleinen Ausschnitt der durchgeführten Greps einsehen.

Eine Anfrage galt zum Beispiel dem Mikroformat class=”hrecipe”. Das Ergebnis: Die Zeichenkette wurde 869.396 Mal auf 1.698 Domains gefunden.

Linked Open Data mit Sternchen

Daniel Dietrich machte in der Mailingliste des Open-Data-Networks auf das Linked Open Data Star Scheme aufmerksam. Es dient dazu, veröffentlichte Daten nach ihre Nachnutzbarkeit zu bewerten.

no star Web data
one star open Web data
two star open Web data
three star open Web data
four star open Web data
five star open Web data

Die Bewertungskriterien basieren auf den 5 LOD-Sternen von Tim Berners-Lee. Dies Schema lässt sich auch übertragen auf Open Bibliographic Data. Eine Erweiterung der Sterne um eine maschinenlesbare Fassung (z.B. mit rel-license) der Kriterien wäre allerdings wünschenswert.

Bibcamp³ und Inetbib 2010 als hCalendar

Dieses Posting dient mehr oder weniger Testzwecken. Der Besuch der Veranstaltungen ist natürlich dennoch angeraten.

May 7th : 9th, 2010 Bibcamp³ at Fachhochschule Hannover

Das BibCamp ist eine Art BarCamp rund um Bibliotheken. Wir möchten eine Kommunikationsplattform für einen Erfahrungsaustausch im Bereich Bibliotheken und wissenschaftliche Kommunikation schaffen. Herzlichst eingeladen sind alle BibliothekarInnen, Studierenden, DozentInnen aus dem Bibliotheksbereich und natürlich auch die BibliotheknutzerInnen. Wir sprechen aber bewußt auch Hacker aus verwandten Bereichen wie Archiv, Museum, E-Learning, Informationswissenschaft, Wissensmanagement und IT-Entwicklung an.

April 14th : 17th, 2010 Inetbib 2010 at ETH Zürich

Die InetBib-Tagung ist ein Kongress der E-Mail-Diskussionsliste InetBib zu allem rund um die “moderne Bibliothek”.

Semantic-Web-Software der FU Berlin

Auf einer Webseite der FU Berlin sind zahlreiche Projekte versammelt, die sich mit dem semantischen Netz befassen. Neben zahlreichen Open-Source-Anwendungen (mit dem Schwerpunkt RDF) sind dort u.a. zu finden:

DBPedia:

dbpedia.org is a community effort to extract structured information from Wikipedia and to make this information available on the Web. dbpedia allows you to ask sophisticated queries against Wikipedia and to link other datasets on the Web to Wikipedia data.

RDF Book Mashup:

The RDF book mashup demonstrates how Web 2.0 data sources like Amazon, Google or Yahoo can be integrated into the Semantic Web. The RDF book mashup makes information about books, their authors, reviews, and online bookstores available on the Semantic Web. This information can be used by RDF tools and you can link to it from your own Semantic Web data. Altogether the book mashup published around a billion RDF triples on the Semantic Web (rough estimate).

OPML, oder: Bibliotheken als Organisatoren wissenschaftlicher Kommunikation

Die Rolle der Bibliothek in der näheren und weiteren Zukunft wird ständig hinterfragt. Bei jedem medialen Umbruch (Radio, Fernsehen, Computer, E-Books) wird das Ende des Buches und somit auch der Bibliotheken als Ort der aktuellen wissenschaftlichen Kommunikation prophezeit. Um es mal aus der Perspektive der Bibliothek zu sagen: Bisher konnten wir unseren Hals ganz gut aus der Schlinge ziehen. Dies war unter anderem möglich, weil neue Medien schnell in das bisherige Konzept des Sammelns und Verteilens eingegliedert werden konnten. Die Bibliotheken waren und sind dabei Getriebene technischer Neuerungen, von ihnen ging und geht dabei kein Impuls zur Veränderung aus. Dies muss nicht so bleiben.
„OPML, oder: Bibliotheken als Organisatoren wissenschaftlicher Kommunikation“ weiterlesen

Mikroformate für die Bibliothek

Mikroformate-Symbol

Dies ist ein weiterer Artikel aus der Reihe “Klein aber oho!”, in der leicht einzuführende Dienstleistungen (auch, aber nicht nur) für kleine Bibliotheken vorgestellt werden.

Was Mikroformate sind, haben wir ja schon, wie auch die Sinnfälligkeit der Integration in Bibliotheksseiten, erklärt. Wie macht man das nun? Dies sei am Beispiel von Adressdaten erklärt. Und kaum lässt man einen Artikelentwurf mal ein paar Wochen liegen, meldet sich auch schon jemand aus der Biblioblogosphäre und schleift das Thema ans Tageslicht. So geschehen im Jakoblog, nämlich hier, hier und hier. Jakob Voss geht es primär um bibliographische Daten, was natürlich auch das Ziel einer Mikroformatsimplementation sein sollte. Doch zuerst zu den Adressdaten…
„Mikroformate für die Bibliothek“ weiterlesen

Planet Mikroformate

Mikroformate-Symbol

Mikroformate sind laut Wikipedia Markup-Formate zur semantischen Annotation von HTML oder XHTML. Mikroformat-Annotationen können leicht aus Webseiten extrahiert werden und machen weiteren Programmen (etwa Suchmaschinen) die Bedeutung des Seiteninhalts verständlich.

Sie dienen also (ähnlich wie RDFa) der semantischen Auszeichnungen von Webseiteninhalten, und werden in näherer Zukunft mit Sicherheit (oder eher: hoffentlich?) auch im bibliothekarischen Bereich an Wichtigkeit gewinnen. Denkbar wäre zum Beispiel die OPAC-Implementierung der bisher noch nicht realisierten Book- oder Citationformate und natürlich die hcalendar-Auszeichnung von Bibliotheksveranstaltungen.
„Planet Mikroformate“ weiterlesen