Infobib

Interessantes aus Informations- und Bibliothekswesen

Du durchsuchst gerade das Archiv der Kategorie ‘Suchmaschinen’.

Kategorie: Suchmaschinen

Die Electronic Frontier Foundation beschreibt, wie man sein Suchprotokoll bei Google löschen kann. Und warum man das noch heute, vor dem 1. März 2012 tun möchte.

1. https://www.google.com/history aufrufen
2. Einloggen.
3. “Ganzes Webprotokoll entfernen”
4. Dann sollte da stehen: “Ihr Suchprotokoll ist derzeit leer.”

Mehr dazu auch bei Wired.

Google Scholar hat “Inclusion Guidelines for Webmasters” veröffentlicht. Wer sein Repository ordentlich in Google Scholar gelistet haben möchte, hat sich an Googles “Standards” zu halten. Konkret heißt es:

If you’re a university repository, we recommend that you use the latest version of Eprints (eprints.org), Digital Commons (digitalcommons.bepress.com), or DSpace (dspace.org) software to host your papers. If you use a less common hosting product or service, or an older version of these, please read the rest of this document and make sure that your website meets our technical guidelines.

Liebe Bibliothekswesen, tragt bitte in alle künftigen Anforderungskataloge für Softwareanschaffungen unbedingt ein, ob die Software Google behagen würde!

Man könnte antworten:

If you’re a search engine giant and you want to monetarize the scientific work of other people, we recommend that you use the latest version of any open harvesting protocol, for example OAI-PMH to collect the metadata of our papers. If you try to establish your own rules, have fun with your customers who wonder about crappy metadata.

Kann doch nicht so schwer sein…

Twister schreibt auf Telepolis über die Tücken der ALG-II-Software. Die Datenschutz-Aspekte möge man dort nachlesen. Für das hiesige Publikum interessant ist jedoch dies:

Die technische Umsetzung von ALG II zeigte von Anfang an Tücken. Mal wurde bei kurzen Kontonummern einfach die Kontonummer mit Nullen ergänzt, die hintenangestellt wurden, mal konnten bei einer Suchabfrage nicht mehr als 100 Ergebnisse angezeigt werden. Letzteres kommentierte die BA mit der stets erheiternden Angabe, dass mehr Ergebnisse auf eine Suchanfrage keiner Software der Welt möglich wäre.

Kommt das dabei heraus, wenn die IT jedes Ansinnen der Nicht-IT mit “das ist technisch nicht möglich” abwimmelt? Glauben die Leute das irgendwann? Kennen die Leute zum Beispie Google nicht? Oder Bibliothekskataloge? Oder haben sie dort nur noch nie über die ersten 10 Treffer hinausgeblickt und -klickt?

Danny Sullivan hat auf Searchengineland.com eindrucksvoll dargelegt, welchen Einfluss Google+ auf die Suchergebnisse hat. Und wie relevant es für Unternehmen wird, künftig auf Google+ vertreten zu sein. Eric Schmidt behauptet allerdings etwas anderes:

Did he [Eric Schmidt, Anm. des Verf.] think Google was favoring itself too much with the suggestions of Google Plus?

“No.”

Da bleibt nur noch, sich MG Siegler anzuschließen:

How on Earth is Google going to avoid antitrust inquiries with their new Search+ features announced today? If Facebook, Twitter, etc, have any decent presence in DC, the ball began rolling a few hours ago.

Die juristische Aufarbeitung der Browserkriege könnte hier einen Nachfolger finden.

Update: Ich sehe gerade, dass mit “Social Network Wars” bereits ein Name gefunden ist.

2011 7 Dez

DDC in BASE

Abgelegt unter: Bibliothek,Suchmaschinen | RSS 2.0 | TB | Tags: , , , | 1 Kommentar

BASE setzt auf ein automatisches Verfahren zur Dokumentenklassifikation nach der Dewey-Dezimalklassifikation (DDC):

Es sei nicht verschwiegen, dass das automatische Klassifikationsverfahren nicht perfekt ist, da es auf der statistischen Analyse der Dokumenttexte basiert. Da die Wissenschaftssprache sehr komplex ist und sich zudem ständig verändert, kann es auch zu Fehlklassifikationen kommen.

In der Klassifikation stöbern kann man über die VuFind-eigene Browsing-Funktion.

Im zweiteiligen Posting “Bibliothekare entdecken bisher unbekannten Vordenker des deutschen Naturschutzes” (1: Naturschutzteil, 2: Bibliotheksteil) erklärt Gerhard Hachmann, wie er in Zusammenarbeit mit seinem Kollegen Rainer Koch die bisher als Begründer des deutschen Naturschutzes geltenden Ernst Rudorff, Wilhelm Wetekamp und Hugo Conwentz vom Sockel stieß und Philipp Leopold Martin emporhob.

Kein einziger deutscher Historiker kannte bisher Martins überragende Bedeutung für den deutschen Naturschutz.

Im bibliothekarischen Teil wird der methodische Weg beschrieben. Soviel sei hier erwähnt: Googles nGram-Viewer spielte eine herausragende Rolle. Weiteres in den oben verlinkten Postings!

Ich zitiere meinen eigenen Kommentar: Diese beiden Postings sind eine schöne Demonstration, was sich mit Daten (und Digitalisaten) alles anstellen lässt, wenn man sie mal genauer unter die Lupe nimmt. Eine Perle der Biblioblogosphäre!

12 Jahre lang konnte man mit dem Pluszeichen erzwingen, dass ein Begriff in den Ergebnissen erscheinen muss. 12 lange Jahre, in denen Google mehr oder weniger das fand, was man suchte. Nun wurde das Pluszeichen einfach so seiner Funktion beraubt. Bei der Suche nach +orcid erfährt man:

Ergebnisse für orcid
Der Operator + wurde ersetzt.
Verwenden Sie für die Suche nach einem genauen Wort oder einer genauen Wortgruppe doppelte Anführungszeichen: “orcid”

In Wired findet sich ein lesenswerter Artikel über den Plusmord. Dort werden auch “Alternativen” aufgeführt. Zum Beispiel ein Greasemonkey-Script, das jeden Suchbegriff automatisch mit Anführungszeichen versieht, oder die “Suchmaschine” (oder besser -maske) FindErr, die dasselbe macht. Beides wenig überzeugend. Interessanter klingt da schon der Hinweis auf die Suchmaschine Duckduckgo. Schräger Name, aber man wird sehen, wie sich die Seite entwickelt.

At Google’s scale, user testing can hide the behaviors and passions of entire subcommunities. The long-term implications of small changes like these are very hard to predict, especially with early adopters.

Who knows? If Google’s search engine dominance started with an “and,” it might just end with a “+”.

Ernsthafte(!) Alternativen zu Google wären auf jeden Fall wünschenswert.

Google weiß es besser. Manchmal. Besonders, wenn es um Vertipper geht. Aber: Google liegt gefühlt mindestens genauso oft daneben, wie es richtig liegt. Worum geht’s? Um die Vermonsterung der hilfreichen Funktion “Meinten Sie”!

“Nein, ich meine wirklich ORCID. Danke der Nachfrage!” hätte ich gerne geantwortet. Doch statt die Ergebnisse für “mendeley + orcid” anzuzeigen, bekomme ich direkt die für “mendeley + orchid” angezeigt.

Google: das nervt!

Klaus Graf wirft einen Blick auf Google Scholar und zieht daraus Schlüsse über den IRrweg Institutionelle Repositorien. Er sucht nach “Science” und zählt die Volltextlinks:

Über 40 der 100 Treffer zum Thema bzw. Suchwort Science – sicher wichtige, weil vielzitierte Artikel – haben Volltextlinks, aber ich finde nur ein IR (igitur, NL) darunter und 3 arxiv-Links.

Wenn man einfach so nach Science sucht, hat man recht viele Treffer aus früheren Jahrzehnten. Da ich die Bedeutung der IRs eher anhand aktuellerer Publikationen prüfen würde, habe ich mal (willkürlich gewählt) auf Publikationen ab 2005 eingeschränkt.

Dabei ergibt sich schon ein etwas anderes Bild. Ich habe jetzt nicht alle verfügbaren Versionen abgeprüft, und bis zu 89 Versionen pro Dokument habe ich auf den vorderen Ergebnisseiten gesehen. Aber nun sind deutlich mehr Links auf Volltexte in IRs dabei, und alleine 3 Arxiv-Dokumente unter den ersten 10 Treffern.

Richtig bleibt aber, dass meist wohl der erste Volltext-Link angeklickt wird, der auch direkt auf der Ergebnisseite zu sehen ist. Dies ist oft nicht der IR-Link. Was ist jetzt der Schluss daraus? Sollen Repositories per SEO auf Google Scholar getrimmt werden?

Ja, das kann man machen. Man sollte es sogar. Nick Sheppard hat schon vor drei zwei Jahren die Notwendigkeit von SEO für IRs festgestellt.

It is crucial that both the Open Access full text research content of the repository and metadata records of citation material are fully indexed by Google (and other search engines); in the future it is also likely to be required for other Open Educational Resources (learning objects). However, site:http://repository-intralibrary.leedsmet.ac.uk/ currently returns just 4 results (in addition to the Login page itself) and it is a bit of a mystery how these 4 are actually being picked up when the majority of records are not.

Klickt man auf den Link, sieht man sofort, dass Sheppards Bemühungen von Erfolg gekrönt waren.

So nervig die SEO-Gemeinde mit ihrem recht hohen Schwarzschafanteil oft auch ist: Archivare und Bibliothekswesen müssen sich auch ein wenig um das Thema SEO kümmern. Und somit auch um so etwas wie Googles Panda, um Schema.org oder einfach darum, die Daten erstmal überhaupt ins Web zu bekommen. Stichwort Permalinks.

Googles Think Quarterly dreht sich in der aktuellen Ausgabe um Innovation. Beispielsweise schreibt Susan Wojcicki, Googles 16. Angestellte, über ihre persönlichen Wahrnehmungen und Erfahrungen, die 8 Pillars of Innovation:

No matter how ambitious the plan, you have to roll up your sleeves and start somewhere. Google Books, which has brought the content of millions of books online, was an idea that our founder, Larry Page, had for a long time. People thought it was too crazy even to try, but he went ahead and bought a scanner and hooked it up in his office. He began scanning pages, timed how long it took with a metronome, ran the numbers and realized it would be possible to bring the world’s books online. Today, our Book Search index contains over 10 million books.

Ebenfalls interessant sieht The Science Fiction Behind Search aus. To read…


Think Quarterly: Innovation von CH steht unter einer Creative Commons Namensnennung-Weitergabe unter gleichen Bedingungen 3.0 Deutschland Lizenz. blogoscoop
Infobib läuft unter Wordpress.3.0.5 | Theme: angepasst nach : Gabis Wordpress-Templates | Creative Commons Lizenzvertrag 24 Verweise - 0.524 Sekunden.