Google lässt Wissenschaftler im Stich

Im September 2007 gab Google bekannt, dass wissenschaftliche Daten in Zukunft gratis gehosted werden können, sofern die Eigentümer die Daten frei (public domain) zur Verfügung stellen. Zu diesem Zweck sollten per Post Festplatten verschickt werden, deren Inhalt – wissenschaftliche Terabytes – von Google dann kostenlos gehosted wird. Details in dieser Präsentation:

Nun bekommt Google kalte Füße und stampft das Projekt ein, bevor es überhaupt offiziell eröffnet wurde. Nature Blog:

Initially scheduled for public release around last month, Google pushed the launch date back to January 2009. Since then Google has been making economies in the face of the financial crisis, and the non-profit Google Research Datasets project was reviewed. Late Wednesday evening, a spokesperson wrote me to say that “We’ve been evaluating our resources to ensure they are used in the most effective possible way to bring maximum value to our users. Unfortunately, we’ve decided not to launch Google Research Datasets publicly, but to instead focus our efforts on other activities such as Google Scholar, our Research Programs, and publishing papers about research here at Google.”

Bislang wurden anscheinend nur Testdaten bearbeitet, glücklicherweise noch keine “richtigen” Daten. Dies ist ein Präzedenzfall bezüglich der Zuverlässigkeit Googles im Ernstfall. Wired:

“‘It’s a sad story if it’s true,” wrote Attila Csordas, a stem cell biologist and author of Partial Immortalization who recently moved to Hungary from Tulane University, in an email to Wired.com. “Assuming it is true that might mean that Google is still a couple years away from directly helping the life sciences (on an infrastructural level).”

Other scientists remained hopeful that the service might return in better times.

Selbst wenn der Dienst wieder aufleben sollte, bleiben nun doch ernste Zweifel an dessen Zuverlässigkeit. Eine Alternative kann sein, die Daten in P2P-Netze zu stellen und an mehreren Standorten zu verteilen. Universitäre Rechenzentren sollten eigentlich Kapazitäten für solche Projekte haben oder zumindest schaffen können. Das Outsourcen der Archivierung und Verteilung freier wissenschaftlicher Daten ist meines Erachtens nur eine Notlösung.