V Uday Kumar Reddy, Rajashree Shettar und Vidya Niranjan
Die Erfindung neuer Computertechniken wie Cloud- und Grid-Computing hat die Rechenkosten durch optimale Ressourcenteilung reduziert. Dennoch werden viele Anwendungen nicht vollständig auf diese neuen Technologien umgestellt, hauptsächlich weil die Wissenschaftler aus Sicherheitsgründen nicht bereit sind, die Daten über das Internet zu teilen. Obwohl die Kosten für die Hardware drastisch gesenkt wurden, erfordern einige Anwendungen eine hohe Rechenleistung, um große wissenschaftliche Datenmengen zu verarbeiten oder zu analysieren. Auch aufgrund der hohen Kosten für die Anschaffung von Rechenressourcen müssen viele wissenschaftliche Anwendungen noch vollständig umgesetzt werden. Eine solche Anwendung ist die Sequenzierung der nächsten Generation (NGS), bei der Terabyte an Genomdaten verarbeitet werden müssen, was eine hohe Rechenleistung erfordert. Daher ist ein Supercomputer erforderlich, um die Daten effizient zu verarbeiten.
In diesem Artikel wird die Verwendung der Open-Source-Grid-Middleware Berkeley Open Infrastructure for Network Computing (BOINC) vorgeschlagen, um eine De-novo-Assemblierung mithilfe eines Clusters von Desktop-Rechnern im Master-and-Volunteer-Paradigma zu ermöglichen. Das Paradigma kann in normalen Computerlaboren eingerichtet werden, wodurch sowohl die Bandbreiten- als auch die Sicherheitsbedenken bei der Verwendung von Cloud- und Grid-Computing-Methoden über das Internet beseitigt werden. Dieses Paradigma erstellt in Laboren einen virtuellen Supercomputer zur Datenverarbeitung.