Nomad Project

Original: https://www.cs.rutgers.edu/~ricardob/nomad.html

Eduardo Pinheiro a Ricardo Bianchini
Coppe Systémové inženýrství
Federální univerzity v Rio de Janeiru
Rio de Janeiro, Brazílie


Nomad Project


Přehled

Nedávné zlepšení pracovní stanice a propojovací výkon sítě popularizoval hrozny off-the-shelf pracovních stanic jako platforma pro oba high-performance a interaktivních aplikací. Shluky stanic v současné době mají potenciál přiblížit se k výkonu superpočítačů a snadnost používání sálových počítačů s mnohem levnějším hardwarem. Nicméně hlavní překážky být ještě překonán těchto uskupení jakožto univerzální počítačové platformy jsou dva nedostatky většiny současných distribuovaných operačních systémů: jejich nedostatečné řízení dostupných zdrojů a jejich neschopnost předložit ucelený pohled, který může zjednodušit využití, programování, a řízení clusteru jako celku.

Za účelem odstranění těchto problémů a přiblížit výpočetní sílu velkých shluků stanic, navrhujeme Nomád, efektivní operační systém pro klastry uni a / nebo multiprocesorech. Hlavním cílem Nomad je účinně podporovat (high-performance či interaktivní) paralelní, distribuované a sekvenční aplikace. Nomad zahrnuje několik důležitých vlastností pro moderní operační systémy kazetové orientovaný: rozšiřitelnost, efektivní řízení zdrojů napříč klastru, efektivní plánování paralelních a distribuovaných aplikací, distribuované I / O, detekce chyb a zotavení, ochranu a zpětnou kompatibilitu.

Mechanismy použité pro realizaci těchto charakteristik obsahují jedinečné clusteru celého procesu identifikace, proces checkpointing a migrace, co-plánování paralelních aplikací a distribuovaný souborový systém. Některé z těchto mechanismů, jako je například proces checkpointing a migrace, lze nalézt v již dříve navržených systémů. Nicméně, Nomad je jedinečná ve zvláštním soubor charakteristik, které zahrnuje ve své strategii pro šíření informací v rámci klastru, a tím, že řídí všechny prostředky clusteru, při použití ani další zprávy ani centralizované servery implementovat jeho funkčnost. Nomad zabraňuje posílání dodatečné příspěvky spoléhající se na komunikaci, které jsou vlastní jeho distribuovaný souborový systém (který je nutný pro high disk I / O propustnosti a odolnost proti chybám tak jako tak). Například za účelem provedení procesu migrace, informace o zatížení je piggybacked na přístup k souborům zpráv.

Nomad je nyní vyvíjen jako vrstva softwaru na vrcholu standardních unixových operačních systémech. Současný prototyp systému již obsahuje většinu, ale ne všechny vlastnosti kočovník je. Prototyp podporuje x86 / Pentium rodinu mikroprocesorů s využitím Linux jako základního operačního systému a rodina Alpha mikroprocesorů s využitím digitálních Unix jako základního operačního systému.

Naše předběžné vyhodnocení mechanismů, které již byly realizovány (checkpointing, migrace, plánování a distribuované I / O) ukazují, že Nomad provádí stejně dobře nebo lépe než podobné dříve navržených systémů. Navíc naše perliminary vyhodnocení vyvažování zátěže aspektu Nomad ukazuje, že vzorek souboru přistupuje v našem distribuovaném systému souborů umožňuje efektivní a škálovatelné vyrovnávání zatížení. Na základě těchto výsledků je naším hlavním závěrem je, že úplná realizace Nomad bude s největší pravděpodobností bude efektivnější a bude poskytovat zajímavou platformu pro budoucí výzkum v oblasti operačních systémů pro svazky stanic.

Nomad Papers (v angličtině)

  •      Eduardo Pinheiro a Ricardo Bianchini. “Nomad: škálovatelný operační systém pro shluky Uni a multiprocesory”. Proceedings of the 1st IEEE mezinárodní konference o Cluster Computing, prosinec 1999.

(Eduardo Pinheiro and Ricardo Bianchini. “Nomad: A Scalable Operating System for Clusters of Uni and Multiprocessors”. Proceedings of the 1st IEEE International Workshop on Cluster Computing, December 1999. )

Nomad Papers (portugalsky)

  •      Eduardo Pinheiro e Ricardo Bianchini. “Nomad: Hm Sistema Operacional Eficiente para Clusters de uni e Multiprocessadores”. Anais dělat Simposio Brasileiro de Arquitetura de Computadores, Setembro 1998. Versão expandida.

(Eduardo Pinheiro e Ricardo Bianchini. “Nomad: Um Sistema Operacional Eficiente para Clusters de Uni e Multiprocessadores”. Anais do Simposio Brasileiro de Arquitetura de Computadores, Setembro 1998. Versao expandida. )

Nomad Lidé


Kočovník zdrojový kód
Zdrojový kód Nomad bude k dispozici zde za několik měsíců.