Vítejte na HPC info : Přihlášení | Registrace | Nápověda
v
Titulní stránka Blogy O serveru

HPC info

  • Budoucnost výpočtů podle Microsoftu

    Šéf výzkumu a strategie ve společnosti Microsoft, Craig Mundie, před pár dny na technologickém institutu MIT přednášel o budoucnosti výpočtů a s nimi spojených technologiích, které se stanou běžnou praxí v horizontu několika následujících desetiletí. Mundie v této souvislosti nastínil svou vizi 3D virtuálního světa obydleného virtuálními lidmi, jehož základním stavebním kamenem je kombinace klientských a cloud služeb. O tom, co vlastně cloud služby jsou, jste se již mohli dočíst dříve (http://hpcinfo.cz/blogs/hpc/archive/2008/08/04/189.aspx). Přednáška se konala v rámci letošního ročníku konference Emerging Technology Conference (http://www.technologyreview.com/emtech/08/).

    Protože cloud služby spočívají v úzké spolupráci klientských stanic a vzdálených výpočetních center, která je realizovana prostřednictvím vysokorychlostního internetu, označil Mundie tento koncept pojmem "prostorové výpočty" (spatial computing). Na rozdíl od dnešních výpočtů, které jsou v drtivé většině případů realizovány na stanici, s níž pracujeme, předpokládá tato novinka využití lokálních stanic pouze coby terminálů sloužících jako prostředník mezi uživatelem a vzdáleným serverem, jehož uživatel nevlastní (resp. nepotřebuje vlastnit) a ani k němu nemá (nepotřebuje mít) fyzický přístup. Přínos pro uživatele je zřejmý - dostupnost mnohem vyšší výpočetní síly bez nutnosti vlastnit či spravovat nákladnou a rozsáhlou IT infrastrukturu.

    Čím je tento koncept charakteristický ukazuje výčet jeho elementární rysů: na straně klienta figurují aspekty jako je mnohojádrová architektura, paralelní programování či vysokorychlostní připojení ke cloudu; na straně cloudu je kromě vysokého výkonu důraz kladen na humanistický přístup, t.j. schopnost adaptace na přirozené lidské chování a potřeby. Sem patří například podpora personalizace, prostorově zobrazovacích metod, stejně jako vnímání a interpretování hlasových, gestikulačních a jiných vizuálních pokynů.

    Kocepce cloud architektury nepočítá s nasazením pouze v profesionálních, úzce specializovaných podmínkách, jako jsou vědecká či výzkumná pracoviště, vývojové, obchodní a finanční instituce a podobně, i když v těchto oblastech bude poptávka nepochybně velká. Byť nejde o technologii zamýšlenou pro sektor domácností, s jejím využitím v praxi se v budoucnu setkáme i na mnoha obyčejných místech.

    Jedním z možných příkladů tohoto využití je virtuální recepční. Představte si, že vstoupíte na recepci nějaké budovy či areálu, kde vás přivítá tvář na obrazovce. Pochopitelně s ní můžete komunikovat jako s normálním člověkem, tj. hlasem, gesty, případně dalšími vizuálními vjemy. Můžete si u ní například zamluvit rezervaci nebo požádat o informaci, kterou potřebujete. Systém používá všesměrové mikrofony a reprodukci přirozeného jazyka a hlasu; díky vysoké výpočetní síle cloudu jsou reakce velmi pohotové, takže komunikace s lidmi může bez problémů probíhat v reálném čase. Virtuální recepční je naprogramována tak, aby rozlišovala příchozí osoby podle oblečení. To může pomoci například ihned rozlišit návštěvníka od pracovníka firmy. Aby Microsoft svou vizi názorně ilustroval, chystá se již během několika příštích měsíců nasadit prototyp virtuální recepční na některých místech přímo ve svém sídle v Redmondu. Zdá se, že to, co jsme dosud znali jen ze sci-fi snímků, možná již není od reality příliš vzdálené. Názornou ukázku toho, jak virtuální recepční pracuje, můžete zhlédnout zde - http://www.youtube.com/watch?v=5n_MTlA9Rnc

    Prototyp systému virtuální recepční spotřebuje zhruba 40 procent výpočetní síly jednoho osmijádrového procesoru, a to i ve chvíli, kdy je nečinný. Podle Microsoftu mohou být systémy tohoto druhu využity například na vesnických lékařských klinikách. Méně příjemná je ale cena; pořídit si jej můžete už za "pár tisíc" dolarů. Obecně lze říci, že s příchodem takovýchto robotů začíná nová éra, v níž lidé a počítače spolu komunikují na zcela jiné úrovni než jakou známe dnes.

    V další demonstrativní ukázce využití cloud computingu nastínil Mundie budoucnost "živého webu". Oč jde. Vezměte si například, že jste v trafice a zaujal vás nějaký časopis. Vytáhnete svůj iPhone a vyfotíte si jeho titulní stránku. Poté jdete domů a svůj iPhone s fotografií přiložíte na elektronický stůl vybavený technologií Microsoft Surface. Tento stůl je vlastně velká dotyková obrazovka s několika vymoženostmi navíc. Jednou z nich je schopnost automaticky připojit jakékoli Bluetooth-kompatibilní zařízení, které na stůl položíte - v tomto případě iPhone. Za pár okamžiků se vám automaticky zobrazí obsah daného zařízení, z nějž prstem vyberete příslušnou fotografii. Systém analyzuje obrázek a nabídne možnosti, jak pokračovat. Zvolíte-li si například, že si chcete časopis prohlédnout, systém prostřednictvím internetu zjistí, o jaký časopis se jedná a rovnou stáhne jeho digitální verzi, je-li k dispozici, v níž můžete okamžitě začít listovat. Pokud není k dispozici digitální verze časopisu, může pro vás systém vyhledat například nejbližší obchod, kde si můžete magazín zakoupit. Podobným způsobem lze analyzovat obrázky, které v časopise naleznete - pokud váš například zaujme fotografie sošky indiána, můžete ihned zjistit, o jakou sošku jde a v jaké galerii je vystavena. Vše je pochopitelně ovládáno bez použití klávesnice, zejména pohybem ruky, případně hlasem. Více informací o Microsoft Surface, včetně ukázkových videí, je k dispozici na http://www.microsoft.com/surface/

    Dalším vhodným příkladem je Microsoft Photosynth, technologie, která umožňuje pospojovat několik fotografií tak, že se na určitý vyfotografovaný objekt můžete dívat z různých úhlů - neboli v trojrozměrném podání. Objekt si zkrátka nafotíte ze všech stran a necháte svůj počítač, aby tyto snímky poskládal do 3D modelu, nebo dokonce komplexní 3D scény určitého prostoru. Nejen tvorba, ale také renderování (zobrazování) těchto modelů je však vysoce výpočetně náročná metoda, se kterou by si stěží poradily například kapesní počítače PDA či mobilní telefony, což jsou zařízení, k nimž prohlížení digitálního obsahu již dnes neodmyslitelně patří. I zde by metoda cloud computingu mohla proto do budoucna přinést řešení. Více informací na http://www.microsoft.com/cze/photosynth/

    Pozoruhodně působí také další příklad - přístroj sloužící pro orientaci v prostoru, který Mundie demonstruje na tomto videu - http://www.youtube.com/watch?v=orMJF_i-w6Q. Myšlenka je taková, že jdete například po ulici, v kapse máte klasické PDA s připojením na GPS, které lokalizuje vaši pozici, a na jeho obrazovce máte místo běžné mapy, která bývá u GPS navigátorů zvykem, stejný obrázek, který uvidíte, když se rozhlédnete kolem sebe. Jen s tím rozdílem, že u jednotlivých objektů se vám zobrazují přesně ty informace, které potřebujete znát, ať už je to název ulice, firmy, místa, jízdní řády na autobusové zastávce či informace o tom, jaké zboží si můžete zakoupit v obchodě, kolem něhož právě procházíte. Veškeré zobrazované informace a upozornění si můžete personalizovat na základě svého osobního profilu. Ani takováto služba se pochopitelně neobejde bez přísunu velkého množství dat a především vysoké výpočetní síly, která s nimi dokáže v reálném čase pracovat. Proto se i v tomto případě počítá s využitím cloud computingu.

    Již na těchto několika příkladech je dostatečně zřejmé, že potenciál technologie cloud computingu nezná hranic a je jen na lidské fantazii, do jaké míry jej dokáže využívat. Jako každá revoluční novinka ale i tato technologie už ve svém konceptu naráží na určité překážky. Jednou z nich je naprostá nepřítomnost vhodných programovacích nástrojů schopných vyvíjet software pro cloud architekturu. Proto je podle Mundieho z Microsoftu především nutné kompletně změnit aktuální způsob psaní aplikací; jinými slovy připravit software na nový systémový design, kde velkou roli sehraje schopnost paralelizovat výpočty mezi obrovské množství výpočetních jader. Další dohady vyvolává otázka, kdo bude provozovatelem této služby, resp. infrastruktury (cloudů). To je dozajista problém, který je také třeba řešit, protože nároky na výpočetní sílu cloudů s každým rokem porostou geometrickou řadou s tím, jak budou přibývat stále noví uživatelé a aplikace budou náročnější.

    Zdroj: http://news.cnet.com/8301-13953_3-10050826-80.html

  • Red Hat nabízí první linuxovou HPC platformu

    Globálně dostupné HPC řešení od společnosti Red Hat integruje v jediném softwarovém balíčku veškeré komponenty, které jsou nezbytné k vybudování a správě kompletního HPC clusteru.

    Red Hat, jeden z předních světových dodavatelů programového vybavení, které je založeno na principu volného přístupu ke zdrojovému kódu programu i jeho dalšímu volnému užití bez omezení (tzv. open-source), oznámil globální dostupnost vůbec první integrované High Performance Computing (HPC) platformy postavené na operačním systému Linux. Softwarový balík typu "vše v jednom" s názvem Red Hat HPC Solution neobsahuje pouze operační systém Red Hat Linux, ale také mnoho dalších softwarových nástrojů, které zákazníci využijí při instalaci, provozu a správě svých HPC clusterů. Red Hat na vývoji balíku spolupracoval s firmou Platform Computing - spolupráce byla poprvé oznámena v listopadu 2007. Produkt HPC Solution je již nyní dostupný prostřednictvím distributorské sítě Red Hat Network a náleží k němu taktéž plnohodnotný zákaznický servis 24x7.

    Budování a správa HPC clusterů s sebou odjakživa přináší i řadu nepříjemností spojených se zdlouhavou a jednotvárnou implementací, která je navíc velmi náročná na předchozí školení, plánování a pozdější údržbu. To je také důvod vzniku Red Hat HPC Solution. Toto nové komplexní řešení slibuje všem zákazníkům výhody plynoucí z jednoduché instalace, dostupnosti všech nezbytných nástrojů z jednoho místa a především rychlosti implementace, která by neměla překročit interval jedné hodiny. "S tímto HPC řešením umožňujeme zákazníkům soustředit se výlučně na své obchodní cíle a budování konkurenční výhody na trhu bez starostí spojených s nasazením a správou HPC clusteru," vysvětluje Scott Crenshaw, vice president, Platform Business Unit, Red Hat. "Přinášíme první HPC řešení založené na Linuxu, které zákazníkům umožňuje implementovat plně integrované HPC prostředí v řádu minut namísto týdnů či měsíců. Nikdo jiný v tomto průmyslovém odvětví ještě nemá tak komplexní linuxové řešení pro HPC clustery jako my," dodává.

    Red Hat HPC Solution zahrnuje veškeré komponenty nezbytné k nasazení a údržbě HPC clusterů, včetně Red Hat Enterprise Linux 5.2, jedné z předních světových linuxových open-source distribucí, a Platform Open Cluster Stack 5, softwarového frameworku pro clustery od partnerské společnosti Platform Computing. Kromě toho nabízí řešení také ovladače hardwaru, jednoduchý instalátor clusteru, nástroje pro správu clusteru, nástroje pro monitorování hardwaru i aplikací, podporu síťové infrastruktury a Platform Lava, což je výkonný plánovač úloh.

    Protože instalace, správa a údržba HPC prostředí bývá mnohdy rozmanitá a jediné univerzální řešení nemusí každému zákazníkovi plně vyhovovat, zahájily společnosti Red Hat, Dell a Platform Computing partnerskou spolupráci na vývoji ještě jiného softwarového balíku určeného pro HPC clustery. Výsledkem této spolupráce je Platform Open Cluster Stack (OCS). Toto řešení, které slouží jako rozšíření/nástavba pro Red Hat HPC Solution, přináší celou řadu dalších možností a služeb, které v základním balíku obsaženy nejsou. Pro někoho bude zřejmě nevýhodou, že produkt nelze použít v kombinaci s jiným hardwarem než značky Dell; jmenovitě jsou podporovány tyto servery jako hlavní uzly: Dell PowerEdge 1850, PowerEdge 1950, PowerEdge 2850 a PowerEdge 2950; a dále tyto jako výpočetní (vedlejší) uzly: Dell PowerEdge SC1425, PowerEdge 1850, PowerEdge 1855, PowerEdge 1950, PowerEdge 1955 a PowerEdge 2950. Více se o produktu Platform Open Cluster Stack dozvíte na této stránce: http://www.dell.com/downloads/global/power/ps4q06-20060415-Platform.pdf

    "Díky Red Hat HPC Solution si organizace, počínaje drobnými podnikateli po malé a střední společnosti (SMB), mohou osvojit open-source řešení, která jsou plně podporována, snadná na použití a nákladově úsporná při implementaci," sdělil Tripp Purvis, vice president, Business Development, Platform Computing. "Kombinace šestnácti let zkušeností Platform Computing v oblasti vývoje management softwaru pro HPC prostředí s výkonem a stabilitou linuxové platformy Red Hat Enterprise Linux 5.2 přináší flexibilní technologii, která se dokáže přizpůsobit stále náročnějším požadavkům na rostoucím HPC trhu."

    "Dell je dlouhodobě zavázán zjednodušovat HPC řešení, a proto v přístupu, který Red Hat ve svém HPC Solution uplatňuje, vidí zřejmou výhodu," říká Judy Chavis, director of Business Development and Product Management, Dell Inc. "Zužitkováním našeho dosavadního vztahu s firmou Platform Computing plníme náš závazek zjednodušovat IT a současně podporujeme využívání standardizovaných komponent v komplexních prostředích; toto řešení pomáhá posílit naše postavení na HPC trhu a také velmi dobře zapadá do naší celkové firemní strategie."

    Řešení Red Hat HPC Solution si zákazníci mohou již dnes zakoupit od prodejců Red Hat, a to za počáteční cenu $249 USD za uzel, což je zhruba 4 580 Kč. Více informací o Red Hat HPC Solution naleznete na: www.redhat.com/hpc

    Zdroj: http://www.hpcwire.com/offthewire/Red_Hat_Delivers_Linux-Based_HPC_Platform.html

  • Windows 7 budou podporovat paralelní výpočty

    Microsoft již dříve vypustil několik útržkovitých informací, které hovoří o tom, jakým způsobem firma přidává podporu paralelního zpracování výpočtů do svých vývojářských nástrojů (zejména Visual Studio). Server ZDnet.com zjistil, že změny, které povedou k lepší podpoře paralelních výpočtů, mají být součástí rovněž nadcházejícího vydání operačního systému z rodiny Windows, známého jako Windows 7. Ačkoli vývojáři Microsoftu, stejně jako betatesteři a vůbec všichni, kdo mají přístup k testovacím verzím Windows 7, se obšírně zaměřují na nové uživatelské prostředí, není to pochopitelně jediná novinka, kterou se nový OS chystá pochlubit. Zástupci společnosti se v neoficiálním rozhovoru nechali slyšet, že za účelem zachování kompatibility aplikací i ovladačů budou hloubkové změny mezi Windows Vista a Windows 7 pouze minimální. Přiznali také, že Win32, jádro systému Windows, není pro asynchronní, souběžně výpočty vhodné. I přesto nebo snad právě proto již Microsoft podniká první kroky k tomu, aby toto omezení bylo u příští generace Windows překonáno - jmenovitě u Windows 7 a jeho serverové alternativy Windows 7 Server (v současné době známé jako Windows Server 2008 R2).

    Strategií Microsoftu v dlouhodobém horizontu je najít způsob, jak odstranit z Windows stávající jádro Win32 a při současném zachování nejvyšší možné kompatibility jej nahradit novým kódem - sadou programovacích rozhraní, které jsou lépe přizpůsobené pro provoz paralelně běžících úloh na vícejádrových čipech či multi-procesorových systémech. Na něčem podobném se již pracuje pod kódovým označením RedHawk a MinSafe, což jsou prakticky dvě identické technologie vyvíjené dvěma různými týmy pod záštitou Microsoftu, jejichž účelem je starat se o to, aby byla rovnoměrně vytížena všechna přístomná výpočetní jádra. S nasazením těchto technologií v operačním systému se však počítá teprve od Windows osmé generace a Midori - nové rodiny OS od Microsoftu vyvíjené zcela nezávislé na řadě Windows. Zatím tudíž není známo, jakým způsobem a do jaké míry budou Windows 7 paralelizaci podporovat, ale podle všeho nějakou podporu obsahovat budou. Vnést světlo do této otázky by mohla již koncem října konference Microsoft Professional Developers Conference, kde by představitelé společnosti měli diskutovat o "klíčových architektonických změnách, které umožní systému Windows efektivně provozovat paralelní software". Tolik z popisu uvedeném na oficiálních webových stránkách PDC (http://microsoftpdc.com).

    "Win32 nebyl nikdy navržen pro vysoce nezávislé, asynchronní procesy," uvedl Craig Mundie, Chief Research and Strategy Officer, Microsoft. "Paralelismus vyžaduje změny ve všech softwarových vrstvách. To obnáší přeskupení různých úloh do různých vrstev... a tedy hledání rovnováhy mezi rolemi a runtime procesy. A to je to, co potřebujeme zformovat v operačním systému. První kousky tohoto očekávejte v příští generaci Windows." Jako příklad windowsovské funkce, která je dotčena potřebou tohoto druhu "vyvažování", uvedl Mundie plánovací model v uživatelském módu (user-mode scheduling model). Stávající plánovač ve Windows běží "na příliš vysoké vrstvě", vysvětluje. Současně poznamenal, že Microsoft uvedl nový zkušební model jako součást svého Robotics Development Kitu. Tato sada nástrojů obsahuje nově vyvinuté runtime knihovny, které umožňují souběžný, koordinovaný a decentralizovaný běh softwarových služeb - tedy takové knihovny, které jsou optimalizované pro distribuované/mnohojádrové výpočty.

    Podle encyklopedie Wikipedia Microsoft podnikl některé základní modifikace plánovače za účelem paralelizace procesů již v operačním systému Vista: "Operační systémy založené na technologii Windows NT používají mnohaúrovňovou zpětnou frontu. Definováno je 32 úrovní priorit, kde priority 0 až 15 jsou normální a priority 16 až 31 jsou ty, které běží v reálném čase a vyžadují přiřazení určitých výsad... Plánovač ve Windows Vista byl modifikován tak, že používá cyklické počítadlo registrů v moderních procesorech, čímž si uchovává přehled o tom, kolik CPU cyklů je přesně vykonáno na jeden thread, namísto používání rutinního časovače přerušení."

    Zatímco stroje s několika málo jádry mohou současné verze Windows bez větších obtíží plnohodnotně využívat, jejich návrh není zdaleka vhodný pro stroje obsahující 8, 16, 32 a více jader. Microsoft si nyní může vybrat, zda jít cestou úplné podpory vícejádrových architektur, což by znamenalo nutnost předělání stávajícího jádra Win32 a pravděpodobnou ztrátu kompatibility s některými aplikacemi, nebo provedení takových úprav, které provést lze při současném zachování 100% kompatibility. Od výrobce OS lze téměř s jistotou očekávat, že se rozhodne buď pro druhou variantu, anebo... a to je nejpravděpodobnější... že vytvoří dva různé operační systémy, z nichž každý půjde vlastní cestou. Dost možná, že to je ten důvod, proč má být Midori vyvíjen jako zcela odlišná platforma.

    V této době lze zatím bohužel pouze spekulovat. Vydání obou operačních systému (Windows 7 a Midori) je naplánováno na začátek roku 2010. V každém případě si můžeme být jisti tím, že jakkoli je softwarové přizpůsobení se novým technologiím problematické, vždy je to jen otázkou času. Za pár let si nejspíš už ani nedokážeme software bez podpory paralelizace vůbec představit a bude přitom zcela lhostejné, zda používáme platformu Windows, Midori, Linux, MacOS X či cokoli jiného.

    Zdroj: http://blogs.zdnet.com/microsoft/?p=1612

  • Microsoft uvedl na trh nový operační systém pro superpočítače

    V pondělí 22. září oznámil Microsoft uvolnění finální verze svého nejnovějšího operačního systému Windows HPC Server 2008. Jak název napovídá, tento OS je směřován do oblasti serverů a HPC clusterů, což jej předurčuje téměř výhradně pro firemní použití. Oproti svým předchůdcům slibuje tato novinka zejména snazší nasazení, větší úsporu nákladů a vyšší škálovatelnost. O tom, jaké převratné vlastnosti přináší Windows HPC Server 2008, jste se mohli dočíst již dříve v souvislosti s uvolněním betaverze - http://hpcinfo.cz/blogs/hpc/archive/2007/11/18/143.aspx a http://hpcinfo.cz/blogs/hpc/archive/2007/11/26/144.aspx. Zájem o produkt podpoří také řada globálních doprovodných aktivit, které budou zahájeny v následujících týdnech.

    Během úvodní keynote, která proběhla minulý týden ve Wall Street, diskutoval Bill Laing, viceprezident divize Windows Server and Solutions, o tom, jak organizace poskytující finanční služby rostoucí měrou konvertují na HPC zdroje a tím si uchovávají schopnost v reálném čase provádět analýzy rizika, které jsou odpovědí na turbulentní, obtížně předvídatelné prostředí trhu. "Aby si společnosti udržely svou pozici na konkurenčním trhu, musí být více efektivní než kdy předtím. Proto potřebují takové HPC řešení, které je možné jednoduše nasadit a integrovat do stávajícího heterogenního prostředí v různém rozsahu od pracovních stanic až po serverové clustery," uvedl Laing. "Spuštění Windows HPC Server 2008 je dalším krokem k uskutečnění naší vize ovládat mainstreamový trh s HPC." Laing neopomněl dodat, jakým způsobem chce Microsoft tohoto cíle dosáhnout - soustředěním se na zvyšování produktivity uživatelů, vývojářů a administrátorů.

    Výzkum provedený firmou IDC ukazuje, že oblast superpočítačů (HPC) patří v posledních pěti letech mezi nejrychleji rostoucí obory IT trhu. Prostřednictvím Windows HPC Serveru 2008 chce Microsoft přinést hodnotu integrovaného HPC řešení a produktivního vývojového prostředí i zákazníkům, pro které byla oblast superpočítačů v minulosti nedosažitelná. Vývojáři s tímto produktem zase mají dostat do rukou nástroje, které jim usnadní využít výkon superpočítačů i pro produkty, které firmy vlastní a jejichž pracovníci je rutinně používají každý den. I Microsoft Excel nebo Microsoft SharePoint Server by tak z HPC infrastruktury měly dokázat vytěžit maximum díky podpoře nové architektury orientované na služby (SOA).

    Windows HPC Server 2008, následovník Windows Compute Cluster Serveru 2003, je založen na systému Windows Server 2008 a je navržený tak, aby umožnil zejména:

    • Zvýšit produktivitu správců informační infrastruktury a součinnost v rámci počítačových clusterů, a to výrazným zjednodušením procesu implementace a správy v průběhu celého životního cyklu systému, a to při současném zajištění součinnosti se stávajícími prvky informační infrastruktury.
       
    • Rychlý vývoj aplikací pro HPC díky integraci s nástroji Visual Studio 2008, které vývojářům zajišťují obsáhlé vývojové prostředí s podporou paralelního programování. Kromě podpory standardních rozhraní včetně OpenMP (aplikační rozhraní pro multiplatformní sdílení paměti), propojení víceprocesorových počítačů (MPI) a webových služeb, podporuje Windows HPC Server 2008 také numerické knihovny nezávislých tvůrců softwaru, nástroje pro optimalizaci výkonu, kompilátory a debuggery.
       
    • Hladké škálování výkonu od pracovních stanic po serverové clustery, a to prostřednictvím známého uživatelského prostředí Windows, které od uživatelů nevyžaduje žádné zvláštní dovednosti ani absolvování školení.

    Kolektivní spolupráce na vývoji

    Na samotném vývoji a testování systému Windows HPC Serveru 2008 se podílelo téměř sto významných specializovaných firem z různých oborů. Nechyběly mezi nimi ani finanční domy Morgan Stanley, Lloyds TSB Bank a Bank of America. Právě bankovní domy a jiné finanční instituce bývají na HPC infrastruktuře závislé nejvíce, neboť každodenně pracují s obrovským množstvím čísel. Minulý týden Microsoft současně oznámil nové partnerství se společností Cray, nejvýznamnějším dodavatelem superpočítačů, jehož cílem je zahájení prodeje nového kompaktního superpočítače s označením Cray CX1. Toto řešení, jehož cena začíná na 25 000 dolarech, by mělo pomoci firmám z různých průmyslových oborů sjednotit jejich desktopové a serverové aplikační procesy.

    Windows HPC Server 2008 představují širokou platformu pro nezávislé dodavatele softwaru a zároveň nové rozsáhlé pole působnosti pro výrobce počítačů, kterým umožňuje přinášet další inovace v oblasti superpočítačů a vysoce výkonných počítačových systémů. Microsoft dnes spolupracuje s více než 60 partnery, včetně společností Advanced Micro Devices, Cray, Dawning Technologies, Dell, HP, IBM, transtec AG a Intel, na dalším vývoji superpočítačů a podpoře jejich přeměny v systémy dostupné pro každého zájemce.

    "Věříme, že Windows HPC Server 2008 společně s hardwarem IBM System x významně přispějí k rozšíření trhu superpočítačů," říká Dave Jursik, viceprezident jednotky HPC Sales, IBM. "Kombinace osvědčeného softwaru Microsoft s unikátními HPC nástroji a řešeními IBM přinese klientům špičkovou produktivitu a extrémní výkon."

    Sotva byl nový OS uveden na trh, americká společnost Milliman Inc. se již stihla stát globálně prvním výrobcem softwaru, který nabízí aplikaci integrovanou s Windows HPC Server 2008. V tomto případě se jedná o pojišťovnický informační systém MG-ALFA, který zřejmě musel být vyvíjen a testován již na betaverzích nového systému.

    Cena a dostupnost

    Zkušební verzi systému Windows HPC Serveru 2008 si mohou zájemci stáhnout již nyní z www.microsoft.com/hpc. Cena Windows HPC Server 2008 činí 475 dolarů (cca 7 950 Kč) na uzel (server). Více informací k cenám a licencování je k dispozici na http://www.microsoft.com/hpc/en/us/pricing-licensing.aspx. Zajímavé informace o HPC aktivitách Microsoftu vycházejí také v TechNet Flash zpravodaji (www.technetflash.cz) v rámci pravidelného seriálu.

    Pokud vás zajímá, jaké konkrétní výhody přinese vaší HPC infrastruktuře platforma Windows, prohlédněte si skript na http://www.microsoft.com/global/hpc/en/us/RichMedia/hero/HPCScript.pdf

    Prezentační video k produktu Windows HPC Server 2008 je k dispozici na adrese http://www.microsoft.com/hpc/en/us/hpc-video.aspx

    Zdroj: http://www.microsoft.com/presspass/press/2008/sep08/09-22HPCLaunch08PR.mspx

  • Může být Nehalem posledním hřebíčkem do rakve AMD?

    Na veletrhu IDF se společnost Intel, kromě jiného, zabývala i některými dosud neodhalenými fakty o architektuře Nehalem - nové x86 platformě sestávající z optimalizované architektury Core s integrovaným paměťovým řadičem a novým typem (sdílené) sběrnice, tzv. CSI (Common Serial Interconnect). Připomeňme, že CSI je sériové dvoubodové spojení na způsob HyperTransportu, jenž je používán zejména jako komunikační rozhraní mezi procesory AMD a čipsetem (a někdy také mezi severními a jižními můstky některých čipsetů). Očekává se, že sdílená sběrnice CSI, která může být v budoucnu využita prakticky jakýmkoli zařízením - kromě procesorů například i pevnými disky, grafickými kartami, řadiči a spoustou dalších interních komponent - přinese zřejmě největší užitek do sektoru serverů a pracovních stanic a samozřejmě také mezi HPC clustery.

    Je veřejným tajemstvím, že Intel se při návrhu nové architektury nechal inspirovat konkurenčními technologiemi. Pokud bychom vedle sebe položili čip Intel Nehalem a AMD Opteron a porovnali jejich architekturu, jen těžko bychom mohli přehlédnout výskyt množství nápadně podobných technologií v obou produktech. Jedná se například o instrukční sadu x86-64, paměťovou technologii NUMA (non-uniform memory access), která přiděluje vlastní paměť RAM každé procesorové patici (socketu) zvlášť, dále pak již zmíněnou dvoubodovou sběrnici CSI (oficiálně uvedenou pod názvem Direct Connect nebo také QuickPath), nechybí ani paměťový a sběrnicový řadič přímo v čipu, nezávislé řízení napájení každého výpočetního jádra podle jeho vytížení, regulátor teploty a napájení interních komponent, schopnost maskovat více procesorů jako jediný čip, samostatná L2 paměť pro každé jádro, kratší délka pipeline (řetězec vykonávaných instrukcí) - většina z toho všeho je něčím, co již v konceptu AMD Opteron existuje a nyní bude existovat také v konceptu Nehalem. Nutno ale přiznat, že Intel dotáhl tyto nápady blíže k dokonalosti než jeho rival.

    Intel doufá, že se mu podaří nalomit AMD hlavně díky jedné technologii, kterou Opteron dočista postrádá - integrovanému mikrořadiči napájení. AMD se zatím nevyjádřila, zda plánuje uvést na trh technologii, která by směle konkurovala té, jež Intel udržuje v tajnosti až do samotného vypuštění Nehalemu. Možná ani nebude mít proč. Skutečnou otázkou totiž je, jaké výhody přinese řízení napájení integrované přímo do procesoru a nikoli do čipsetu základní desky. Jistou výhodu by mohla představovat nezávislost na podpoře ze strany operačního systému, která ale podle všeho nenastane. Jinými slovy, Intel bude mít plné ruce práce, aby přesvědčil Microsoft k implementaci podpory do svých OS; stejně tak se bude muset snažit u výrobců Linuxu. Další otázku vyvolává fakt, proč tak Intel činí, když drtivá většina dnešních operačních systémů efektivně řídí napájení procesoru díky úsporným technologiím, které byly uvedeny na trh už před lety (Cool'n'Quiet, SpeedSteep). V každém případě musí mít Intel dobrý důvod, proč integrovat řadič napájení přímo do čipu. AMD k tomuto zaujímá navenek neutrální postoj.

    Pokrok byl učiněn také v návrhu vyrovnávací paměti (cache). Velká sdílená L2 paměť je již minulostí. Místo ní přicházejí mnohem menší dedikované paměti pro každé jádro. Po vzoru AMD a starších procesorů řady Intel Xeon se navrací paměť třetí úrovně (L3). Ta bude použita jako místo, kde se filtrují data putující mezi jádry, čímž dojde k jejich redukci na nezbytné minimum a ke zrychlení práce. Zacházení s cache pamětí je jednou z hlavních a zřetelných odlišností mezi starší a novou inteláckou CPU architekturou. Tomu se ostatně nelze divit - v tomto směru existuje mnoho prostoru k inovacím (na rozdíl od jiných rozvinutých technologií).

    Kromě inovací inspirovaných více či méně architekturou AMD navíc Intel oprášil i některé vlastní starší technologie, které nejprve opustil, aby je posléze znovu implementoval. Řeč je o HyperThreading (HT). Tato vlastnost byla původně součástí architektury Netburst používané u Pentií 4 a Xeon. S příchodem vícejádrové architektury Core však byla odstraněna jako "nadbytečná", neboť málokterá aplikace dokázala tou dobu využívat více jader, než kolik jich bylo fyzicky přítomných (tj. dvě až čtyři). Situace na softwarovém poli se ale během posledních let poněkud změnila a nový software pomalu přichází vícejádrům na chuť. A to v některých případech (serverové aplikace) dokonce rychleji než roste počet fyzických jader v čipech, nebo to alespoň Intel do budoucna předpokládá. A to je také důvod, proč se kromě fyzických jader hodí mít ještě další jádra, která se jako fyzická pouze tváří, byť jsou ve skutečnosti provozována jedním a tím samým jádrem. Konkurence (AMD) však prozatím nepovažuje HT za nic, co by stálo za to implementovat, a to ani u serverových čipů. Zatímco Intel hovoří až o 30procentním nárůstu výkonu s HT u ideálně vyladěných aplikací, AMD má docela jiný názor. Ta totiž považuje HT za vlastnost, která umožňuje čipu pracovat i v době, kdy čeká na data přicházející z operační paměti. Jenomže integrovaný paměťový řadič a mnohem rychlejší paměti, které jsou dnes k mání, snižují tyto latence na zlomek času, který nastával v raných dobách Pentia 4. A do budoucna se latence budou pochopitelně ještě zkracovat, což poněkud snižuje potenciál pro využití HT v dlouhodobém horizontu - aspoň tak to vidí AMD. Ať tak či onak, HT může přinést vyšší výkon pouze u vysoce paralelizovaných aplikací, které určitě nenalezneme na domácích PC jako spíše na pracovních, serverových a HPC stanicích.

    AMD příliš nevěří tomu, že aplikace vůbec jakkoli "pocítí" některé inovace v architektuře Nehalem, a tudíž je pokládá za zbytečné. Mezi takové se řadí například instrukční sada SSE 4.2 (Streaming SIMD Extensions) nebo tzv. akcelerátory aplikací (Application Targeted Accelerators - ATA). Oboje totiž vyžaduje změnu v kódu aplikace, která může být provedena buď automaticky, nebo ručně. V prvním případě by došlo ke zpomalení v důsledku práce věnované "překódování" a v druhém případě bude nejspíš programátorům chybět motivace se do něčeho takového pouštět - nejen kvůli práci navíc, ale také kvůli hrozící nekompatibilitě s jinou platformou, než je Intel. Stejná situace, tj. nutnost změnit programový kód, nastane také u nové technologie řízeného napájení i jiných "zlepšováků". Je pravděpodobné, že tyto inovace poslouží vývojářům úzce specializovaných aplikací (lékařské aplikace, CAD nástroje, výzkumné programy apod.), ale ostatní vývojáři dají zpravidla přednost konvenčnímu programování, než aby věnovali enormní úsilí něčemu, co ocení jen malá část jejich zákaznické báze.

    Na rozdíl od Intelu, AMD prosazuje dlouhodobou životnost jedné platformy a doufá, že většina uživatelů nebude mít zájem kvůli Nehalemu měnit platformu u svých serverů. Proto AMD před revizí platformy obvykle nechá zákazníky a OEM výrobce pouze vyměnit procesor u stávající platformy nebo provést update BIOSu, a tím si udržet krok s dobou. Tím si zřejmě zachovává přízeň firem, které mají příliš úzký rozpočet na to, aby si mohli nějaké rozsáhlejší upgrady dovolit. Pokud by zákazník chtěl mít poslední generaci výpočetní techniky na platformě Intel, musel by každé dva roky vyměnit celý systém. To poměrně dobře demonstruje odlišnou strategii a přístup k zákazníkovi ze strany obou těchto výrobců.

    Přes všechny novinky, které Nehalem přinese, jde však stále pouze a jenom o upravenou Pentium III architekturu, kterou například používají i všechny Core 2 čipy. Za ta léta, co Intel pracoval na optimalizaci této architektury, AMD úspěšně vyvíjelo architekturu novou. Tento čas jí poskytnul především obchodní úspěch čipů Opteron, které od své prvotní revize až dosud prošly pouze nepatrnými úpravami. Výsledkem tohoto snažení je velmi očekávaná platforma Fusion, tedy čip, který v jednom monolitickém pouzdře pro jednu patici (socket) integruje procesor, čipset a grafické jádro a několik dalších technologií, které byly dosud umístěny odděleně na základní desce. Fusion se jeví jako příležitost pro AMD získat zpět silné postavení na trhu z doby, kdy nabízela Athlony 64/Opterony, zatímco Intel neměl v rukávu víc než technologicky zaostalejší Pentia 4/Xeon s architekturou Netburst.

    Skutečnost, že Intel inovoval své produkty po vzoru konkurence, ještě nutně nestaví AMD do oslabené pozice. Mnohem důležitější roli sehraje cena. Agresivní konkurenční souboj je výhodný pro zákazníky, kteří se mohou těšit nejen na levnější zboží, ale také na nejrůznější inovace, s nimiž oba výrobci budou usilovně přicházet, aby své produkty co nejvíc vzájemně odlišily.

    Zdroj: http://weblog.infoworld.com/yager/archives/2008/09/amd_answers_neh.html

  • Superpočítač IBM pomáhá zlepšit ekonomickou a vědeckou úroveň Bulharska

    Bulharská státní agentura pro informační technologie a komunikace (SAITC) a společnost IBM Bulharsko společně oznámily instalaci prvního bulharského superpočítače IBM Blue Gene/P, který se ve světě HPC řadí k nejpopulárnějším počítačovým systémům. SAITC použije IBM Blue Gene/P pro výpočetně náročné projekty v oblasti životních věd, výzkumu nových léků, finančního modelování a také vzdělávání.

    Systém založený na platformě Linux obsahuje celkem 8.192 hustě integrovaných mikroprocesorů a jeho souhrnný výkon činí 23,42 trilionů operací za sekundu (TFLOPS). Podle aktuálního žebříčku Top500.org by se bulharský systém IBM Blue Gene/P umístil mezi první stovkou nejvýkonnějších superpočítačů světa. K jeho zařazení do žebříčku však může dojít nejdříve v jeho následující publikaci. Systém, který je tvořen pouhými dvěma skříněmi typu RACK, byl již v superpočítačovém centru agentury SAITC úspěšně instalován. "Národní superpočítačové aplikační centrum nyní disponuje nejmodernější počítačovou výbavou a nejvyšší výpočetní silou v Bulharsku. To představuje pro náš stát mimořádnou výhodu," uvedl Sergey Stanishev, předseda vlády Bulharské republiky, při otevíracím ceremoniálu Centra.

    Organizace, jako jsou například Bulharská akademie věd, Ministerstvo financí či bulharské univerzity, budou moci využívat schopností IBM Blue Gene/P k provádění komplexních vědeckých výpočtů. Například Ministerstvo financí, ale také Národní centrum pro výzkum lidských genomů a proteinů jakožto nově zformovaná vědecká entita, budou na systém spoléhat během finančního modelování, studie genomů a vývoje léků. Dle smlouvy bude systém po celou dobu spravován vědeckou laboratoří IBM v Zurichu. "Smlouva s IBM zahajuje novou éru superpočítačů v Bulharsku, přičemž vytváří velký potenciál pro rozvoj vědy v celém regionu," říká Plamen Vachkov, předseda bulharské SAITC.

    Toto jsou čtyři hlavní oblasti, ve kterých bude IBM Blue Gene/P využíván:

    Diagnostika na bázi DNA - Systém bude provozovat algoritmy sloužící k izolaci klíčových genů a léků pro nejrozšířenější nemoci. Analýza fungování populačně rozšířených genů způsobujících určitou nemoc a proteinů, které produkují, poskytne jasnější obrázek o biologickém pozadí nemocí, které trápí lidskou populaci.

    Vývoj léků - Výpočetní síla superpočítače poslouží pro simulace potřebné k vývoji nových léků. Funkce pro modelování léků integrují znalosti matematiky, fyziky, chemie a biologie s pokročilou, vysokou výpočetní silou a inženýrstvím. To umožňuje náležitě filtrovat obrovské množství informací, které obnáší uspořádání lidského genomu, čímž dochází k významnému urychlení dodávek nových léků na trh.

    Finanční modelování - Interaktivní superpočítačová technologie umožňuje nepřetržitou zpětnou vazbu a vylepšování dílčích kroků v celém finančním cyklu, důsledkem čehož jsou kvalitnější finanční modely, algoritmy a v neposlední řadě i mnohem přesnější předpovědi, které se uplatní během rozpočtového plánování, prediktivního modelování katastrof apod. Rozsáhlé datové sady s komplikovanými modely mohou díky tomu být spravovány bez ztráty interaktivity či jednoduchého použití.

    Superpočítač také pomůže zlepšit dovednosti bulharských studentů - místní univerzity dnes hledají rychlé, inovativní a nákladově efektivní řešení, které pomůže jejich intelektuálním komunitám transformovat hrubá data generovaná výzkumem na použitelné informace. S řešením IBM Blue Gene/P získají studenti výpočetní sílu a systémové zdroje, které potřebují k přesnějšímu rozhodování a profilovému růstu Bulharska mezi globálními vědeckými institucemi a akademickými komunitami.

    "IBM je lídrem sektoru superpočítačů, který dokáže nabídnout klientům z celého světa superpočítače příští generace, které jsou schopné spravovat obrovské množství dat při minimálních nárocích na elektrickou energii a velikost provozních prostor," říká Alexander Rakov, generální ředitel IBM Bulharsko. "Naše smlouva se SAITC demonstruje nejen závazek spolupracovat s předními bulharskými vládními institucemi, ale také s bulharskou národní vědeckou agendou."

    Blue Gene/P je druhou generací nejvýkonnějšího superpočítače světa. Od roku 2004 vede systém IBM Blue Gene žebříček Top500 globálně nejrychlejších superpočítačů (www.top500.org). Například v aktuálním vydání žebříčku Top500.org jsou čtyři z prvních deseti příček obsazeny právě servery této řady. Díky jedinečnému návrhu dovolují systémy Blue Gene vysoce husté osazení procesorů, pamětí a komunikačních obvodů, přičemž oproti většině dnešních superpočítačů vyžadují jen velmi málo energie a provozního prostoru. Jedna racková skříň systému Blue Gene /P je srovnatelná s velikostí domácí ledničky a zároveň je nejméně sedmkrát energeticky úspornější než jiné systémy podobného návrhu. Modulární a škálovatelný design Blue Gene umožňuje snadno přidávat další a další uzly a tím se snadno přizpůsobit rostoucím požadavkům na výkon.

    Zdroj: http://www-03.ibm.com/press/us/en/pressrelease/25068.wss

  • Čína chce mít vlastní petaflopový superpočítač v roce 2010

    Není to tak dlouho (cca 3 měsíce), co se na scéně objevil vůbec první superpočítač světa, jehož výkon překonal hranici jednoho petaflopu (trilion operací za sekundu). Stalo se jím bladecentrum IBM Roadrunner, které je v současné době využívané americkým ministerstvem obrany pro výzkum jaderných technologií. Více informací zde - http://hpcinfo.cz/blogs/hpc/archive/2008/05/19/177.aspx

    Nyní, krátce po této významné události, představil Zhiwei Xu, technologický ředitel Institutu výpočetních technologií v rámci Čínské akademie věd plán, podle něhož chce země za dva roky implementovat svůj vlastní petaflopový systém. A slovo "svůj" není v tomto případě použité vůbec neoprávněné. Čína totiž investuje stovky milionů dolarů do vývoje vlastních výpočetních čipů, které budou v tomto systému použity. Tyto čipy nesou název Godson. Údajně stát investuje do procesorového sektoru již od roku 2001, přičemž v roce 2006 masivně zvýšil investice do projektu Godson, jehož výsledkem by měla být technologie, která dalece předčí ty od světových lídrů, jako je Intel, AMD či IBM. Prozatím však můžeme jen s napětím očekávat, zda se tato zpráva nakonec potvrdí.

    "Přestože má Čína na své mezinárodní rivaly v oblasti vývoje čipů co dohánět, snaží se tento náskok neustále snižovat," řekl Zhiwei Xu na konferenci Hot Chips v Palo Alto, Kalifornie. Doposud země vyrobila již čtyři typy procesoru Godson, z nichž poslední verze nese název Godson 2f. Na jejich výrobě a prodeji spolupracuje s globální firmou STMicroelectronics. Čipy Godson jsou v současnosti využívány již 40 komerčními společnostmi, a to především v set-top boxech, noteboocích a dalších produktech. Obchodní jméno těchto čipů zní Loongson. Do konce letošního září by Čína měla dokončit design nové verze čipu, která prozatím nese jen kódové označení Godson 2g. Tato novinka se bude vyznačovat několika novými funkcemi. V plánu na příští rok je pak procesor, který již bude obsahovat i schopnost práce s grafikou - půjde tedy o podobné řešení, které v současnosti připravuje Intel (Larrabee) i AMD (Fusion).

    Další novinka, na které Čína tvrdě pracuje, je čip Godson 3, který je určen primárně do serverů a jako první produkt této řady obsahuje vícejádrový design. Jeho první verze, která by se měla na trhu objevit v roce 2009, ponese rovnou čtyři řídící jádra a další čtyři vysoce specializovaná jádra určená pro vědecké výpočty. Řídící jádra poběží na frekvenci 1 GHz a budou podobná těm u verze Godson 2. Čína doufá, že právě Godson 3 budou tím, co umožní v roce 2010 vybudovat vysoce výkonný superpočítač, který překoná hranici jednoho petaflopu. Tento systém by se měl obstojně vyrovnat současné jedničce v žebříčku Top500 nejvýkonnějších počítačů světa. Tou není nikdo jiný než zmiňovaný systém IBM používající velmi precizně navržené čipy Cell. Žebříček je ke zhlédnutí na adrese http://www.top500.org/.

    Na otázku, zda je stanovený cíl reálný, Xu odpověděl: "Možné to je, ale bude to obtížné." Kromě vývoje systému země také hledá trhy, na kterých by mohla své nové čipy prodávat. Například Spojené státy uvažují o nákupu čínských výpočetních produktů do vládního sektoru, kde by měly sloužit k posílení bezpečnosti.

    Použití čipů Godson v klasických osobních počítačích (PC) je pozdržováno z toho důvodu, že používají jádro MIPS, jenž není kompatibilní s x86 architekturou, kterou do svých výrobků implementují Intel a AMD. K provozu typické x86 aplikace, jako je například operační systém Windows, by bylo nezbytné používat překladový software, který je schopen kompatibilitu x86 jednoduše emulovat. Takový software by si ale bezpochyby sám ukousnul nemalou část výkonu čipu, který by tím pádem chyběl při provozu uživatelských aplikací a celý systém by byl zbytečně pomalý. Čip tak bude pravděpodobně používán především k provozu nativních MIPS aplikací a také pro méně náročné x86 aplikace. Verze Godson 3 však přinese nové instrukce, které mají překlad x86-to-MIPS až desetinásobně urychlit, což by mohlo celou situaci změnit. "Naším cílem je dosáhnout hranice 80% nativního MIPS výkonu," uvedl Xu. "Nyní se právě nacházíme na 40%, což znamená, že máme před sebou ještě hodně dlouhou cestu."

    Tom Halfhill, zkušený analytik z firmy In-Stat, sdělil, že petaflopový počítač v roce 2010 může být pro Čínu reálnou výzvou. "Proč by si stanovili cíle, v jejichž dosažení nevěří? To by jim bylo jen na překážku," vysvětluje. Dále dodává: "Čína také vyvíjí aplikace pro osobní počítače na platformě Godson, a to včetně produktivního softwaru na bázi OpenOffice. Se svou obrovskou populací se Čína stává významným hráčem na trhu mikroprocesorů, a to i přesto, že je zatím prodává pouze na domácím trhu. Země chce především vyvinout své vlastní technologie, aby nebyla ve výrobě výpočetní techniky závislá na placení licencí a dalších poplatků spojených s nákupem těchto technologií od jiných států."

    Faktem je, že konkurence na trhu mikroprocesorů je dnes velmi slabá. V zásadě existují jen dva schopní hráči, z nichž jeden začíná v poslední době pomalu technologicky zaostávat. Nebylo by tedy vůbec na škodu, pokud by se do party přidal někdo třetí, což by mohlo vést k akceleraci vývoje technologií a především ke snižování cen. Zvláště Čína se z hlediska výrobních nákladů a posléze i cen produktů řadí mezi nejobávanější soupeře, a to nejen na trhu mikroprocesorů. V každém případě si na první čínské x86-kompatibilní procesory budeme muset minimálně jeden rok počkat.

    Zdroj: http://www.computerworld.com/action/article.do?command=viewArticleBasic&articleId=9113741

  • Intel Parallel Studio aneb jak bez námahy programovat pro více jader

    Během letošního ročníku vývojářské konference IDF (Intel Developer Forum) představila společnost Intel nový softwarový balík, který podle všeho reprezentuje významný krok vpřed v oblasti paralelního "multi-core" programování. Intel Parallel Studio má umožnit milionům vývojářů pracujícím v prostředí Microsoft Visual Studio jednoduše optimalizovat aplikace pro více výpočetních jader. K tomu má dopomoci čtveřice obsažených nástrojů, které dohromady nabízejí řešení pro hledání a využívání možností paralelizace, odstraňovaní chyb a ladění výkonu:

    • Intel Parallel Advisor: Už podle názvu je zřejmé, že tento nástroj slouží k prozkoumávání existujícího zdrojového kódu a vyhledávání možností jeho paralelizace. Poskytovaná zpětná vazba pomáhá zlepšovat návrh aplikace. Zároveň jsou podrobně vysvětleny praktické důsledky jednotlivých kroků, včetně identifikace možných konfliktů a návrhu jejich řešení.
    • Intel Parallel Composer: Tento nástroj rozšiřuje běžný C/C++ kompilátor o podporu vícevláknových knihoven od Intelu, včetně oceněné knihovny Threading Building Blocks. Začlenění těchto knihoven eliminuje nutnost psát všechen paralelní kód ručně, což pomáhá urychlit vývoj aplikace jako takový. Díky podpoře velkého množství paralelních programovacích modelů si může vývojář zvolit ten, který je pro danou aplikaci nejvhodnější. Kromě nejrůznějších knihoven a modelů zde nalezneme i podporu rozhraní OpenMP 3.0, funkce lambda, auto-vektorizaci, auto-paralelizaci a mnoho dalšího.
    • Intel Parallel Inspector: Tento nástroj vyhledává chyby (bugy) ve zdrojovém kódu bez ohledu na zvolený paralelní programovací model, čímž se stará o vysokou stabilitu aplikací. Na rozdíl od tradičních debuggerů dokáže detekovat i těžko odhalitelné chyby v paralelních aplikacích, k čemuž využívá pokročilé detekční analýzy.
    • Intel Parallel Amplifier: Tento nástroj zjišťuje "úzká hrdla" omezující výkon paralelní aplikace. Mohou to být například data převedená na sériové bity, které nemohou být zpracovávány paralelně. Parallel Amplifier pomáhá optimalizovat výkon, přičemž jeho použití má být snadné i pro začátečníky.

    Velkým lákadlem má být zejména první ze čtveřice nástrojů, který na konferenci IDF okomentovala Renee James, viceprezidentka a generální manažerka divize Software and Solutions Group, Intel: "Mít Parallel Advisor je jako kdyby vám při práci pomáhal guru. Neudělá práci za vás, ale provede analýzu a poskytne moudrou radu. Advisor vám pomůže pochopit, kam do existujícího kódu přidat paralelismus, a zároveň vám ukáže důsledky těchto rozhodnutí."

    Intel Parallel Studio je, jak již bylo řečeno, rozšířením světoznámého vývojářského prostředí Microsoft Visual Studio. Lze jej využívat pouze pod operačním systémem Windows a pouze v kombinaci s jazyky C/C++. Podle Intelu je tento balík nejen přizpůsobený pro stávající vícejádrové procesory, ale i pro budoucí mnohojádrové čipy, a to včetně chystané architektury Larrabee. Zkušební betaverze produktu bude dostupná testerům v listopadu, přičemž finální verze bychom se měli dočkat v květnu roku 2009. Cena produktu zatím nebyla zveřejněna, ale stane se tak již začátkem příštího roku. Do tzv. BETA programu se může zapojit každý, kdo má zájem produkt testovat a zároveň je uživatelem: 1) Microsoft Visual Studio* 2005 nebo 2008 (kromě edicí Express), 2) C/C++ a 3) Microsoft Windows XP nebo Vista. Registrační formulář je k dispozici zde: http://sites.cmdrm.com/1996/index.php

    Registrovaní uživatelé (betatesteři) budou jako první informováni o jednotlivých betaverzích, termínech dostupnosti a dalších produktových informacích týkajících se Intel Parallel Studio. Jako jediní mají také možnost stahovat nedokončené verze produktu a účastnit se diskusí na online fórech. Účast v BETA programu je zcela zdarma a záleží pouze na samotných uživatelích, zda se rozhodnou na základě vlastních zkušeností s produktem poskytnout tvůrcům zpětnou vazbu či nikoliv. BETA program poběží od vydání první betaverze do vydání finální verze, tj. od listopadu do května.

    Z možností, které přináší Parallel Studio, budou zřejmě nejvíce těžit vývojáři, kteří musí při vydávání nových verzí svých aplikací dodržovat přísný časový harmonogram. Právě těm totiž nejvíce přijdou vhod nástroje, které zkracují dobu vývoje na nezbytné minimum. Na své si přijdou také ti, kdo chtějí optimalizovat aplikace pro vícejádrové čipy, ale nevědí, jak na to. Zřejmě největší zájem o tuto sadu nástrojů je však očekáván ze strany vývojářů technických aplikací, databází, výpočetně náročných aplikací a zejména aplikací pro HPC clustery. Ty totiž zpravidla obsahují vůbec největší množství výpočetních jader mezi všemi existujícími počítačovými systémy - často počítané v deseti- až statisících.

    Nástroje Parallel Studio nemusejí být v žádném případě používány současně. Každý může být využíván zcela samostatně a nezávisle na druhých. Všechny tyto nástroje jsou plně kompatibilní s prostředím Visual Studio; proto dokážou spolupracovat například s kompilátorem, knihovnami a debuggerem od Microsoftu. Funkcionalita těchto nástrojů je však podmíněna přítomností Visual Studio na uživatelském PC. Parallel Studio zatím nepodporuje jiné než zmíněné dva programovací jazyky. Vývojáři Java, C#, Fortran či Visual Basic mají tedy smůlu. Radovat se nemusejí ani uživatelé Linuxu či Mac OS X. Pro tyto operační systémy Intel nabízí jiné vývojářské nástroje; ty však pochopitelně nejsou tak specificky zaměřené na multi-core procesory. Jejich 30-denní zkušební verze jsou ke stažení na: http://www.intel.com/software/products/eval/

    V souvislosti s podporou budoucích vícejádrových architektur užívá Intel často pojem "forward scaling". Znamená to, že i když naprogramujete aplikaci použitím dnešních technologií, její výkon by měl s přibývajícím počtem jader nepřetržitě růst. S těmito ambicemi nebylo navrženo jen Parallel Studio, ale například i nedávno představený paralelní programovací jazyk Ct. Nové nástroje budou podporovat i architekturu Larrabee, která se na trhu objeví ještě o nějaký ten měsíc později.

    Všechny vývojářské produkty od Intelu, jako jsou kompilátory a knihovny vytvářející binární data, spustitelné soubory či knihovny, lze provozovat na kterémkoli x86 procesoru. Avšak některé analytické nástroje, jako je například VTune Performance Analyzer, používají funkce specifické pouze pro procesory Intel a s jinými produkty nejsou kompatibilní. To je případ i nového Parallel Studio, jehož některé analytické nástroje na jiné platformě zkrátka nespustíte.

    Paralelizace aplikací nebyla až dosud ničím všedním. Tyto časy jsou však u konce. Většina dnes prodávaných procesorů obsahuje minimálně dvě jádra, a pokud nějaká aplikace dokáže využívat pouze jediné z nich, pak zřejmě nezůstane dlouho konkurenceschopná, protože jiné podobné aplikace, které již vícejádrovou architekturu zvládají, budou podstatně výkonnější. To tlačí softwarové firmy k tomu, aby se co nejrychleji tomuto trendu přizpůsobily. Intel se rozhodl vydat novou řadu vývojářských nástrojů v roce 2009, tedy v době, kdy bude poptávka na trhu již dostatečně vysoká. A proč právě Intel? Nejspíš proto, že sotva může kdokoli jiný vědět lépe, jak dělat aplikace pro moderní čipy, než firma, která jich sama celosvětově vyrobí nejvíce.

    Zdroj: http://www.intel.com/go/parallel/

  • Výrobci serverů myslí na linuxové uživatele

    IBM vydalo první certifikovaný balíček open-source softwaru, který je určen výhradně pro použití na superpočítačích s operačním systémem Linux. Tzv. IBM HPC Open Software Stack je navržen tak, aby umožňoval efektivně propojit clustery/servery a v důsledku toho vytvořit superrychlý systém, který je nejen velmi výkonný, ale i produktivnější a méně náročný na správu. Oficiální oznámení padlo u příležitosti zahájení veletrhu LinuxWorld/NGDC v San Franciscu. Připomeňme, že IBM je globálním lídrem v dodávání superpočítačových systémů a v současné době drží 232 příček populárního žebříčku Top500 nejvýkonnějších počítačů světa. Ten je ke zhlédnutí na adrese www.top500.org.

    Trh superpočítačů, jinak řečeno HPC systémů, zažívá v poslední době velký boom, který je důsledkem toho, že firemní zákazníci všech velikostí využívají tyto systémy ve stále větší míře. Podílí se na tom zejména potřeba využívat stále komplexnější a výkonově náročnější aplikace. Některé dosavadní překážky, které omezovali možnosti výstavby a provozu supervýkonných infrastruktur, pak odstraňuje rostoucí benevolence v použitých technologiích, zejména podpora různých procesorových typů v jediném clusteru - tzv. hybridním clusteru - která umožňuje nejen snáze budovat a upgradovat clustery, ale především jim přináší vyšší efektivitu při využívání výkonu, neboť různé typy procesorů jsou optimalizované pro různé výpočetní úlohy.

    Snazší implementace linuxového clusteru

    Nový softwarový balíček od IBM je něčím, co může instalaci linuxového clusteru výrazně usnadnit. Firemní IT personál často postrádá dostatečné zkušenosti s vytvářením a zprovozněním takto rozsáhlých infrastruktur. IBM HPC Open Software Stack, který je vyvíjen i testován společností IBM, si klade za cíl v tomto nelehkém úkolu pomoci. Jeho výhodou je kompatibilita s jinými, komerčně poskytovanými aplikacemi od IBM, které lze bez problémů využívat souběžně, je-li to potřeba. Funkčnost balíčku sahá od vývoje a provozování aplikací po správu a monitoring systému. Jeho důležitou součástí je modul zvaný Extreme Cluster Administration Toolkit (xCAT). Jedná se o sadu nástrojů, původně vyvinutých pro rozsáhlé x86 clustery, které byly posléze upravené pro použití na serverech řady IBM Power Systems a v současné době jsou využívány například ke správě nejvýkonnějšího superpočítače světa - hybridního systému Roadrunner, který pomáhá v řízení jaderné bezpečnosti v laboratořích Los Alamos, Nové Mexiko.

    IBM HPC Open Software Stack má být zpočátku dostupný pro systémy na platformě IBM Power6. Společnost IBM plánuje podporovat servery řady IBM Power 575 a také ty na platformě x86, včetně IBM System x 3450, IBM BladeCenter a IBM System x iDataPlex. Balíček doplňuje stávající nabídku komerčně poskytovaného HPC softwaru od IBM, od něhož se však odlišuje svou cenou - je totiž zdarma. "HPC Open Source Stack je výsledkem dlouhodobých zkušeností s provozem rozsáhlých počítačových systémů," říká Dave Turek, ředitel divize Deep Computing, IBM. "S tím, jak stále více výpočetních úloh migruje na superpočítače, tím víc je zapotřebí software, který umí efektivně využívat a spravovat velké množství procesorů, které se v těchto systémech nacházejí." Balíček IBM HPC Stack je k dispozici v softwarové databance Národního centra pro superpočítačové aplikace (NCSA), součásti univerzity v Illinois, kde se nacházejí nejrozsáhlejší superpočítače světa. Tato databanka je přístupná z adresy ftp://linuxpatch.ncsa.uiuc.edu.

    "Správa tisíců procesorových jader a různých procesorových typů je výzvou, s níž se každý den potýkáme a která do budoucna jenom poroste," vysvětluje Rob Pennington, zástupce ředitele NCSA. "IBM HPC Stack a jiné aplikace v databance pomáhají uživatelům a správcům superpočítačů držet tempo s rapidním rozvojem clusterových systémů. Vzhledem k rychlosti pokroku v hardwaru jsou potřeba také stále dokonalejší softwarové nástroje." HPC Open Software Stack verze 1.0 je podporován operačním systémem Red Hat Enterprise Linux 5.2 a obsahuje následující součásti: Advance Toolchain for POWER Systems 1.1, instalační skripty IBM HPC Open Source Software Stack, Simple Linux Utility for Resource Management (SLURM) verze 1.3.1 a Extreme Cluster Administration Toolkit (xCAT) verze 2.0.

    Letos je tomu přesně 10 let od okamžiku, kdy IBM začalo oficiálně podporovat platformu Linux. U příležitosti tohoto výročí firma oznamuje hned několik nových produktů, služeb a iniciativ, které tuto podporu dále rozšiřují. Jednou z těchto novinek je pochopitelně i zmíněný HPC Stack. Celá tato iniciativa v podání IBM má jeden společný cíl, a sice umožnit nástup nové linuxové generace/éry, která je charakteristická zejména těmito atributy: podpora ekologického "green" IT, využívání Linuxu k provozu kritických obchodních aplikací, využívání Linuxu středně velkými firemními zákazníky, využívání Linuxu na desktopových klientských stanicích a rozvinutí spolupráce celé linuxové komunity na vývoji technologických pokroků.

    Kromě open-source softwaru pro linuxové superpočítače (viz výše) se mezi další novinky v podání IBM řadí: toolkit pro nezávislé prodejce softwaru (ISV), který pomůže zvýšit podíl Linuxu mezi středně velkými firmami; předkonfigurace systému Novell SUSE Linux Enterprise Server 10 v produktech řady Lotus Foundations, což jsou hardwarové a softwarové balíky navržené pro podniky od pěti zaměstnanců výše; rozšíření podpory pro real-time Linux; uvedení nové verze virtuálního stroje z/VM s funkcí dynamického paměťového upgradu pro uživatele Linuxu; a dále například plánovaná podpora produktů Lotus Notes a Lotus Symphony na distribucích Canonical/Ubuntu, Novell a Red Hat; a mnohé další.

    "IBM je deset let předním podporovatelem Linuxu a open-source softwaru, který pomáhá iniciovat osvojení Linuxu miliony uživatelů prostřednictvím desítek tisíců zařízení a aplikací," uvedla Inna Kuznetsova, ředitelka linuxové divize v IBM. "Linux je zkrátka mainstreamem. Těšíme se na další dekádu, během níž bude Linux stále častěji řídit kritické obchodní aplikace v organizacích všech velikostí, zároveň však dojde k posílení funkce datových center, a to díky virtualizaci, podpoře real-time Linuxu, cloud-computingu a dalším technologickým pokrokům, včetně iniciativy Liberating the Desktop."

    Okamžitě použitelné aplikace

    Pozoruhodně působí zpráva o novém toolkitu pro nezávislé softwarové prodejce, který má umožnit vznik linuxových, plně integrovaných softwarových řešení, jenž mohou být distribuovány na DVD médiích nebo USB klíčích, přičemž jejich instalace je natolik snadná, že postačí jeden až pět myších kliknutí. Výhodou je, že takovéto instalace nevyžadují prakticky žádné odborné IT znalosti, což je velkým lákadlem zejména pro středně velké firemní zákazníky, kteří hledají způsoby, jak automatizovat operace, ale zjišťují, že tradiční implementace softwaru jsou často příliš komplexní a nákladné na jejich zdroje a rozpočet. Tyto kompaktní softwarové balíčky v sobě mají zahrnovat všechny potřebné komponenty/moduly.

    Společnost IBM rovněž oznámila dostupnost předkonfigurované verze SUSE Linux Enterprise Server 10 v produktech řady Lotus Foundations a toolkitu, který otevírá prodejcům aplikací pro IBM servery nové možnosti, jak dostat tyto aplikace i k těm nejmenším firemním zákazníkům. Produkty Lotus Foundations představují řadu samosprávných serverů umožňujících malým společnostem zaměřit se více na svůj byznys než na provoz IT a jsou určené firmám od pěti do pěti set zaměstnanců. Nyní díky dohodě s firmou Novell je používání produktů Lotus Foundations pro malé a střední firmy ještě snazší, což jim umožňuje lépe těžit z výhod, které představuje nákladová efektivita, spolehlivost a stabilita platformy Linux.

    IBM System z

    Společnost IBM oznámila také vydání nové verze virtuálního stroje z/VM s dynamičtější a robustnější virtualizací a několika zlepšeními v konektivitě, což by mělo podpořit obchodní růst zákazníka bez dodatečných nákladů na IT. Uživatelé ocení novou funkci pro dynamický paměťový upgrade, která jim umožní za plného provozu přidávat dodatečnou paměť sdílenou každým virtuálním serverem, tedy bez nutnosti systém vypnout. S nástrojem z/VM verze 5.4 mohou nyní zákazníci v reálném čase upgradovat své virtuální serverové prostředí přidáním hardwarových komponent, jako je operační paměť nebo i procesor, bez jakýchkoli provozních výpadků. To podporuje iniciativu IBM s názvem Big Green Linux.

    Real-Time Linux

    Na vybrané servery řady IBM BladeCenter přidává IBM podporu operačního systému Novell SUSE Linux Enterprise Real Time Linux, který v kombinaci s aplikací WebSphere Real Time, umožňuje firmám těžit z výhod jazyka Java při provozu time-critical aplikací. "Real-time" reprezentuje přístup uplatňovaný u aplikací orientovaných na časové termíny a předvídatelnost, zejména pak u aplikací pro finanční a letecký sektor. IBM úzce spolupracuje s firmami Novell, Red Hat a širší open-source komunitou při vývoji real-time Linuxu a real-time Javy s cílem dodat těmto důležitým aplikacím atributy jako je otevřenost, cenová dostupnost, opakovaná použitelnost a škálovatelnost. To pro změnu podporuje další iniciativu IBM s názvem emerging-technologies-for-Linux.

    IBM Power Systems

    Linux je velkým tahounem trendu zvaného virtualizace. Společnost zaznamenala trojnásobný skok v zákaznickém osvojení virtualizace na serverech řady Power Systems, která roste s tím, jak zákazníci konsolidují dodatečné linuxové partition na stávajících serverech. Tento významný skok v používání virtualizace dalece přesahuje dosavadní hodnoty běžné na x86 serverech. Analýzou bylo zjištěno například to, že v druhém čtvrtletí letošního roku obsahovalo 64 % prodaných Power6 serverů virtuální stroj PowerVM, zatímco o rok dříve činil tento podíl pouze 21 %. Dále bylo shledáno, že pouze 1,7 % nových IBM x86 serverů prodaných v roce 2007 bylo konfigurováno s virtualizací. Z toho je zřejmé, že poptávka po virtualizaci roste zejména u linuxových serverů, kde je v současnosti zhruba třicetinásobně vyšší.

    Lotus Notes and Lotus Symphony

    IBM a přední poskytovatelé linuxových distribucí, jako je Canonical/Ubuntu, Novell a Red Hat, plánují spolupracovat se svými hardwarovými partnery na dodávce desktopových počítačů, které neobsahují žádné produkty Microsoft, zato však budou obsahovat produkty Lotus Notes a Lotus Symphony. Těchto počítačů by se v roce 2009 mělo celosvětově prodat kolem jedné miliardy.

    WebSphere Application Server Community Edition

    IBM představilo novou verzi programu WebSphere Application Server Community Edition (WAS CE), který je založen na populární open-source aplikaci Apache Geronimo. WAS CE verze 2.1 usnadňuje vývoj, implementaci a správu aplikací a obsahuje pokročilé funkce pro monitoring serverů. Nová verze nabízí také možnost vytvářet vlastní aplikační servery obsahující pouze takové komponenty, které jsou k provozu aplikace nezbytné, což zvyšuje agilitu a flexibilitu těchto serverů. Produkt je k dispozici ke stažení na adrese: http://www-306.ibm.com/software/webservers/appserv/community/

    Na linuxáře nezapomíná ani Sun

    Ani konkurence nespí, a tak například firma Sun, která je rovněž předním světovým dodavatelem serverů a souvisejících technologií, oznámila v červnu tohoto roku svůj vlastní balíček softwarových aplikací, které jsou určené pro použití výhradně na linuxových serverech. Sun HPC Software Linux Edition verze 1.0 zahrnuje následující produkty z dílny Sun: Lustre 1.6.5, SLURM 1.2.25, MUNGE 0.5.8, OFED 1.2.5.5, Open MPI 1.2.6, MVAPICH 1.0.1, MVAPICH2 1.0.3, Ganglia 3.0.6, OneSIS 2, FreeIPMI 0.6.2, Conman 0.2.1, Powerman 1.0.32, lshw B.02.12.01, Modules 3.2.6, Env-Switcher 1.0.13, pdsh 2.14, HPCC 1.2.0, NetPIPE 3.7.1, IOR 2.1, rrdtool 1.2.26, genders 1.9, Cfengine 2.2.6, Heartbeat 2.1.3. Balíček je dostupný zcela zdarma a zájemci si jej mohou stáhnout přímo ze stránek Sun: http://www.sun.com/software/products/hpcsoftware/getit.jsp

    Zdroj: http://www-03.ibm.com/press/us/en/pressrelease/24824.wss; http://www.sun.com/software/products/hpcsoftware/

  • Programovat ve Fortranu lze nyní stejně pohodlně i pod Windows

    Absoft a Visual Numerics ohlásili první implementaci knihovny IMSL Fortran Numerical Library, která je uzpůsobena pro operační systém Microsoft Windows Compute Cluster Server (WCCS) 2003. Aktuální build knihovny, zahrnující kompilátor Pro Fortran od Absoftu, přináší mimo jiné také podporu pro vícevláknové rozhraní MPI (Message Passing Interface) a především značný nárůst výkonu a škálovatelnosti do výpočetně náročných HPC aplikací běžících na clusterech platformy WCCS 2003. Do budoucna je plánována podpora Windows HPC Server 2008, nástupce operačního systému WCCS.

    Nová IMSL knihovna (International Mathematics and Statistics Library) pro WCCS obsahuje více než jeden tisíc matematických a statistických algoritmů, které používají poslední verzi kompilátoru Absoft Pro Fortran Compiler a jsou optimalizovány pro běh v 64bitovém prostředí Windows, nezávisle zda na platformě AMD či Intel. Systém Windows Compute Cluster Server 2003 s rozhraním Microsoft MPI je uzpůsobený pro snadné nasazení aplikací na různých x86 HPC clusterových uzlech. Kombinace kompilátoru Absoft Fortran, operačního systému WCCS a knihovny IMSL představuje komplexní a výkonné řešení pro vývoj výpočetně náročných aplikací na clusterových systémech. Tento build IMSL knihovny rozšiřuje výpočetní a numerické schopnosti platformy Windows, zatímco doposud byla IMSL Fortran Library dostupná pouze pro platformy Macintosh a Linux. Cena produktu začíná na částce 400 dolarů (cca 6800 Kč). Cena zahrnující kompilátor+IMSL je nižší než kdyby zákazníci kupovali oba produkty samostatně.

    Komplexní balíček algoritmů v rámci IMSL Fortran Numerical Library integruje mimo jiné také populární knihovny IMSL F90, Math & Stat a Fortran 77. Firma Absoft svůj produkt nabízí v různých verzích, které jsou uzpůsobené pro různá hardwarová řešení, počínaje desktopovým PC po HPC cluster. Řešení, jako je toto, usnadňuje vývojářům práci tím, že eliminuje potřebu psát aplikace od samého základu. Některé matematické či statistické algoritmy, s nimiž zejména vědecké výpočty a numerické aplikace běžně operují, lze jednoduše implementovat přímo z IMSL knihoven, a tím ušetřit určité množství času vyhrazeného pro vývoj dané aplikace.

    "Pro Absoft je čest nadále vést komunitu Fortran uvedením první numerické IMSL knihovny uzpůsobené pro platformu Windows Compute Cluster Server 2003," uvedl Wood Lotz, prezident společnosti Absoft. "IMSL knihovny jsou zlatým standardem numerických knihoven a jsou dostupné celkem na více než 60 platformách. Používání funkcí pro vývoj aplikací, které jsou obsažené v IMSL knihovnách, pomáhají zákazníkům šetřit čas i peníze. Robustní prostředí Microsoft WCCS v kombinaci s pokročilými optimizéry Absoft Fortran je zárukou vysokého výkonu a spolehlivosti aplikací," dodává Lotz.

    "Po více než 15 let společnosti Visual Numerics a Absoft spolupracují na zlepšování výpočetních řešení pro platformu Windows. Přidání podpory WCCS znamená, že vývojáři distribuovaných aplikací pro Windows mají nyní potenciál pro dosažení vyšší úrovně výkonu a škálovatelnosti clusteru, která je výsledkem spojení kompilátoru Absoft Pro Fortran a knihovny IMSL Fortran Library," konstatuje Dr. Ed Stewart, produktový manažer pro IMSL knihovny.

    "Windows Compute Cluster Server 2003 kombinují sílu x64 počítačů s jednoduchostí použití a zabezpečením platformy Windows. Jsme rádi, že Absoft a Visual Numerics oznámily první implementaci numerické IMSL knihovny, která je certifikována pro WCCS 2003," říká Shawn Hansen, marketingový ředitel HPC, Microsoft.

    S účinností od 15. července 2008 budou všechny knihovny IMSL Fortran vydané společností Absoft Corporation pro platformu Windows kompatibilní se systémy této řady, počínaje Windows 2000 přes Windows Vista až po Windows Compute Cluster Server 2003, a to bez dodatečných příplatků. Další informace o IMSL knihovnách a produktech Absoft jsou k dispozici na webu: http://www.absoft.com/Absoft_IMSL.htm

    Fortran se již nějaké půl století řadí mezi oblíbené programovací jazyky pro vývoj především vědecky orientovaných aplikací. Jeho nespornou výhodou oproti jiným rozšířeným jazykům, jako je například C/C++, je poněkud jednodušší struktura kódu, která je přísně orientována na přesnost a dovoluje snáze odhalit programátorské chyby. Zapomenout by se nemělo ani na obsáhlou nabídku numerických funkcí, které tento jazyk podporuje, ať již ve své základní verzi bez doplňkových knihoven nebo s nimi. Nevýhodou jsou naopak omezené možnosti pro vývoj jiných než právě vědecky či matematicky zaměřených aplikací pracujících převážně s čísly. Zkušení programátoři řeší tento problém prostým napsáním části kódu ve Fortranu a zbytku aplikace například v C++. S příchodem nového IMSL balíku pro Windows dochází k opětovnému potvrzení faktu, že i sféra vědy a výzkumu, která je stále silně orientovaná na Linux/Unix, pomalu avšak jistě přichází na chuť nejrozšířenější platformě od Microsoftu, jejíž obliba mimo jiné pramení i z důvěrně známého uživatelského rozhraní.

    Zdroj: http://www.supercomputingonline.com/article.php?sid=15896

  • Intel Larrabee: grafický čip, nebo procesor?

    Intel začátkem minulého týdne poodhalil několik detailů nad chystaným grafickým čipem Larrabee, který by na trh měl být uveden na přelomu let 2009 a 2010. Stojí za to připomenout, co vlastně Larrabee je. Intel je jak známo největším výrobcem procesorů, ovšem už méně lidí ví, že je také největším světovým výrobcem grafických čipů. Ano, žádná Nvidia ani ATi, nýbrž Intel. Může za to především masivní poptávka po levných počítačích (stolních i přenosných), které pro zpracování grafiky nejčastěji používají jednoduché, nevýkonné a především levné integrované akcelátory, jenž jsou jednou z dalších specializací tohoto procesorového giganta. Jeho úspěšnému působení na trhu napomáhá fakt, že konkurence segment levných grafických akcelátorů buď zcela ignoruje (viz Nvidia, ATi) nebo vzhledem k omezenosti své nabídky sehrává jen malou bezvýznamnou roli (viz SiS, Via).

    První diskrétní grafika od Intelu

    Larrabee je však z poněkud jiného soudku. Čím se tato novinka odlišuje od svých předchůdců, je zřejmé na první pohled - nejedná se již o integrovaný grafický čip, nýbrž o diskrétní grafickou architekturu. Tato architektura je přitom vysoce až extrémně výkonná a přitom specializovaná na masivně paralelní výpočty. Nemělo by tak jít o kartu určenou primárně pro hráče počítačových her, i když ani v této oblasti se se svým výkonem jistě neztratí. Nejvíce budou z nové architektury těžit vývojáři aplikací a výzkumní pracovníci, kteří často k provádění složitých matematických, kompilačních nebo renderovacích operací používají kromě procesorového čipu také grafický čip (cGPU/GPGPU). V případě, že bude cena přiměřená, pak by významnou cílovou skupinou však mohly být i hráči počítačových her, i když je to dost nepravděpodobné. Pokud Larrabee skutečně přinese to, co slibuje, pak půjde bezesporu o jednu z nejvýznamnějších technologických inovací nejen v oblasti grafických čipů, ale v celé počítačové éře.

    Larrabee vs. CUDA vs. FireStream

    Lidé z Intelu dělají kolem Larrabee opravdu rušno. Do jaké míry oprávněně a do jaké míry z marketingových důvodů zůstává otázkou. Pokud by se Larrabee na trhu dlouhodobě uchytilo, vznikla by tak vedle technologie CUDA od Nvidie a FireStream od AMD třetí grafická platforma na provádění běžných výpočetních operací, které za normálních okolností zajišťuje procesor. Co ale znamená "dlouhodobě uchytilo"? Pochopitelně to, že vývojáři by psali aplikace pro Larrabee (stejně jako to musejí dělat pro CUDA a FireStream) a zákazníci by si karty s tímto čipem kupovali. Rozjet takovýto koloběh událostí však není nic jednoduchého a je zapotřebí přinejmenším vysoce invenční a originální produkt. Jestliže totiž vývojáři nebudou cítit potřebu psát pro Larrabee, zákazníci nebudou motivováni k jeho koupi. Analogicky platí, že jestliže zákazníci nebudou Larrabee kupovat, proč by pro něj vývojáři psali aplikace? A je vůbec reálné, aby na trhu nezávisle na sobě existovaly tři velmi podobné technologie, pro které by vývojáři museli psát své aplikace zvlášť?

    Strategií Intelu, jak prorazit s Larrabee, je zabít dvě mouchy jednou ranou - tj. na jedné straně uspokojit trh, který již existuje a má celou řadu aplikací - herní trh - a na straně druhé přinést něco i do profesionálního využití. Pokud jde o hry, ví se například to, že Larrabee bude podporovat nejen DirectX a OpenGL, ale údajně i další, blíže nespecifikované API. O tom, jak rychlý je tento čip ve hrách, nepadla zatím žádná slova a podle Intelu je to tajné. Toto gesto se dá vyložit různě, přičemž nejpravděpodobnější verze je nejspíš ta, že Intel nechce založit pověst svého výrobku na jeho nedokončené verzi. Nvidia zareagovala tvrzením, že aby byl Larrabee úspěšný, musel by být "zabijákem konkurenčních produktů". To ale nemusí být tak docela pravda - pokud by Intel nasadil agresivní cenovou politiku (což si může vzhledem k finančnímu úspěchu svých low-endových grafických čipů dovolit), pak by Larrabee řadu příznivců jistě získal i bez titulu "performance-killer".

    Intel slibuje od Larrabee víc než jen herní kartu. Především chce po vzoru existujících GPGPU čipů nabídnout plnou akceleraci výpočtů s desetinnou čárkou (floating-point), které ani tak nejsou doménou her, jako spíše aplikací pracujících s velkým množstvím dat, kde je velký důraz kladen na přesnost ve výpočtech (tzv. visual-computing aplikace). Ty se zpravidla používají ve výzkumné či vývojové sféře.

    Podle některých zdrojů začnou vývojáři pokročilých x86 funkcí Larrabee ve svých aplikacích reálně využívat teprve až ve chvíli, kdy Intel prodá několik desítek milionů kusů této novinky. To je mezník, kterého již například konkurenční Nvidia u své řady GeForce s technologií CUDA dávno dosáhla (dosud prodaný objem činí kolem 70 milionů kusů). Nvidia navíc školí studenty a lektory v oblasti technologie CUDA po celých Spojených státech, vytvořila za tímto účelem své vlastní studijní materiály a na několika amerických univerzitách přednášejí přímo zaměstnanci Nvidie. V okamžiku, kdy Intel prodá první kartu Larrabee, Nvidia již bude mít prodáno přes 100 milionů karet s CUDA. Nutno tedy uznat, že Nvidia má v tomto směru značný časový náskok, který hraje v neprospěch Intelu.

    Přestože má Intel "co dohánět", jeho pozice není zdaleka tak beznadějná, jak by se mohlo zdát. Co jiného lze totiž očekávat od výrobce procesorů než to, že zvolí cestu nejmenšího odporu a zužitkuje své znalosti a zkušenosti z této oblasti. A taky se stalo - grafický čip Larrabee se značně podobá známé x86 architektuře, kterou Intel používá ve svých procesorech. A z toho může hodně vytěžit tím, že programování aplikací pro Larrabee bude velmi podobné, ne-li stejné jako programování pro kteroukoliv jinou x86 platformu. Vývojářům by tak na rozdíl od CUDA či FireStream odpadla velká část práce věnovaná studiu nových programovacích metod. Bude opravdu zajímavé sledovat, kterou cestou se nakonec vydají.

    Programování a vektorizace

    Jisté je to, že vývojáři hledají takovou platformu, která je snadno přístupná a v ideálním případě jim nabízí možnost provozovat a škálovat jejich aplikace v mnohovláknovém prostředí i bez nutnosti rozumět hardwaru. To je také přesně co, to Nvidia slibuje v souvislosti s CUDA a Intel u Larrabee. Nvidia vždy prezentovala CUDA jakožto rozšíření programovacího jazyka C++, zatímco Larrabee od Intelu údajně pracuje s čistým kódem C++, a to stejným způsobem jako běžný x86 procesor. Pokud byste se kterékoli z těchto firem zeptali, jak moc obtížné je programovat pro konkurenční grafický čip, nejspíš by vám obě potvrdily, že bez elementární znalosti hardwaru (zejména paměťové architektury) to zkrátka možné není. To ostatně potvrzují i samotní vývojáři, když říkají, že i nedbale naprogramované aplikace pro CUDA běží pořád rychleji, než na jakémkoliv CPU, ale je potřeba mít dostatečně znalosti GPU hardwaru, především pak paměťové architektury, aby se nějaká akcelerace vůbec projevila. To samé platí i pro Intel Larrabee: tvrzení, že vývojáři potřebují znalosti x86 k programování aplikací pro Larrabee není zcela korektní. Ačkoliv Larrabee může akcelerovat i aplikace, které pro něj přímo nejsou napsané, jeho hlavním účelem je zpřístupnit jejich veškerý potenciál, a toho je možné dosáhnout pouze prostřednictvím vektorových jednotek, které však vyžadují vektorizovaný kód.

    Vektorizace kódu označuje způsob, jakým je aplikace napsána. Pokud programátor vektorizaci nezvládá, nezbývá mu než se spolehnout na kompilátor, který tuto část provede místo něj. Není však žádným tajemstvím, že automatizovaná verze nikdy nebude fungovat tak efektivně, jako kvalitně napsaný ruční kód. Jinými slovy, chcete-li programovat aplikace ať již pro CUDA nebo Larrabee, velkou výhodou vám bude solidní znalost hardwaru. Pokud se ale v hardwaru nevyznáte, i v takovém případě slibují obě platformy velmi slušný výkon.

    Kompatibilita s x86

    Zajímavé je, že někteří vývojáři věří, že Larrabee nebude podporovat některé základní x86 funkce, jako jsou například systémová volání. Tento domněnku navíc podporuje existující dokumentace k Larrabee, kterou Intel publikoval. Na druhou stranu Intel tvrdí, že Larrabee umí dělat vše, co zvládne x86 procesor, přičemž některých z těchto schopností dosahuje prostřednictvím microOS, miniaturního operačního systému běžícího na vrchní úrovni architektury. Nic víc se v tuto chvíli nedozvíme. Jisté ale je, že kvalita podpory x86 instrukcí a způsob jejich zpracování bude komunitou vývojářů velmi bedlivě sledován.

    Intel kritizuje konkurenční technologii CUDA pro nedostatek flexibility a fakt, že její kompilátor je úzce svázaný s grafickým čipem (GPU). Toto tvrzení je v tuto chvíli pravdivé, ale během několika dnů tomu může být naopak. Nvidia tvrdí, že kód pro CUDA může běžet na kterékoli mnohojádrové platformě a jako důkaz se chystá vypustit x86 CUDA kompilátor, jehož první betaverze by měla spatřit světlo světa s počátkem firemní tradeshow Nvision08, tedy koncem srpna. V takovém případě by CUDA byla považována za mnohem flexibilnější platformu než Larrabee, neboť by podporovala jak x86 CPU, tak i GPU čipy (a dost možná i ty od AMD). Jedinou otázkou tak zůstává, jak dobře poběží kód CUDA na x86 procesorech.

    Závěr

    Není pochyb o tom, že Intel zapojí do vývoje a podpory prodeje Larrabee všechnu svou inženýrskou a marketingovou sílu. Proč je pro firmu právě tento produkt natolik důležitý, je pochopitelné. Pokud uspěje, vstoupí Intel jako významný hráč na pole diskrétních grafických čipů a zároveň se stane iniciátorem jedné ze tři hlavních mnohojádrových platforem na trhu. Co pro to musí udělat je zřejmé - přesvědčit vývojáře o výhodách vektorových jednotek v Larrabee, stejně jako je před lety přiměl podporovat MMX a SSE instrukce ve svých x86 procesorech.

    Konkurenční Nvidia pochopitelně nebude sedět se založenýma rukama. "Tým zelených" v současné době drží vedoucí postavení na trhu grafických akcelátorů a jistě nemá v úmyslu jej lehce postoupit komukoli jinému. Přestože bezprostřední nebezpečí Nvidii zatím nehrozí, neměla by brát tuto výzvu na lehkou váhu a raději posílit své vývojářské úsilí v této oblasti. Naproti tomu pozice AMD je značně nejistá a může se nyní jen modlit, aby si i její stream procesory našly své stále příznivce, kteří firmě zajistí nějaký kus tržního koláče. Obecně lze konstatovat, že GPGPU i cGPU výpočty patří celkově mezi nejzajímavější a také nejvíce revoluční technologické inovace posledních cca 20 let. Jakmile budou obě tyto techniky dobře zvládnuté jak na straně výrobců hardwaru, tak i výrobců softwaru, nejspíš se jejich implementace v aplikacích stane natolik běžnou, jako je tomu dnes například u 3D akcelerace ve hrách.

    Chcete-li se dozvědět více o tom, jak Larrabee funguje a jaké jsou jeho technické parametry, prohlédněte si tento dokument: http://softwarecommunity.intel.com/UserFiles/en-us/File/larrabee_manycore.pdf

    Zdroj: http://www.tgdaily.com/html_tmp/content-view-38750-113.html

  • HP, Intel a Yahoo! spojili síly ve prospěch cloud-computingu

    Trojice populárních hráčů na poli informačních technologií - HP, Intel Corporation a Yahoo! Inc. - oficiálně oznámila partnerskou spolupráci na vývoji globálního open-source projektu, tzv. cloud-computingu. Ne, tento projekt opravdu nemá nic společného s výzkumem oblačnosti. Poněkud tajuplný název pouze nastiňuje koncepci fungování rozsáhlých počítačových infrastruktur budoucnosti, kterou lze přirovnat ke známému modelu server-klient. Představte si, že pracujete na miniaturním počítači s nikterak ohromujícím výkonem, avšak aplikace, které na něm provozujete, jsou natolik náročné, že by je stěží utáhnul průměrný dnešní superpočítač. Jak je to možné? Jednoduše tak, že data jsou zpracovávána "kdesi v oblacích", zatímco vy jen koordinujete činnost a posléze přijímáte výsledky práce. Tato tzv. "oblaka" jsou ve skutečnosti supervýkonná počítačová centra rozmístěná v různých lokacích po celém světě. Uživatel se prostřednictvím vysokorychlostního internetu k těmto centrům připojí a nechává veškeré výpočetně náročné úlohy vypracovat vzdáleně. Celý proces se odehrává v reálném čase, takže na první pohled vše vypadá, jako by uživatel normálně pracoval na svém soukromém počítači. Projekt si klade velké ambice realizovat se zejména v oblasti vědy, výzkumu a vzdělávání.

    Cílem iniciativy je podpořit spolupráci mezi průmyslovým, vzdělávacím a vládním sektorem, a to odstraněním finančních a logistických bariér, které omezují možnost provádění výpočetně náročných procesů prostřednictvím internetu. V rámci chystaného zkušebního projektu bude zřízeno globálně distribuované internetové prostředí sloužící pro výzkum softwaru, správy datových center a hardwarových otázek spojených s budováním historicky nejrozsáhlejší infrastruktury na bázi cloud-computingu. Zkušební projekt (testbed) zahrnuje taktéž výzkum aplikací a služeb, které jsou pro tuto infrastrukturu navržené (tzv. cloud aplikace/služby).

    HP, Intel a Yahoo! dále uzavřeli dohodu s vývojářskou společností Infocomm Development Authority of Singapore (IDA) a také s americkou univerzitou v Illinois a německým technologickým institutem Karlsruhe (KIT), které pomohou s rozvojem projektu. Partnerská dohoda s univerzitou v Illinois zahrnuje též spolupráci s národní vědeckou nadací USA (NSF), která zde má jedno ze svých center. Zkušební projekt se v úvodní fázi bude skládat ze šesti "center výjimečnosti" instalovaných v sídle IDA, na univerzitě v Illinois, ve výpočetním středisku technologického institutu KIT a dále v laboratořích spadajících pod HP Labs, Intel Research a Yahoo!. Každé z těchto center bude hostovat infrastrukturu jednoho cloudu. Tato infrastruktura bude postavena převážně na hardwaru HP a procesorech Intel a bude zahrnovat zhruba 1000 až 4000 výpočetních jader schopných práce s obrovským množstvím dat, což je výchozím předpokladem pro nasazení v infrastruktuře cloud-computingu. Všech šest center bude plně operativních a přístupných výzkumným pracovníkům z celého světa, kteří ještě letos úspěšně projdou výběrovou procedurou.

    Zkušební program podpoří technologické postavení společnosti Yahoo! v open-source projektech, mimo jiné díky nasazení produktů od Apache Software Foundation, jejíž je Yahoo! sponzorem, ale i některých vlastních softwarových open-source produktů podporujících distribuované výpočty. Příkladem je Pig, paralelní programovací jazyk vyvinutý divizí Yahoo! Research. "Zkušební projekt iniciovaný společnostmi HP, Intel a Yahoo! podporuje náš závazek vůči globální výzkumné komunitě, která postupně přesouvá svůj výzkum na internet," uvedl Prabhakar Raghavan, ředitel Yahoo! Research. "V rámci tohoto programu mohou výzkumní pracovníci nejen testovat aplikace v internetovém prostředí, ale mají také přístup k základním počítačovým systémům, které jim pomohou porozumět fungování softwaru v hardwarovém prostředí cloudu."

    Pracovníci HP Labs, centrálního výzkumného střediska společnosti HP, využijí zkušební projekt k uskutečnění progresivního výzkumu v oblastech inteligentní infrastruktury a dynamických cloud služeb. Divize HP Labs se již začíná více zaměřovat na pomoc HP a jejím zákazníkům v přechodu na nadcházející technologie postavené na bázi cloud-computingu. Toto úsilí je navenek prezentováno jako korporátní vize s názvem Everything as a Service (Vše jako služba). Podstatou vize Everything as a Service je, že veškerá zařízení a služby budou v budoucnu hladce spolupracovat v rámci cloudu, přičemž služby umožní předvídat potřeby uživatelů (firemních zákazníků a domácích uživatelů) na základě jejich lokality, preferencí, kalendáře, komunitní příslušnosti a dalších údajů.

    "Aby mohl být zúročen plný potenciál cloud computingu, technologický průmysl jej musí vnímat jako platformu pro vývoj nových služeb. To vyžaduje zcela odlišný přístup ke způsobu navržení, nasazení a správy cloud infrastruktur a služeb," vysvětluje Prith Banerjee, senior viceprezident pro výzkum a ředitel HP Labs, HP. "Projekt nám pomůže podchytit rostoucí potřeby v sektoru průmyslu, vzdělávání a vlády a zároveň vnést inovace do této technologické oblasti."

    Hlavním dodavatelem technologií platformy cloud-computingu je firma Intel, která dodá procesory, čipové sady, síťové prvky a SSD disky. Obvyklé utility pro správu datových center, jako jsou například Data Center Management Interface (DCMI), Node Manager (NM) nebo virtualizace, byly přepracovány do podoby, která zlepšuje jejich ovladatelnost, stejně jako energetickou efektivitu. Kvůli nepřetržitému zdokonalování stávajících i budoucích funkcí platformy je vědeckým pracovníkům/uživatelům umožněn plný přístup k systémovému hardwaru, který poskytne možnost jeho bedlivého zkoumání stejně jako odhalení případných nedostatků či nápadů na vylepšení.

    "Se spoluprací s akademickou výzkumnou komunitou jsme spokojeni - otevřená spolupráce s akademickým světem je naší DNA v rámci Intel Research," říká Andrew A. Chien, viceprezident a ředitel, Intel Research. "Provedení rozsáhlého zkušebního programu je důležité, protože otevírá cestu k inovacím a přináší možnost experimentovat a učit se. Podpora Intelu vůči Tashi, open-source systému pro správu clusteru na bázi cloud-computingu, a tento zkušební projekt jsou dohromady základním kamenem naší trvalé, vzájemně prospěšné partnerské spolupráce s výzkumnou komunitou."

    Singapurská společnost Infocomm (IDA) projekt podpoří tím, že poskytne jeho uživatelům výpočetní zdroje potřebné pro vývoj softwarových aplikací pro platformu cloud-computingu. Kromě toho bude IDA školit studenty i profesionály v oblasti technologií a programů s touto platformou spojených.

    "Jakmile bude hotova příprava a dostupnost zdrojů pro výzkum a vývoj platformy cloud-computingu, můžeme ve spolupráci se stejně smýšlejícími partnery zahájit rozvoj celé této oblasti," dodává Khoong Hock Yun, assistant chief executive, Infrastructure Development Group, IDA. "Cloud-computing je mnohými považován za další příkladný pokrok v počítačových technologiích a zároveň se může stát další platformou inovativních ekosystémů. Partnerství, jako je toto, pomůže státu Singapur využít nového paradigmatu pro rychlejší ekonomický a sociální růst."

    Partnerství stavějící na iniciativách v oblasti cloud computing

    Zavedení zkušebního programu v rámci cloud computingu je společným krokem všech tří zúčastněných společností ve společné iniciativě směřující k rozvoji právě této technologie. V listopadu 2007 společnost Yahoo! oznámila práce na vývoji datového centra třídy superpočítačů s názvem M45, který byl určen pro výzkum cloud-computingu; první institucí, která tento superpočítač využívala, byla Carnegie Mellon University. Letos Yahoo! také oznámilo dohodu s výpočetními výzkumnými laboratořemi (CRL), která má rovněž podpořit výzkum cloud computingu a zároveň pomoci vybudovat jeden z deseti nejvýkonnějších superpočítačů světa, který bude k dispozici akademickým institucím v Indii. Začátkem tohoto roku firma Yahoo! hostovala vůbec první ročníky konferencí Hadoop Summit a Data-Intensive Computing Symposium. Tato setkání, na nichž se Yahoo! sponzorsky podílelo společně s konsorciem počítačové komunity (CCC), shromáždila přední odborníky z průmyslu, akademického světa a vlády, aby diskutovali nad budoucími směry technologie Hadoop a vysoce náročných výpočtů.

    V roce 2008 společnost HP oznámila formování organizace pro škálovatelnost výpočtů a infrastruktury (SCI), v rámci níž byla sestavena dedikovaná sada zdrojů poskytujících odborníkům a vývojářům prostor pro vybudování škálovatelných řešení, navržených pro uživatele vysoce výkonných systémů a cloud-computingu. Ihned nato společnost představila nabídku svých škálovatelných produktů, jako je HP ProLiant BL2x220c G5, světově první bladeserver, který v sobě kombinuje dva nezávislé servery, a HP StorageWorks 9100 Extreme Data Storage System (ExDS9100), vysoce škálovatelné úložné řešení, navržené pro jednodušší správu velkého množství dat. HP představilo také POD (Performance-Optimized Datacenter), otevřenou, kompaktní, na zakázku dodávanou alternativní architekturu pro nasazení IT zdrojů.

    Více informací o výzkumu cloud-computingu a dalších technologických aspektů je k dispozici na těchto webových adresách: http://www.hpl.hp.com; www.intel.com/research; http://research.yahoo.com/cloud

    Zdroj: http://www.hp.com/hpinfo/newsroom/press/2008/080729xa.html

  • 2008: Petaflop pokořen, nová éra superpočítačů začala

    Rok 2008 znamená pro svět HPC (high performance computing) významný milník. Je to rok, kdy je v Linpack výkonu prvně překročena hranice 1 petaflop. Okamžik, na který se čeká již téměř jedno a půl desetiletí a zároveň úspěch, kterého se podařilo dosáhnout spojením dvou velkých trendů, které se v posledních letech staly hlavními hybnými silami v rozvoji celého HPC segmentu - mnohojádrové a heterogenní výpočty. Výpočty ale nejsou tím jediným, co nastartovalo éru petaflopových systémů. Je tu také celá řada dalších technických prvků a iniciativ v oblasti komponentní architektury HPC systémů, jejichž přínos byl z hlediska dosažených úspěchů neméně významný. Nyní si shrneme ty nejdůležitější za poslední rok.

    V letošním roce se posouváme opět o krok dál v přechodu na mnohojádrové technologie. Dvoujádrové patice jsou pomalu nahrazovány čtyřjádrovými a zároveň vítáme již druhou generaci procesorů s více jádry. Mooreův zákon zatím platí i v této oblasti - počet jader v procesoru se zdvojnásobuje každé dva roky. Čtyřjádrové čipy AMD Barcelona (Opteron) se po dlouhých průtazích způsobených výrobními problémy konečně staly normálně dostupné, a tak jsou nové generace serverů na platformě AMD založené prakticky výhradně na těchto čipech. Ani Intel však nezůstává pozadu, jeho poslední čip Clovertown (čtyřjádrový Xeon) je výrobci serverů na platformě Intel taktéž silně poptávaný. Na rozdíl od segmentu domácích počítačů je sféra serverů okupovaná třemi hlavními konkurenty. Nová architektura Power6 od IBM je založena na 65nm výrobní technologii a umožňuje současné zapojení až 16 jader s taktem od 3,5 GHz do 4,7 GHz.

    Přechod na 45nm technologii se též stal jedním z hlavních symbolů roku 2008 - v druhém letošním pololetí bude již většina výrobců nabízet své produkty vyrobených touto technologií. V případě Intelu to má být zejména nová továrna Arizoně, jenž poskytne dostatek kapacit na zajištění velkoobjemové výroby 45nm komponent. Protože 45nm hradla jsou již velmi malá, jejich stále ztenčující se izolace přestala spolehlivě plnit svou funkci - docházelo k úniku elektrického proudu skrz izolační materiál. Vzpomeňme, jak vysokou spotřebu kvůli tomu měly poslední čipy Prescott, které high-k tranzistory nepoužívaly. Proto začal Intel stavět izolaci hrdel na bázi hafnia místo dosavadního oxidu křemičitého. Hafnium je charakteristické vyšší dielektrickou konstantou, čímž poskytuje možnost pokračovat v postupném zmenšování výrobního procesu i nadále. Na bázi nové technologie bude postaven také chystaný procesor Dunnington, který vstoupí na trh ještě letos a přinese hned šestici jader v jednom pouzdře. Naproti tomu, firma AMD má s přechodem na 45nm co dohánět, ale i tak se můžeme těšit, co nového přinese připravovaný čtyřjádrový "Shanghai", který bude na trh uveden během druhého pololetí a vyrábět se bude použitím nejmodernější EUV litografie (extreme ultra-violet). Ten bude následován šestijádrovým čipem "Istanbul" v roce 2009. Ani vývojáři v IBM nespí, ti pro změnu chystají osmijádro Power7 s taktem okolo 4 GHz, ale až v roce 2010. Zajímavostí je, že tento čip je vyvíjen za finanční pomoci amerického ministerstva obrany, které spustilo program na podporu vývoje HPC technologií využívaných v armádním sektoru (DARPA HPCS).

    Heterogenní výpočty v různých podobách se pro celou komunitu HPC vývojářů staly doslova nadějí, jak dosáhnout extrémních hodnot hrubého výkonu, v jehož převedení do reality stojí pouze jediná překážka - programovací metodologie, které jsou zatím nedostatečně vyspělé, aby dokázaly tohoto potenciálu reálně využívat. Společnost ClearSpeed uvedla druhou generaci svých procesorových akcelátorů, u nichž výrazně zvýšila datovou propustnost a optimalizovala průměrný ztrátový výkon. Akcelátory ClearSpeed tvoří důležitou součást například japonského superpočítače TSUBAME s výkonem 100 teraflops. NVIDIA, výrobce grafických čipů, pro změnu uvedla novou generaci grafických čipů GeForce (série 10), které dosahují v některých specifických aplikacích až 10x vyššího výkonu než předchozí generace. IBM provedlo důležitý upgrade ve své původní architektuře Cell použité například v herní konzoli Sony Playstation 3. Nový procesor IBM PowerXCell 8i kombinuje heterogenitu s mnohojádrovým prostředím, čímž poskytuje výkon na samé hranici možností stávající technologie. Tím nejdůležitějším pro uživatelskou komunitu HPC jsou ovšem jeho upgradovaná SPE (Synergistic Processing Element) jádra, která nyní obsahují plně 64-bitové FPU jednotky se špičkovým výkonem 12,8 gigaflops. To představuje výkon přes 100 gigaflops připadající na osm těchto jader, která jsou v jediném procesoru integrována se separátním jádrem PowerPC, které funguje jako řídící. Procesor tak obsahuje dohromady 9 jader, což je také pozoruhodná rarita.

    V uplynulém roce zřídila mezinárodní HPC komunita "mnohojádrovou iniciativu", jenž shromažďuje aplikace z celého světa schopné využívat výkonu moderních vícejádrových technologií. Tyto aplikace jsou využívány zejména pro potřeby výzkumu, vývoje nových technologií, obchodu a také v armádě. Ve stejném období byl dosud nejrychlejší superpočítač světa, IBM Blue Gene/L, upgradován na výkon dosahující špičkově přes 500 teraflops (udržitelný Linpack výkon činí 478 teraflops). Nejrychlejší systém v Evropě nově pochází rovněž z rodiny Blue Gene - konkrétně se jím stal IBM Blue Gene/P nasazený ve výzkumném centru Julich v Německu. Tento systém přezdívaný "JUGENE" dosahuje špičkového výkonu přes čtvrt petaflop (udržitelný Linpack výkon je 167 teraflops) a používá 32 terabytu operační paměti a poslední generaci čtyřjádrových čipů PowerPC 450 s taktem 850 MHz.

    Trend upgradování stávajících systémů se ukázal být efektivním způsobem, jak prodloužit životnost většiny výpočetních infrastruktur, a to jen za zlomek nákladů, které by stálo pořízení infrastruktury nové. 124-teraflopový systém Red Storm v Sandia National Laboratory, který byl prototypem řady XT od společnosti Cray, bude upgradován na výkon pohybující se špičkově mezi 250 a 284 teraflops, a to použitím čtyřjádrových čipů AMD Opteron. Superpočítač Earth Simulator, který svého času býval nejrychlejším systémem světa, bude začátkem příštího roku taktéž upgradován (společností NEC), následkem čehož dosáhne výkonu 131 teraflops. V Japonsku byl zahájen nový program s názvem Keisoku, jehož cílem je vybudovat 10-petaflopový počítač, který má být do provozu uveden ve městě Kobe roce 2012. Program povede společnost Riken ve spolupráci s firmami Hitachi, NEC a Fujitsu.

    Americká národní vědecká nadace (NSF) si zvolila společnost IBM jako dodavatele nového superpočítače, který bude v roce 2011 nasazen na univerzitě v Illinois. Systém s názvem "Blue Waters" bude postaven na technologii, která je nově vyvíjena v rámci projektu IBM PERCS sponzorovaném americkým ministerstvem obrany (viz DARPA HPCS). NSF se také chystá instalovat druhý středně velký HPC systém v Tennessee, který bude postaven na architektuře Cray.

    V loňském roce Indie zprovoznila první superpočítač, který se zařadil do Top10 světového žebříčku. Jeho jméno je "Eka" a je nasazený v laboratořích pro počítačový výzkum ve městě Tata Sons. Tento stroj používá servery HP Blade Cluster Platform 3000 BL460c a přináší špičkový výkon 170 teraflops. Čína pokračuje ve svém stabilním tažení na poli HPC s instalací několika teraflopových systémů, včetně 38-teraflopového počítače IBM BladeCenter s čipy Intel Woodcrest. Zajímavou novinkou je také oznámení vývoje nového čínského procesoru Loongson-2E, který bude vyráběn dnes už poněkud zastaralým 90nm procesem.

    Velký rozruch vzbudil systém IBM Roadrunner, jehož uvedení bylo šikovně načasováno těsně před začátkem mezinárodní superpočítačové konference v německých Drážďanech. Jedná se o aktuálně nejrychlejší superpočítač světa a zároveň o první systém překonávající hranici 1 teraflop v testu Linpack. Roadrunner, který je nasazený v národní laboratoři v Los Alamos v Mexiku, byl vyvíjen na objednávku amerického ministerstva pro energetiku a svého jedinečného výkonu dosahuje díky první architektuře svého druhu, která je principielně navržena pro heterogenní výpočty. Tento superpočítač využívá čipy IBM PowerXCell 8i (viz výše) v kombinaci s procesory AMD Opteron a ve špičce dosahuje výkonu až 1,3 petaflops.

    Ačkoliv je dosažení petaflopové bariéry prezentováno jako vstup do nové éry, komunita HPC už nyní prozkoumává možnosti, jak proniknout do sféry exaflopových výkonů. Americké ministerstvo pro energetiku společně s programem DARPA provedli několik studií, jejímž cílem bylo nastínit technologii, aplikace, systémové požadavky a význam implementace a provozu superpočítačů s exaflopovým výkonem. Studie demonstrovaly mimořádný význam takového výkonu pro aplikace, které jsou kriticky důležité v oblasti výzkumu, technologií a ve společenských vědách. Zároveň ale odhalily i některé skutečnosti, které by jakýmkoliv snahám pokořit i tuto bariéru spolehlivě zabránily v úspěchu (alespoň s těmi nejlepšími, dosud známými technologiemi). Pozoruhodně působí odhady výzkumných pracovníků, kteří předpokládají, že superpočítač s výkonem 1 exaflop by spotřeboval 120 megawattů energie  (+/- 50 procent), obsahoval by 100 až 500 milionů výpočetních jader schopných zpracovávat několik miliard softwarových vláken (threadů) současně a přitom by jeho latence (reakční časy) nesměly být delší než pár desítek tisíc cyklů.

    Nejvíce optimistické termíny pro uvedení exaflopových systémů se na první pohled jeví jako přehnané, byť vzhledem k rychlosti technologického rozvoje nemusejí být vůbec nereálné - hovoří se o polovině příštího desetiletí. Dosavadní vývoj populárního žebříčku TOP500 ale spíše naznačuje pokoření této bariéry teprve až ke konci příští dekády. Jako nejpravděpodobnější se zatím jeví rok 2018, což by ale znamenalo nutnost zahájit během následujícího roku a půl rozsáhlý výzkumný program, který jistě nebude nejlevnější. Pokud si chce IBM udržet pozici lídra v HPC technologiích, nejspíš se bude muset této výzvy brzy ujmout.

    Zdroj: http://www.hpcwire.com/specialfeatures/isc/features/Run-Up_to_Petaflops.html

  • Paralelizace + Microsoft = Tahiti

    Přestože vícejádrové systémy existují už nejméně dvě desetiletí, teprve od příchodu prvních procesorů ukrývajících v jediném monolitickém pouzdře více než jedno výpočetní jádro se datuje vznik nového trendu na poli IT. Dnes, po téměř pěti letech od tohoto okamžiku, je už prakticky jisté, kterým směrech se bude vývoj výpočetních architektur v budoucnu ubírat. Tím pochopitelně vzniká tlak na softwarové vývojáře, z nichž většina stále programuje podle starých pravidel, přičemž ignoruje možnosti moderních výpočetních systémů, čímž trpí především koncoví uživatelé. Tato ignorace však nemusí nutně spočívat v laxním přístupu, ale například v nedostatku programátorských znalostí, schopností či v dostupnosti potřebných nástrojů pro vývoj.

    Společnost Microsoft je na softwarovém poli zatím jednou z mála firem, které se pro podporu nadcházejících vícejádrových/mnohojádrových architektur očividně snaží něco dělat. Popravdě řečeno, něco takového není ze strany největšího výrobce operačních systémů žádným překvapením, protože natolik komplexní software jako je operační systém by měl být samozřejmě prvním v řadě, který by měl umět využívat veškerých dostupných možností hardwaru. Společnost však nechystá pouze nové operační systémy optimalizované pro výpočetní infrastruktury příštího desetiletí, ale údajně také celou řadu užitečných softwarových utilit pro vývojáře, počínaje novými runtime po komplexní vývojová prostředí. Aby toho nebylo málo, přidejme ještě paralelní doménové knihovny a odlehčený transakční model pro webové služby. Celý balík těchto nových technologií pro mnohojádrové počítače firma v současné době vyvíjí pod souhrnným označením "Tahiti".

    Snaha společnosti Microsoft má několik nezávislých příčin. Jednou z nich je pochopitelně optimalizace operačního systému jako takového. Co je ale mnohem důležitější je snaha podpořit globální softwarovou komunitu ve vývoji aplikací, které budou stejně tak optimalizované. Zatímco dnes bez obtíží zprovozníme kterýkoliv software na kterémkoliv novodobém hardwaru s jedním, dvěma nebo čtyřmi jádry, za pár let by skutečnost mohla být docela jiná. Jakmile se standardem stanou systémy s 8, 16 nebo 64 jádry (což je otázka několika málo let), jak na nich bude asi fungovat software, který umí používat maximálně čtyři jádra? Ano, velmi pomalu - zbytečně. Tomu lze předejít například použitím takových vývojových nástrojů, které během kompilace kódu provádějí automatickou optimalizaci pro více jader. To je jedna z novinek, kterou Microsoft v rámci platformy Tahiti připravuje a chystá se ji implementovat do vývojového prostředí .NET. Pokud si dobře vzpomínáte, něco podobného nedávno ohlásil také Intel v souvislosti s programovacím jazykem Ct.

    Ohledně platformy Tahiti zatím nepadla žádná oficiální informace, a tak jsou prozatím všechny zmíněné údaje pouhou spekulací od několika nezávislých zdrojů. Ví se však například to, že Microsoft chystá nový operační systém s kódovým názvem "Midori" a nemá se jednat o nástupce Windows Vista ani Windows Seven, nýbrž o pionýra nové třídy operačních systémů, která bude vyvíjena nezávisle bok po boku s Windows. Jinými slovy, Midori nemá mít s Windows společného nic víc než značku, která za oběma těmito systémy stojí. Osobně jsem skeptický, pokud jde o vznik zcela odlišného systému pod stejnou střechou, zvláště když celý vývoj stojí teprve na samém počátku a podobná prohlášení lze považovat za marketingový tahák, nicméně čím si můžeme být už nyní téměř jisti, je fakt, že nový operační systém by měl jakožto základní stavební kámen platformy Tahiti přinést plnou podporu pro vícejádrové i mnohojádrové počítače.

    Midori má být od prvního až do posledního řádku tvořený nově napsaným kódem. To je také důvod, proč nebude obtížné systém od základu navrhnout jako multi-core. Stejnou vlastnost sotva můžeme očekávat u chystaných Windows Seven, které převezmou velkou část kódu ze starších verzí Windows. Tuto schopnost by mohly plně implementovat až teprve Windows 8, jejichž uvedení se předpokládá v letech 2011/2012. Co bude jistě mnoho uživatelů zajímat je fakt, že vzhledem k odlišné koncepci obou operačních systémů pravděpodobně nebude zaručena vzájemná kompatibilita, takže běžné aplikace pro Windows nemusejí běžet pod Midori a naopak.

    Koncem července, kdy se koná Research Faculty Summit, odborná konference pořádaná každoročně společností Microsoft, by měly být podrobněji představeny některé nové elementy, které tvoří jádrové komponenty platformy Tahiti. Podle agendy nadcházející konference chystá MS velmi mnoho seminářů spojených s výzkumem paralelních výpočtů na mnohojádrových architekturách. Z popisu konference, který je k vidění na korporátním webu, se můžeme (kromě jiného) dočíst následující: "Cílem týmu Parallel Computing Platform (PCP) je umožnit přechod na moderní více- a mnohojádrový hardware prostřednictvím runtime, který poskytne klíčovou podporu pro řízení zdrojů a paralelních výpočtů, a programovacích modelů, knihoven a nástrojů, které umožní vývojářům snáze tvořit korektní, efektivní, udržitelné a škálovatelné paralelní aplikace. Tato diskuse odhalí aktuální pokrok a budoucí úsilí spojené s dosažením tohoto cíle."

    Faktem je, že firma Microsoft má okolo paralelních výpočtů momentálně rozběhnutých tolik projektů, že je lze sotva spočítat na prstech jednoho člověka. Jedním z nich je projekt zvaný Parallel FX, jehož cílem je rozšířit vývojové prostředí .NET o podporu paralelních výpočtů. Dalším podobným projektem je Dryad, což je označení programovacího modelu pro zpracování a generování velkých množin dat, který slouží pro návrhy paralelně zpracovávaných úloh (tento projekt je přímou odpovědí na technologii MapReduce od společnosti Google). Mezi další projekty z této skupiny spadají (mimo jiných) také následující:

    • Paralelní, škálovatelné numerické knihovny
    • Rozšíření vývojového kitu Microsoft Robotics Studio o paralelní prostředí
    • Nástroje pro ladění výkonu paralelních aplikací
    • Výzkum transakčních pamětí (probíhá v Barcelona Supercomputing Center)
    • Paralelní programovací jazyky (probíhá převážně v Microsoft Research Cambridge)
    • RedHawk, MinSafe a Sapphire - tři různé projekty orientované na implementaci paralelních výpočtů. RedHawk a MinSafe jsou dva různé runtime (vyvíjené nezávisle na sobě), přičemž oba umožňují regulovat činnost paralelní aplikace. Sapphire je název nového transakčního modelu, který umožňuje implementaci paralelních výpočtů v oblasti webových služeb.

    Nad rámec těchto aktivit odehrávajících se ve výzkumných centrech společnosti prakticky po celém světě už Microsoft údajně spolupracuje s několika hardwarovými a softwarovými dodavateli na testování nových řešení v praxi a vytváření prvních funkčních verzí.

    Co k tomu dodat? Nebude jistě náhoda, že Microsoft, Intel a potažmo i Google a další hardwaroví i softwaroví vývojáři měli stejný nápad ve stejný čas. Trend paralelizace už zkrátka nějakou dobu roste a dalo by se říci, že v tuto chvíli dozrál do fáze, kdy jej některé firmy začínají využívat jako svou konkurenční výhodu na trhu. V nejbližších letech proto můžeme očekávat vskutku masivní nárůst paralelních aplikací, z čehož pochopitelně budou těžit především samotní uživatelé.

    Zdroj: http://blogs.zdnet.com/microsoft/?p=1485

  • Nová generace nejvýkonnějších grafických čipů pro superpočítače

    Od doby, kdy se na trhu objevila de facto první řada grafických čipů specializovaných výhradně na HPC výpočty, uplynulo něco přes rok. Řeč je o grafické řadě Tesla od společnosti NVIDIA. Odpověď od hlavního rivala AMD, která již tou dobou ovládala grafického giganta ATi, na sebe nenechala dlouho čekat, a tak se pár měsíců poté i ona pochlubila vlastním grafickým řešením pro extrémně náročné výpočty - v tomto případě pod názvem FireStream. A dnes je tomu pár dní, resp. týdnů, kdy média začaly zaplavovat první oficiální zprávy o nové generaci obou původních modelových řad, takže si pojďme v kostce shrnout, co je nového.

    NVIDIA Tesla 10

    Novinka z dílny NVIDIA, která byla představena u příležitosti veletrhu International Supercomputing Conference 08 v německých Drážďanech, je založena na nové verzi grafického čipu T10P. Mezi nejdůležitější inovace patří zejména podpora dvojité přesnosti v operacích s desetinnou čárkou dle standardu IEEE 754 double-precision floating point, větší množství dedikované paměti (4 GB na kartu) a celkově vyšší výkon. Zároveň se jedná o druhou generaci grafického čipu podporujícího populární vývojovou platformu CUDA.

    V souvislosti s technologií CUDA stojí za pozornost informace, že kompilátor jazyka C pro tuto platformu si do konce června stáhlo již přes 60 tisíc uživatelů z celého světa - není to sice nijak závratně vysoké číslo, ale určitě svědčí o tom, že provádění matematických výpočtů na grafické kartě se ujalo. K mání je i další zajímavý údaj o tom, že se dosud prodalo 70 milionů karet řady Tesla, GeForce a Quadro, které technologii CUDA podporují. Jinými slovy, asi tak jeden z tisíce majitelů karty s technologií CUDA tuto technologii skutečně využívá.

    Grafický čip T10P je založený na 55nm tranzistorech (oproti původním 90nm tranzistorům) a na rozdíl od starší generace Tesla, která byla postavena na architektuře GeForce 8, disponuje tento více než dvojnásobnou kapacitou paměti. Kromě již zmíněné vyšší přesnosti s desetinnými operacemi stojí za povšimnutí také hrubý výkon, který u jednoho čipu vzrostl z původních 500 gigaflops na 1 teraflop, tedy přesně dvojnásobně. Je ale důležité zmínit, že tento výkon je dosahován pouze v režimu "single precision", tedy při práci s 32bitovými výpočty. U 64bitových výpočtů je výkon o dost skromnější - jen něco kolem 100 gigaflops.

    Co stojí za vyšším výkonem je zřejmé při pohledu na množství stream procesorů, kterých je nyní oproti původním 128-mi rovnou 240. Jak už tomu bývá zvykem, nová grafická řada v jedné oblasti nikdy nevzniká odděleně od jiných oblastí, takže když se poohlédneme například na segment herních grafických karet, uvidíme, že technické inovace mezi starší a novou verzí karet Tesla jsou prakticky totožné, jako mezi starší a novou generací karet GeForce, které jsou určené pro hráče - v tomto případě se jedná o karty GeForce 8/9 a GeForce 280 GTX. A podle téhož principu bude na trh uvedena rovněž nová generace grafických karet Quadro, které jsou specializované hlavně pro CAD aplikace využívané v průmyslové sféře. Pokud by tedy někoho zajímaly podrobné technické specifikace nové Tesly (pokud jde např. o takty a podporované technologie), není nic jednoduššího, než si je zjistit u jakékoliv jiné karty postavené na témže jádře (viz GeForce 280 GTX).

    Každé z 240 jader čipu T10P je implementováno jako "thread processor" s jednotkou integer, jednotkou floating point a registračním souborem. Každá osmice jader je seskupena a sdílí jednotku double-precision floating point, nějakou konkrétní přidělenou funkci a dále 16 kB vyrovnávací paměti. S výjimkou DB jednotky je design architektury stejný jako u GeForce 8. Samotná DB jednotka jistě nepřijde vniveč, protože například některé specifické finanční a vědecké aplikace již dnes běžně pracují 64bitovými čísly pro vyšší přesnost ve výpočtech. HPC uživatelé tak mohou běžně využívat 32-bitové výpočty, které slibují vysoký výkon, a 64-bitové pouze v případě potřeby. Vzhledem k DB výkonu, který se pohybuje okolo jedné stovky gigaflops, je toto GPU vhodné spárovat s procesorem IBM PowerXCell 8i, který ve stejných operacích dosahuje 109 gigaflops nebo ClearSpeed CSX700 procesorem s 96 gigaflops. Pořád je to ale dvakrát nižší výkon, než jakým disponuje nový AMD FireStream 9250 (cca 200 gigaflops).

    Kromě vyššího výkonu a většího množství paměti těží čip T10P také z rozšířené paměťové sběrnice (512-bitová), rychlejší I/O komunikace (102 GB/s) a upgradované sběrnice (PCIe x16 druhé generace). Čip T10P je k mání ve dvou nových produktech Tesla: model S1070 reprezentuje box o velikosti 1U, který lze externě připojit k HPC serveru; naproti tomu model C1060 je akcelerační karta, kterou lze připojit interně přímo do sběrnice.

    Ve variantě S1070 nalezneme rovnou čtyři kousky grafického čipu T10P s taktem 1,5 GHz, které dosahují souhrnného výkonu až 4 teraflops. Neméně extrémní je grafická paměť o celkové velikosti 16 GB, která umožňuje uchovávat skutečně velké množství dat, která tím pádem nemusejí být tak často přenášena mezi serverem a grafickým subsystémem, díky čemuž dochází k menšímu zatížení hardwaru a rychlejšímu běhu aplikací. Pokud je server vybaven dvěma volnými PCIe sloty, lze připojit až dva subsystémy s výkonem 8 teraflops a pamětí 32 GB. Jediný subsystém S1070 spotřebuje okolo 700 wattů energie, což je poněkud více než 550 W u předchozí generace, nicméně vzhledem k výkonnostnímu skoku je to stále relativně málo. Přesto bude pravděpodobně nutné dokoupit nějaký lepší zdroj - většina dnešních serverů na platformě Xeon či Opteron má zdroje s výkonem 400-500 W.

    Varianta C1060 je určena pro pracovní stanice a zahrnuje pouze jeden grafický čip, který je navíc o něco níže taktován (1,33 GHz) než varianta pro servery. Její výkon dosahuje hodnoty 887 gigaflops (single-precision). Nižší taktovací frekvence má svůj důvod v nárocích na spotřebu, kterou bylo třeba udržet pod hranicí 160 W, což je na běžnou pracovní stanici ještě akceptovatelná hodnota.

    Geoff Ballew, produktový manažer divize Tesla Server, uvedl, že největší poptávka po grafických kartách Tesla je ze strany majitelů HPC clusterů z oblasti těžby ropy a zemního plynu, financí, lékařství, digitálního zpracování a výzkumu. Mezi uživatele řešení Tesla patří také celá řada vzdělávacích institucí (zvláště amerických univerzit). Společnost NVIDIA doufá, že s novou řadou vysoce výkonných karet se jí podaří lépe se prosadit na rostoucím HPC trhu.

    Nová generace grafických karet Tesla bude v prodeji od srpna letošního roku. Doporučené ceny jsou poměrně agresivní: S1070 stojí v přepočtu 118 000 Kč a za C1060 zaplatíte zhruba 25 000 Kč. I přesto jsou ceny znatelně nižší než u první generace produktů Tesla. Více informací je k dispozici na oficiální domovské stránce: http://www.nvidia.com/object/tesla_computing_solutions.html

    AMD FireStream 9250

    Téměř souběžně s představením řady Tesly uvedla společnost AMD, hlavní konkurent NVIDIE na grafickém poli, inovovaný produkt FireStream 9250 - nástupce karty FireStream 9170. Novinka je založena na nejnovějším grafickém čipu RV770, který je k mání také v herním segmentu u řady Radeon 4800. Podle informací AMD se výkon nové karty pohybuje na úrovni 1 teraflopu v režimu single-precision (32-bitové výpočty). Podobnost s výkonem Tesly může být pro někoho až zarážející - jen pro představu, je to zhruba stejný výkon, jakého by dosáhlo 5000 kusů procesoru Pentium Pro, který byl uveden na trh před 12 lety a dodnes se řadí mezi nejvíce revoluční technologie své doby. 9250-ka spotřebuje maximálně 150 wattů (palec nahoru pro AMD) a připojuje se klasicky do jednoho slotu sběrnice PCIe.

    Velkou výhodou je výkon v dvojnásobně přesných výpočtech (64-bitových), kde současná jednička od AMD dvakrát předčí svého hlavního konkurenta T10P, a to výkonem cca 200 gigaflops. Pro uživatele hodlající pracovat převážně v tomto režimu je tudíž produkt od AMD určitě lepší volbou. Tato výhoda je ale na druhou stranu draze vykoupena množstvím obsažené paměti, které je pouze 1 GB DDR3, tedy jedna čtvrtina kapacity, kterou nabízí konkurence (4 GB) - a co je ještě neuvěřitelnější je fakt, že první generace FireStream obsahovala dvakrát více paměti než tato nová (2 GB). Co to vůbec pro laika znamená? V zásadě jen to, že data budou muset častěji cestovat mezi serverem a grafickou kartou. Pokud jsou ale výkonnostní hodnoty opravdu takové, jaké AMD uvádí, pak toto žádnou skutečnou nevýhodu nepředstavuje.

    Abychom nehovořili pouze o technických parametrech, bude jistě zajímavé zmínit, že společnost AMD v souvislosti se svými produkty FireStream uzavřela partnerskou spolupráci se společnostmi Rogue Wave a RapidMind, které se zabývají vývojem programátorských nástrojů s důrazem na paralelní výpočty. Tyto nástroje se doposud vyznačovaly podporou řady FireStream 9170, takže lze předpokládat, že ani řada 9250 nezůstane opomenuta. A k čemu tyto nástroje vlastně slouží? Umožňují totiž, aby kód nějakého programu byl automaticky dělen mezi více procesorů, grafických čipů a jiných výpočetních elementů, aniž by byla nutná jeho manuální úprava - takže se vlastně starají o optimalizaci běhu aplikací. AMD se kromě toho nechala slyšet, že usiluje o to, aby aplikace naprogramované pro určitý typ akcelátorů byly snadno přenositelné a mohly tak běžet i na jiných akcelátorech, a dále aby programování aplikací pro GPGPU čipy bylo jednodušší. Uvidíme, jak se jí toto podaří zvládnout.

    Patricia Harrell z divize Stream Computing ze společnosti AMD říká: "AMD uplatňuje přístup otevřených grafických systémů a je nám potěšením spolupracovat se společností RapidMind při rozšiřování našeho softwarového portfolia a partnerských poskytovatelů služeb. Mnohojádrová vývojová platforma od RapidMind dává našim zákazníkům unikátní výhodu v podobě plného zapřáhnutí výkonu karet FireStream stejně jako mnohojádrových procesorů."

    AMD taktéž vyvíjí vlastní softwarový kit (SDK) pro vývoj aplikací schopných provádět výpočty na GPGPU jednotkách. Jeho zatím poslední verze byla oznámena na sklonku loňského roku a umožňuje vývoj aplikací akcelerovaných grafickou platformou AMD FireStream, ATI FireGL a ATI Radeon. Podle dostupných údajů může takováto akcelerace zrychlit běh aplikace až 30x oproti výpočtům prováděným pouze použitím běžného procesoru. Více informací zde: http://ati.amd.com/technology/streamcomputing/sdkdwnld.html

    Protože si firma AMD uvědomuje, že v tomto světě nevládnou a vládnout nebudou pouze její technologie, veřejně oznámila podporu programovacího jazyka OpenCL (Open Computing Language), který je zatím stále ještě vyvíjen (společností Apple). Jinými slovy to znamená, že bude možné programovat aplikace akcelerované pomocí grafického jádra taktéž pro platformu Mac. Jazyk OpenCL bude technologickou součástí připravovaného operačního systému Snow Leopard, nástupce systému Mac OS X Leopard. Steve Jobs k tomu řekl: "V podstatě vám to umožní využívat grafické procesory na výpočty. To je něco víc, než co může NVIDIA nebo kdokoliv jiný nabídnout, a je to opravdu jednoduché." No, těžko soudit, jak je tento výrok starý, ale NVIDIA i AMD něco takového už přes rok nabízejí - i když jen pro platformu Windows a Linux. V rámci UNIXu je to opravdu novinka.

    Patricia Harrell z AMD říká, že mezi OpenCL a Brook+ (obdoba technologie CUDA od AMD) panuje poměrně značná strukturální podobnost, takže pro vývojáře nebude přechod z jedné vrstvy na druhou nic obtížného. "OpenCL je programovací specifikace, která vypadá jako jazyk C, takže se pohybuje na stejné abstrakční úrovni jako např. Brook+ nebo CUDA. Obě tyto technologie se právě upravují pro kompatibilitu s jazykem OpenCL a ačkoliv není specifikace tohoto jazyka ještě dokončena, již ve své současné podobě vypadá jako něco, co dobře známe," dodává Harrell. Ačkoliv byl jazyk OpenCL původně iniciován společností Apple, v současné době jeho vývoj převzala skupina Khronos Group, která na jeho "výstavbě" spolupracuje s řadou partnerů, mezi nimiž nechybí např. AMD, ARM, Ericsson, IBM, Intel, Nokia, NVIDIA a Samsung.

    Neil Trevett, prezident společnosti Khronos Group, uvedl, že tato iniciativa je zaměřena na desktopová i miniaturní zařízení. "Den, kdy budete moci držet superpočítač ve své dlani, možná není zas tak daleko," řekl.

    Grafická karta AMD FireStream 9250 bude dostupná ve třetím čtvrtletí letošního roku, přičemž její doporučená cena je "pouze" 14 750 Kč, což je o poznání méně než je cena konkurenční Tesly a zároveň je to polovina ceny karty FireStream první generace. Zdá se, že ceny technologií opravdu klesají. Více informací je k dispozici na oficiální domovské stránce: http://ati.amd.com/technology/streamcomputing/product_firestream_9250.html

    Zdroj: http://www.hpcwire.com/specialfeatures/isc/features/NVIDIA_Unveils_Teraflop_GPU_Computing.html; http://www.hpcwire.com/features/AMD_Paces_the_Field_with_New_GPGPU_Offering.html

Další články: Další stránka »
Nenašli jste na této stránce něco, co jste hledali? Nebo byste si přáli něco dodat? Pište nám do fóra přání a stížností.

Kalendář článků

<únor 2012>
poútstčtsone
303112345
6789101112
13141516171819
20212223242526
2728291234
567891011