Hi-Fi svět

Web převážně vážně nejen o zesilovačích a počítačích.

L

Nejnovější

AMD Buldozer

 

Úvod

Vše započalo snahou AMD o využití GPU jako speciálního koprocesoru, čemuž předcházela r. 2002 architektura Hammer, první architektura X86, která nabídla HyperTransport, na jehož druhém konci nemusí být vždy jenom severní most, jak jsme byli zvyklí u FSB, ale může tam být další procesor, či koprocesor.

.

 

 

 

 

  

 

HyperTransport

HyperTransport výrazně změnil pohled na architekturu počítačů, dovolil rychlý přistup na úrovni procesoru, poprvé mohl procesor zaměstnat koprocesor, jehož výkon může být vetší než samotného procesoru.

Velmi pěkným řešením takové spolupráce procesoru a koprocesoru je Superpočítač "RoadRunner, the U.S. Department of Energy’s Los Alamos National Laboratory" 6.912 pouze dvou-jádrových AMD Opteronů, zaměstnává 12.960 speciálních IBM Cell eDP akcelerátorů.

Ale nespěchejme a poohlédněme se po celé historii, jak se vše vlastně krok za krokem vyvíjelo.

.

 

 

AMD oznamuje platformu Torrenza

Vzniká otázka, zda máme přídavné koprocesory zpátky, stejně jak tomu bylo u procesorů 486SX, 386 a starších, které mohly být dovybaveny matematickým koprocesorem.

Do procesorových patic se začínají vyrábět první koprocesory, které komunikují pomocí HyperTransportu, viz 96-jádrový procesor na frekvenci pouhých 250MHz, ClearSpeed CSX600, spotřeba 10W, výkon v plovoucí čárce 25GFlop/s (pětinásobek tehdejších procesorů).

V případě použití dvou koprocesorů se již získával úctihodný výkon, pomalu se začíná mluvit o HyperTransportu 3.0 a HTX konektorech.

.

 

 

 

AMD oznamuje platformu AMD 4x4

Více méně pokračování Torrenzy pro dvou-procesorové sestavy, 4x4 právě proto, že ke slovu přichází dva dvou-jádrové procesory a dvě dvou-jádrové grafické karty.

Konkurence se vysmívá, ale Nvidia se hned přidává a Intel pro AMD Torrenzu "špatně spí?"

.

 

 

 

Na IDF Fall 2006 Intel ohlašuje Intel Geneseo

Intel Geneseo má být odpovědí na AMD Torrenzu, pokus dobrý, ale celá komunikace je závislá na FSB a dále sběrnici PCI-e, Intel Geneseo se baví s koprocesorem na úrovni severního mostu přes PCI-e, tuto možnost má však AMD taky, naopak Intel nemá možnost komunikovat na úrovni vlasního jádra.

.

 

 

 

AMD kupuje společnost ATI

Koupí společnosti ATI, za přehnaných 5,4mld USD získalo AMD přístup ke grafickým technologiím a může dále rozvíjet svůj odklon od klasické koncepce X86 procesorů.

.

 

 

AMD zpochybňuje vývoj mnoho-jádrových procesorů

Vedoucí technolog AMD p. Phil Hester, vyjádřil pochyby k momentálnímu vývoji procesorů, ve kterých jsou využívána zatím dvě nebo čtyři stejná jádra. Naznačil, že se AMD odkloní od tohoto směru a zaměří se více na APU (Accelerated Processing Units).

.

 

 

Myšlenka podobná s použitím integrovaného řadiče pamětí, AMD chce využít technologie ATI na cestě k heterogenním více-jádrovým procesorům. Již se běžně mluví o technologii AMD Fusion což má být zakončení postupného přechodu od AMD Torrenzy.

AMD Fusion znamená využití GPU jako APU přímo na úrovni jádra a cesta k řádu PFlop/s se zdá být otevřená. AMD v této oblasti vytvořila svou otevřenou platformu a Stream Computing.


 

SRC oznamuje podporu pro AMD Torrenzu

Vedení rekonfigurací systémů a zpracování dat u společnosti SRC Computers v Coloradu oficiálně oznámilo, že bylo zahájeno testování AMD Torrenzy s HP ProLiant DL385 servery.

.

 


Prezident CEO SRC Jon Huppenthal říká, že vysoká šířka pásma vzájemného spojení a vyšší programovací jazyk programovacího prostředí pro platformu AMD Torrenza dovoluje vyvinout aplikace pro SRC systémy se zachváním kompatibility programového vybavení bez ohledu na typ mikroprocesoru. AMD Opteron se svým HyperTransportem je otevřen přímému spojení již pět let.

.

 

Vznikla možnost navýšení základního výkonu procesoru až 100x pomocí jednoúčelového koprocesoru atd.

 

GPU-Tech, GPU počítání

Vývoj procesorů došel ke svému rozcestníku jejímž nositeli byly architektury NetBurst a Hammer.

  • 1.       NetBurst stavěl na vysokých frekvencích
  • 2.       Hammer naopak na vyšším IPC a integrovaném řadiči paměti.
  • 3.       V téže době pokročil vývoj GPU k ještě větší datové šířce a k ještě větší paralelizaci výpočtů a výkon se začína velmi rychle vzdalovat X86 procesorům.

.


Na tomto základě vznikla zatím malá firmička GPU-Tech zabývající se počítáním pomocí GPU. Podstatou rychlejšího počítání pomocí GPU je využiti Pixel Shaderů namísto pipe line, jak jsme zvyklí u CPU. Pixel Shaders je program v jazyce symbolických adres, jehož délka může být až 65 tis. instrukcí na rozdíl od pipel line, která bývá dlouhá v řádu jednotek či desítek.

Tímto může GPU pracovat řádově na tisících vláknech současně. Použitelné instrukce jsou goniometrické funkce, logaritmy, odmocniny, mocniny, práce s maticemi, vektory a další. Rovněž je možno tvořit podmínky, větvení, smyčky, apod. Další výhodou je značná šířka sběrnice a tedy již 320 stream procesorů. Takto vypočítané části, či proměnné, pak CPU slouží jako data pro jeho další výpočty. Bylo jen otázkou času, kdy se počítání pomocí GPU stane součástí našeho života.

 

EXOCHI Pro od Intelu

Intel na sebe nenechal dlouho čekat a ohlásil "EXOCHI Pro" svůj systém GPU počítání. AMD se snaží tuto technologii uvést v život pod názvem Torrenza či Fusion, kde jejich odlišnost je více méně jen ve stupni integraci grafického jádra do procesoru. Intel, který má rovněž do této problematiky co říci.

 .

 

Za tímto účelem vytvořil svou architekturu a programovací prostředí EXOCHI Pro a různorodý více-jádrový a více-vláknový systém. Intel zde přiznává, že u příští generace procesorů je integrace speciálních akcelerátorů - jako je dnes i GPU - k dosažení lepšího výkonu a výkonové efektivity již naprosto nevyhnutelná, atd.

 

DRC- RPU110-L200 - koprocesor pro AMD

.

 

Vedení prodeje dynamických rekonfigurací koprocesorových jednotek DRC Computer Corporation, počítačové společnosti založené v roce 2004, která má sídlo v Sunnyvale, Californii, oznámilo použitelnost jejich RPU110-L200 koprocesoru.

.

 


Senior viceprezident (na starost má strategie společnosti a rozvoj obchodu výkonných počítačů), Jan Silverman, říká, že v některých aplikacích může dojít k navýšení výkonu až 100x, atd.

 

NVIDIA nevytvoří CPU, přesto chce mít nejvýkonnější PC

.

 

Takto se nechal slyšet Huangrenxun na schůzce investorů NVIDIA, kde několikrát zopakoval, že nepotřebujeme třetího světového výrobce CPU. Huangrenxun seznámil investory s pohledem na GPU pole a jeho další možnosti.

.

 

  

 

Na procesorovém trhu je dostatek výrobců v čele s Intelem, dále AMD, VIA, Transmenta a IBM. NVIDIA se zde nehodlá angažovat, spíše CPU dává podpůrnou roli pro jejich vysoce účinný počítač „TESLA“.

Vysoká účinnost byla dosažena navzdory použití běžné počítačové platformy, je nutné se spoléhat na CPU, složitost GPU je srovnatelná se složitosti CPU, vývoj je rovněž značně složitý a obtížný, znovu pak zopakoval, že NVIDIA nemíří k CPU.

 

AMD Fusion již 2009?

V technické analýze AMD odhalilo plány na roky 2007-2009, kde na poli počítačů plánuje AMD rozvoj zahrnující procesory, čipovou sadu, grafickou kartu a paměti včetně mnoha dalších aspektů. AMD plánovalo během tří let vypustit celkem šest platforem, z toho tři nejvyšší třídy a tři pro hlavní proud. Jednotlivé třídy měly vypadat následovně.

.

 

 

  

 

AMD normalizuje hardwarovou škálovatelnost softwaru?

Takto složitě lze popsat dokument vydaný společností AMD. V podstatě jde o snahu zavést jistý řád a znormalizovat dělbu práce mezi jednotlivými procesory u více procesorových systémů a desek.

Mluví se o dvou technologiích - LWP (Light-Weight Profiling) a HESP (hardware scalable software parallelism). Obě jsou umístěné v aplikačním softwarovém rutinním prostředí s Javou a .NET Frameworkem. Prostředí zajišťuje plánování a kódování v dynamickém i reálném čase k zajištění optimalizovaného běhu zpracovávaného kódu na více procesorech současně.

.

  

 

Jinými slovy, tento software zajišťuje dělbu práce mezi jednotlivé procesory. Měl by být aplikován při vývoji jak software, tak i hardware. Údajně byl k tomuto projektu přizván i Intel, ale ten se prostřednictvím svého mluvčího nechal slyšet, že oficiální přizvání k projektu od AMD nepřijímá.

 

AMD K10 přináší 128bitový SSE5 instrukční soubor

S příchodem architektury AMD K10 se v procesorech objevily i další 128bitové instrukce. Značná část těchto instrukcí bude zapotřebí až s nástupem architektury „Buldozer“.

.

 

 

 

SSE5 dávají vývojářům další možnosti dosažení maximalizace výkonu ve spotřebitelských aplikacích, výkonovém počítání, multimediálních a bezpečnostních aplikacích.

Zveřejněním specifikací 46 základních a dalších rozšiřujících SSE5 instrukcí, jejichž celkový počet by měl dosáhnout až 170, již dnes dává AMD více času pro adaptaci u výrobců a uživatelů softwaru.

 

Podpora DirectX 10.1

AMD jako jediný HW výrobce s předstihem před samotným Microsoftem dal svým produktům podporu DX10.1, která je jakýmsi nakročením k DX11, tomuto účelu vytvořil i SSE5 a technologie LWP a HESP. Intel se nikterak aktivně neangažuje, Nvidia předpokládá vývoj k OpenCL 1.0 a DX11 spíše přes Nvidia CUDA, obejitím DX10.1.

.

 

 

Závěr

Mnohé se splnilo a mnohé na své splnění ještě čeká, mimo uvedené plány vznikla specifikace OpenCL 1.0, kde se Nvidia všemožně snaží přiklánět specifikace k technologiím Nvidia CUDA, když ne specifikace pak alespoň mínění veřejnosti, že tomu tak je. Občas vznikne  další nejvýkonnější karta pro GPU počítání jako "FireStream™ 9270 nový GPU CPU král!" Intel si jde svou vlastní cestou a snaží se vytvořit své Intel Larrabee.

Vše se ubírá pomalu cestou sjednocení prostřednictvím OpenCL a DirectX 11, kde DirectX 11 se zaměřuje více na zpracování realtime 3D grafiky a OpenCL 1.0 na akceleraci výpočtů pomocí GPU. Mnohé jsem neuvedl, nelze však uvést úplný výčet a na nikoho nezapomenout.

Faktem zůstává, že většina iniciativy pocházela od společnosti AMD, ostatním zainteresovaným však nelze upřít jejich podíl na postupné tvorbě celé koncepce. Společnost AMD se od počátku snažila nabízet alternativy a vést koncepci směrem ke zcela otevřené. Společnosti Nvidia se nedá upřít její podíl s Nvidia CUDA, ale naopak její postoj s "uzurpováním" si zásluh na GPU-CPU počítání je spíše brzdou celého vývoje, dochází spíše k tříštění sil a tvorbě protichůdných směrů.

 

Diskuse

  

Zdroj: TGDaily, BusinessWire, AMD, GPU-Tech, iXBT ,DRC, DRC-RPU110 (pdf), Geek, AMD, Presence-pc, Mydrivers, Mydrivers, AMD (pdf), MyDrivers, AMD (pdf)

 

 

 

11. prosince 2008 vydala společnost AMD nejnovější ovladače "Catalyst 8.12", které by měly  umožnit využívat technologii "ATI Stream" k obecným účelům, zatím je však podpora určena pouze pro grafické karty řady Radeon HD 4XXX.

 

Marketing konkurence

Uplynulý týden plnily stránky IT médii fantastické zvěsti o výkonnosti GeForce GTX 295, vše podbarveno a doplněno senzačním testem, kde nejnovější grafická karta dominuje nad AMD ve hrách, jako je Dead Space!

Autoři i překladatelé však opomněli dodat hardwarové nároky takové hry: Grafická karta: Geforce 6800 nebo lepší / Ati X1600 nebo lepší. Karta musí podporovat Shader Model 3.0 a mít 256 MB paměti…

Na webu Živě si poradil s ožehavou problematikou, jako se stala GeForce GTX 295 velmi dobře, testy raději moc nepřebírali a dali spoustu odkazů, nech si každý vybere. Na jiných webech však Mr. Obermaier a další zarytě mazali a cenzurovali Nvidii neoslavující diskuzi. Nutno dodat, že i takto se dá cíleně moderovat diskuze. 

 

Nvidia a neschválené ovladače

Předseda Futuremarku Oliver Baltuch se vyjádřil o neschválených ovladačích, které často používá Nvidia následovně:
Stanovisko Futuremarku je jednoznačné, vývoj 3D Marku je otevřený pro své členy, každý člen má možnost zaslat své programy k posouzení a schválení zdrojového kódu. Jedná se o transparentní proces, jestli chlapci z AMD nebo Nvidie se pokusí něco nového vytáhnout, pak se lidé z Dell, HP, IBM a další, kteří mají na starosti dohled ve Futuremarku zabývají problematikou jak nejlépe umí.

O neschválených ovladačích a pochybných testech jsem již psal, testy Futuremarku jsou pak nevěrohodné a nesrovnatelné, proto je nutné testovat vždy na autorizovaných ovladačích.Další možnost jak věrohodně testovat jsou testy na konkrétních programech, kde se pravdivě ukáže, jak rychle si ten či onen produkt s problematikou poradí. 

 

Tabulka výsledků

Video

Hardware

Počet snímků/s

Využití CPU

MPEG-2 SD
H.264 QVGA

Radeon HD 4870 X2
(Avivo Video Conveter)

529,13

73%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

136,98

76%

MPEG-2 SD
WMV SD

Radeon HD 4870 X2
(Avivo Video Conveter)

210,82

65%

Core 2 Extreme QX9770
(TMPGEnc XPress 4.0)

28.67

78%

MPEG-2 HD
H.264 QVGA

Radeon HD 4870 X2
(Avivo Video Conveter)

176,96

60%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

52.04

51%

MPEG-2 HD
WMV SD

Radeon HD 4870 X2
(Avivo Video Conveter)

186,28

64%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

28.85

85%

MPEG-2 SD
MPEG-2 720p

Radeon HD 4870 X2
(Avivo Video Conveter)

62.17

54%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

40.58

94%

MPEG-2 SD
MPEG-2 1080p

Radeon HD 4870 X2
(Avivo Video Conveter)

42.09

60%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

19.85

90%

MPEG-2 SD
H.264 720p

Radeon HD 4870 X2
(Avivo Video Conveter)

54.96

59%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

24.73

93%

MPEG-2 SD
H.264 1080p

Radeon HD 4870 X2
(Avivo Video Conveter)

34.77

57%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

13.83

88%

MPEG-2 HD
MPEG-2 720p

Radeon HD 4870 X2
(Avivo Video Conveter)

70.31

41%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

20.81

74%

MPEG-2 HD
MPEG-2 1080p

Radeon HD 4870 X2
(Avivo Video Conveter)

62.09

67%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

15.36

94%

MPEG-2 HD
H.264 720p

Radeon HD 4870 X2
(Avivo Video Conveter)

58.02

59%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

19.34

79%

MPEG-2 HD
H.264 1080p

Radeon HD 4870 X2
(Avivo Video Conveter)

38.33

60%

Core 2 Extreme X9770
(TMPGEnc XPress 4.0)

12.07

88%

 

Testy ATI Stream

Na serveru PC Watch se již objevily výsledky, jak si vedly GPU od AMD ve srovnání s CPU při převodech videí, na druhém obrázku nechybí ani srovnaní s grafickými kartami od Nvidie. 

.

.

 

 

Zdroj: PC Watch

 

 
 

Nejnovější zvěsti pocházející z Asie praví, že společnost AMD pracuje společně se společností Nvidia na řešení PhysX pro grafické karty AMD ATI.

Nedávná minulost

Nedávno jsem napsal, že "AMD se doposud neúčastnilo žádného jednání o možném využití fyziky s použitím PhysX. AMD opakovaně zdůraznilo, že nebyli nikdy od Nvidie osloveni za účelem jakékoliv spolupráce v této oblasti. Richard Huddy je připraven na první nabídku od Nvidie", ale rovněž jste se mohli dočíst "Pokud by AMD implementovalo pouze Nvidia CUDA, tak by se nemusela Nvidia o svou budoucnost moc obávat a stála by společně s AMD proti Intelu, jinak by mohla stát proti seskupení HAVOK, AMD a Intel, předpokládám, že AMD se natolik nevyhraní a ponechá si otevřenou cestu i pro technologie CUDA."

 .

 

 

Současnost

Před několika dny nadšenci z  NGOHQ demonstrovali PhysX na Radeonu HD 3850, IT svět mohl být jen překvapen jednoduchostí s jakou bylo výsledku dosaženo.


Závěr

Pokud se článek zakládá na pravdě, pak se pozice společnosti AMD výrazně mění, díky podařené řadě AMD ATI Radeon 4XXX se z AMD konkurentů, Intelu a Nvidie rázem stávají AMD spojenci, kteří ve svém zájmu podporují společnost AMD na poli zapracování fyziky do grafických karet, Intel s technologií Havok a Nvidia s technologii CUDA či PhysX.

Společnost AMD tím může získat řadu výhod nad svými konkurenty Intelem i Nvidiou, neboť jako jediná by mohla těžit s obou technologií zpracování fyziky.


Zdroj:HKEPC, Tech Power Up, NGOHQ

 

    

 

 

Podle informací získaných z Tchaj-Wanu první-generace procesorů AMD Fusion, procesoru Swift s grafickým jádrem RV710 (Kong) a výkonem 1,5x vyšším než  současná RS780, vše ostatní je shrnuto v následující tabulce.

.

 

Kong GPU

Výrobní proces

45nm SOI

GPU

RV710

Stream  procesorů

40

Texturovací jednotky

4

ROP

4

Takt

600 ~ 800MHz

Podpora DirectX

10.1

Shader Model

4,1

UVD podpora

Ano

Hybrid CrossFire podpora

Ano

Sběrnice

128bit, DDR3

Spotřeba

5 ~ 8W

Produkce

2. Q. 2009

   .

 

Společnost AMD nezahálí a již rozjíždí podporu AMD Fusionu pro oddělenou GPU od CPU, krom nejnovějšího  Catalyst™ Drivers si již můžete prohlédnout AMD Fusion či stáhnout první verzi utility pro AMD Fusion, která by měla výrazně navýšit výkon při hrách, je škodou, že zatím nepodporuje 64bit OS.

Nejde pouze o přípravu na budoucí procesory AMD Fusion, ani o bombastickou reklamní kampaň, ale o nový pohled na budoucí vývoj procesorů a o první velmi významné kroky tímto směrem.

 

Zdroj: AMD, AMD, Computer Base

 

 

 

Společnost Advanced Micro Devices předvedla nejvýkonnější koprocesor pro pracovní stanice.

 

 

 

Nejnavštěvovanější český odborný IT... 

Některé české média skálopevně přesvědčovaly veřejnost, že Fyzika u AMD je pro nedostatek finančních prostředků již dávno mrtvá, cituji: "AMD má vlastní GPGPU program, ale jak již bylo řečeno, zřejmě byl pozastaven z nedostatku financí. Je však možné, že AMD na něm pracuje v tajnosti či počká na nové hry a vývoj obnoví za několik měsíců, až začne zase vydělávat."  Jinak řečeno GP GPU (General-Purpose General-Processing Unit) je již výhradou pouze Nvidia CUDA.

 

Realita je však poněkud odlišná

 

 

Nejlepší odpovědí na takové dobře gramaticky přeložené Fuadovy kachny byla zpráva o implementaci fyziky do nové řady grafických karet, zprávy o možnostech platformy AMD Spider - ATI CrossFireX. Dalším stavebním kamenem do rozsáhlé skládačky AMD je "stream processor AMD FireStream 9250", jehož výkon je přes 1TeraFlop/s, 55násobné zvýšení výkonu v klasického nejvýkonnějšího PC.

 

 

 

Možnosti 

Stream procesor AMD je postaven na AMD RV770 s 1GB GDDR3. Brzy se však dočkáme i AMD FireStream s AMD RV770 a ?GB GDDR5, kde bude výkon o cca 25% vyšší. Při zapojení čtyř AMD RV770 do CrossFireX již není problém realizovat výkon neuvěřitelných 5TeraFlop/s na klasickém PC, čímž jeho výkon 220krát přesáhne stávající nejvýkonnější PC.


Cena

AMD FireStream 9250 bude k dispozici ve třetím čtvrtletí tohoto roku za cenu 999 USD se spotřebou do 150 Wattů.

 

Zdroj: AMD, TG Daily

L

Nejnovější

Copyright © 2019 Hi-FI svět. Všechna práva vyhrazena.
Joomla! je svobodný software vydaný pod licencí GNU General Public License.

B

Hi-Fi svět - ISSN 1803-733X

Stránky vydává Bohumil Federmann, Kunovice 7, 75644 Loučka, Česká republika, federmann@seznam.cz