Lepsza grafika z Celeronem J1900 - co może grafika na złączu PCIe x1?

Po budowie i testach bezgłośnego PCta opartego o płytę Asrock Q1900B-ITX z czterordzeniowym procesorem Celeron J1900 zajmiemy się eksperymentami, a dokładniej wykorzystaniem złącza PCIe x1 dostępnego na płycie.

Popularne stają się płyty główne z energooszczędnymi procesorami AMD i Intela. Zintegrowana grafika może okazać się zbyt mało wydajna dla niektórych. Na wspomnianych płytach znajdują się złącza PCIe, czasami nawet x16, które mogłoby wydawać się pozwalają podłączyć dowolną kartę graficzną. Płyty te kryją jednak pewną niespodziankę - szyna PCIe x16 w wielu to w rzeczywistości np. x4 (dla wielu płyt z procesorem AMD), czy x1 (płyty Intela z Bay Trail-D i podobne). Czy na złączu PCIe x1 2.0 mamy szansę osiągnąć sensowną wydajność zewnętrznej karty graficznej? Ile i w jakich przypadkach stracimy na wydajności?

W tym artykule zaprezentuje wyniki testów trzech podstawowych kart graficznych AMD i Nvidii podłączonych do płyty głównej Asrocka z Celeronem J1900 poprzez złącze PCIe x1 2.0. Sprawdzę też na bardziej typowej płycie głównej jakie są straty między x1 a x16.

Po co zewnętrzna grafika w kompaktowych miniITXach?

Potrzeb może być kilka. Zacząć możemy od obsługi wielu ekranów (np. jako panele reklamowe (digital signage), do wyświetlanie danych z monitoringu sprzętu, czy kamer), albo obsługi ekranu o bardzo wysokiej rozdzielczości. Drugi powód to powiedzmy gry. Raczej nie ma co zakładać że na PCIe x1 stworzymy potężny komputer gejmingowy (na x4 powinno być już znacznie lepiej), ale wszystkie gry nie wymagające grafiki podad te tanie za 200-300 PLN da się obsłużyć takim cichym PCtem ze wspomnianą tanią grafiką (o ile wbudowana nie daje im rady). Kolejne powody to karta grafiki oferujące wsparcie dla OpenCL, czy nVidia z CUDA. Tuż obok nich są karty graficzne dla zastosowań inżynierskich (np. Nvidia Quadro). Nie można wykluczyć też chęć wzbogadzenia domowego serwera o moc obliczeniową karty graficznej, czy minimalizacja zużycia energii elektrycznej przez minera Bitcoinów.

Tania i niezbyt prądożerna karta grafiki może poszerzyć możliwości i osiągi komputera opartego o tani i energooszczędny procesor ze zintegrowaną grafiką. Trzeba jednak podliczyć koszty, bo być może typowa płyta główna z gniazdem 1155/50 na procesory Intela (w tym tanie z serii Pentium) albo z gniazdem FM2, AM3 i innymi na procesory AMD z obsługa PCIe x16 będzie prostszym i pewniejszym rozwiązaniem (jakieś 150 PLN na płytę, 150-180 na dość dobre dwurdzeniowe Pentium, niecałe 200 na tani, ale dość dobry zasilacz, który wszystkiego nie spali, 100-200 na obudowę mini-tower).

Problemy i wymagania

Jeżeli płyta główna ma złącze x16 albo otwarte krótsze złącze (bez plastikowej blokady na końcu złącza) to kartę graficzną podłączymy bezpośrednio bez żadnych adapterów (riserów). Jeżeli złącze PCIe jest mniejsze od x16 i zamknięte na końcu to kartę graficzną podłączymy tylko przez riser. Utrudnić to też może zamknięcie całości w jednej obudowie. Trzeba też uwzględnić zasilanie, bo proste przetwornice od razu trzeba wykluczyć. Istnieją jednak rozwiązania, które mogą ułatwić integrację małego PCta z zewnętrzną kartą grafiki.

Intel oferuje obecnie szereg procesorów zintegrowanych z płytami głównymi - serię Bay Trail-D, czy Celerony jak 1007U oferujące PCIe x1. AMD ma nowe Semprony i Athlony, czy stare E-350, które oferują PCIe x4. Zintegrowana grafika pozwala na oglądanie filmów (zazwyczaj także tych w większych rozdzielczościach), czy granie w niezbyt wymagające gry. Procesor, szczególnie nowszy, pozwala na naprawdę sporo. Zamknięte w małej cichej, albo bezgłośnej obudowie świetnie sprawdzają się jako HTPC, czy komputer domowy, który nie irytuje szumem wszystkich dookoła.

Zewnętrzna karta graficzna wymaga większej obudowy oraz odpowiednio silnego zasilacza. W przypadku małych obudów i prostych przetwornic poniżej 100W taka karta nie ma racji bytu. Musimy użyć większej obudowy z miejscem na kartę PCIe i odpowiednio dobrym zasilaczem ATX, który przy okazji musi być cichy. Z małego HTPC robi się już co najmniej obudowa kostka (jak np. SilverStone SG06, Cooler Master Elite 120/130 - niższe od typowych obudów Tower, ale też znacznie szersze). Druga opcja to obudowa, w której kartę PCIe łączy się z płytą główną za pomocą risera - kabla-przedłużki. Obudowy tego typu także mogą być w postaci małej kostki (np. Morex 6610), albo niskie i szerokie (udające odtwarzacze DVD/VHS; np. Casetronic C350, C138 i inne, MHero-L-R).

Mając obudowę musimy mieć zasilanie. Jeżeli komputer pobiera 40-50W, a grafika drugie tyle to zasilacz powinien móc dostarczać co najmniej dwa razy tyle, czyli jakieś 180-200W. Bezwentylatorowe przetwornice tyle nie dają, a zasilacze ATX zajmują trochę miejsca w obudowie (więc nie będzie mała). Mimo wszystko nadal możemy uzyskać bardzo cichy komputer. Lepsze zasilacze ATX mają ciche wentylatory z samoregulującą się prędkością obrotów. Budżetowe karty graficzne mogą być wyposażone w sam radiator albo radiator wspierany małym wentylatorem (dobry model będzie cichy).

Z samą kartą nie ma co szaleć. PCIe x1 2.0 oferuje przepustowość 4 Gbit/s, natomiast x16 aż 8 GB/s. Kartom graficznym (a przynajmniej większości z nich) x16 wystarcza z dobrym zapasem. x1 będzie ograniczać możliwy transfer do i z karty, przez co w niektórych zastosowaniach, niektórych grach obserwować będziemy niższą sprawność.

Na ratunek - kopalnie Bitcoinów

Popularyzacja cyfrowych walut i metod ich kopania za pomocą farm wielu kart graficznych zapewniła nam bardzo wiele poręcznych riserów z wydzielonym zasilaniem. Za pomocą kabla USB3 łączy się adapter PCIe x1 z szyną x16 risera. Tą drogą przesyłane sa tylko dane. Zasilanie zapewniane jest poprzez złącze MOLEX (lub zasilające SATA).

Riser USB3 PCIe x1 - x16

Riser USB3 PCIe x1 - x16

Karta graficzna podłączona do risera

Karta graficzna podłączona do risera

Przy zastosowaniu takiego risera karta graficzna znajduje się poza komputerem. W przypadku kopalni bitconów umożliwia to wykorzystanie wielu kart graficznych, które poza obudową komputera będą łatwiejsze do chłodzenia. W przypadku małych PCtów umożliwia to podłączenie karty graficznej do płyty głównej schowanej w małej obudowie. Jedyny problem to wyprowadzenie kabla USB3-PCIe i zasilania poza obudowę. Stosując np. obudowę MHero-S-R dostaniemy złącze Molex na obudowie, co ułatwi obsługę zasilania. Druga opcja to zastosowanie oddzielnego zasilacza dla karty graficznej. Jeżeli będzie to komputerowy zasilacz ATX to trzeba będzie paru sztuczek z pinami by go włączyć (normalnie steruje tym płyta główna). Dostępne są też zasilacze AC/DC zakończone złączem Molex. Można więc połączyć mały PC z zewnętrzną kartą grafiki bez stosowania dużych obudów z dużym zasilaczem. Co nie oznacza że zawsze warto ;)

Zestaw testowy

Do testów wykorzystałem wspomniany riser bitcoinowy. Z kart graficznych do testów trafiły Pegatron HD 6450, Nvidia Quadro FX 580 i FX 3700 kupione tanio na Allegro. Karta AMD jest naprawdę podstawowym modelem z tej serii, natomiast stare karty Quadro nie cieszą się nadmiernym zainteresowaniem, więc ceny są bardzo niskie. Dłuższe wsparcie do tych kart oznacza że bieżące sterowniki Nvidii dla Linuksa nadal je obsługują (choć FX 580 nie jest wylistowana dla sterownika z serii 334, choć jest dla 331). Jeżeli myślisz o wykorzystaniu starszej karty grafiki (FX 580 ma 2x displayport i 1x DVI) to upewnij się czy jest obsługiwana przez współczesne sterowniki. Spokojnie można też odstrzelić karty mające mniej niż 512 MB RAM. Quadro FX 580 jak i FX 3700 mają po 512 MB DDR3 RAM, karta AMD 1 GB. FX 3700 jest znacznie silniejsza od FX 580 i ma znacznie większe wymagania co do zasilania. Jedno to 6 pinowe złącze zasilające, a drugie to konieczność zastosowania dość dobrego zasilacza przy próbie użycia jej na złączu PCIe x16 (nie chciała wystartować z 400W zasilaczem Cooler Master, ruszyła z 600W Chiefteca). W przypadku risera x1 ruszyła także z zasilaczem 400W.

HD6450, nvidia FX 580 i FX 3700
HD6450 zamontowana w riserze

W przypadku współczesnych kart graficznych można wybrać np. Nvidię GT630 lub inną lepszą kartę AMD z radiatorem. Silniejsze będą już posiadały wiatrak, albo i będą wymagały dodatkowe zasilania (co wymagać będzie zasilacza ATX).

Pierwsza seria testów z Celeronem J1900 miała sprawdzić czy i o ile wzrastają osiągi komputera z zewnętrzną kartą grafiki na PCIe x1. Druga seria dokonana na płycie głównej z PCIe x16 (GA-H61MA-D3V, Pentium G840) miała za zadanie zebrać wyniki dla kart podłączonych na szynie x16 i poprzez riser jako x1 - sprawdzić ile wydajności tracimy.

Wyniki

Większa część testów wykonana została za pomocą narzędzi phoroniksa. Wyniki dostępne są online i można porównać wyniki własnego PCta do tych uzyskanych przeze mnie. Dostępne są cztery zestawienia testów:

Celeron J1900 z zewnętrzną kartą grafiki na PCIe x1

Benchmarki gier na Celeronie J1900

Benchmarki gier na Celeronie J1900

J1900HD6450FX 580FX 3700
OpenArena1618,728,659,53
Reaction Quake 32955,1755,43109,7
Urban Terror28,135,631,735,53
Xonotic Low63,777,399,03102,52
Xonotic High24,6833,9644,1662,56
Xonotic Ultra16,5323,9217,0638,02
Xonotic Ultimate9,9616,3810,1223,74
CoreBreach FSAA 4x4211659157
ET: Quake Wars Demo12,5318,223,8738,63
Nexuiz0,9124,227,7143,36
Nexuiz HDR119,1320,5727,47
World of Padman59,276,63103,73111,7
Smoking Guns72,9392,1391,87126,97
SuperTuxKart60,8263,7556,354,39
Tremulous58,679,974,476,13
Unigine Sanctuary4,4211,0110,2928,65
Unigine Tropics4,949,1310,9328,11

Wykorzystane w testach dość słabe karty graficzne podnoszą osiągi we wszystkich grach. J1900 ma grafikę Ivy Bridge, ale tylko 4 EU zamiast 16 jak w HD 4000. Testowane karty graficzne na passmark.com mają niższą ocenę wydajności od HD 4000 za wyjątkiem FX 3700. Mimo to dały radę wyraźnie poprawić wydajność gier. Z drugiej strony poprawa z 5 FPS na 10 FPS wiele nie pomoże więc, jeżeli gra działa, ale nie za dobrze to zewnętrzna karta grafiki da poprawę wydajności pozwalającą na swobodne granie. Jeżeli wydajność jest naprawdę kiepska to może być ciężko poprawić ją poprzez PCIe x1 i na procesorze o dość niskiej częstotliwości.

Razem z karta HD 6450 zużycie energii wzrosło do 56W (z trzydziestu paru bez zewnętrznej karty graficznej). W czasie testów FX 580 maksymalne zużycie energii elektrycznej wyniosło 66,5W a dla FX 3700 aż 130W. Niezbyt duży wzrost wydajności okupiony został ogromnym wzrostem zapotrzebowania na energię elektryczną. Stosując nowsze karty jak np. GT630 zużycie będzie mniejsze, ale cena nowych kart jest też większa (testowane na Allegro chodzą poniżej 100 PLN).

Benchmarki GPU

Benchmarki GPU trudniej odnieść do codziennego użytkowania komputera. Testy OpenGL w większości pokazywały przewagę kart Nvidii nad grafiką Intela i AMD, choć ta też nie zawsze była taka słaba. Poniżej kilka zestawień wyników:

QGears2

QGears2 - w przypadku OpenGL testy dają lepsze wyniki na zewnętrznych kartach graficznych

GpuTest

GpuTest

Benchmarki SPECviewperf - CAD/3D

Cała seria kart graficznych Nvidia Quadro jest przeznaczona do stacji roboczych, w których zapewnia wysoką wydajność specjalistycznych aplikacji, w tym aplikacji typu CAD. W benchmarkach Phoroniksa dostępny jest zestaw testów SPECviewperf 10, które testują wydajność w zastosowaniach CAD/3D. Także Nvidia używa tego zestawu w swoich porównaniach kart Quadro. Wyniki są dość jednoznaczne - Quadro, nawet te stare i słabe wygrywają:

Nvidia Quadro zwycięża w benchmarkach SPECviewperf

Nvidia Quadro zwycięża w benchmarkach SPECviewperf

Zastanawia też spora różnica między J1900 a G840 na płycie głównej Gigabyte. Same procesory mają podobne osiągi, RAM o tym samym taktowaniu. Może to być wpływ znacznie większej częstotliwości rdzeni G840 (jeżeli test mocno wykorzystuje tylko jeden rdzeń), albo jakieś różnice na szynie PCIe.

Benchmark przeglądarek

Postanowiłem sprawdzić na ile karta graficzna ma wpływ na osiągi przeglądarek - Chromium i Firefoksa. Dla każdej z kart odpaliłem test Octane oraz sprawdzałem co o danej karcie powie chrome://gpu.

Wyniki benchmarków Octane

Wyniki benchmarków Octane

Różnice nie są duże, jednak Firefox osiągał nieco lepszy wynik wraz ze wzrostem mocy karty graficznej. Chromium stracił na FX 580 i HD6450. Większe znaczenie może mieć sprzętowa akceleracja poszczególnych funkcjonalności przeglądarki. Chromium zwróciło takie oto wyniki:

Intel HD Graphics:
  • Canvas: Software only, hardware acceleration unavailable
  • 3D CSS: Unavailable. Hardware acceleration unavailable
  • Compositing: Software only, hardware acceleration unavailable
  • CSS Animation: Software only, hardware acceleration unavailable
  • Flash 3D: Unavailable. Hardware acceleration unavailable
  • Flash Stage3D: Unavailable. Hardware acceleration unavailable
  • Flash Stage3D Baseline profile: Unavailable. Hardware acceleration unavailable
  • Video: Software only, hardware acceleration unavailable
  • Video Decode: Software only, hardware acceleration unavailable
  • Video Encode: Software only, hardware acceleration unavailable
  • WebGL: Unavailable. Hardware acceleration unavailable
HD 6450, fglrx:
  • Canvas: Software only, hardware acceleration unavailable
  • 3D CSS: Hardware accelerated
  • Compositing: Hardware accelerated on all pages and threaded
  • CSS Animation: Accelerated and threaded
  • Flash 3D: Hardware accelerated
  • Flash Stage3D: Unavailable. Hardware acceleration unavailable
  • Flash Stage3D Baseline profile: Unavailable. Hardware acceleration unavailable
  • Video: Hardware accelerated
  • Video Decode: Software only, hardware acceleration unavailable
  • Video Encode: Hardware accelerated
  • WebGL: Hardware accelerated
Nvidia FX 580:
  • Canvas: Software only, hardware acceleration unavailable
  • 3D CSS: Hardware accelerated
  • Compositing: Hardware accelerated on all pages and threaded
  • CSS Animation: Accelerated and threaded
  • Flash 3D: Unavailable. Hardware acceleration unavailable
  • Flash Stage3D: Unavailable. Hardware acceleration unavailable
  • Flash Stage3D Baseline profile: Unavailable. Hardware acceleration unavailable
  • Video: Software only, hardware acceleration unavailable
  • Video Decode: Software only, hardware acceleration unavailable
  • Video Encode: Hardware accelerated
  • WebGL: Hardware accelerated

Jak widać sterowniki graficzne Intela nie dają Chromium za wiele. W przypadku Nvidii jest już znacznie lepiej, a AMD z własnościowym sterownikiem fglrx oferuje najwięcej bo i akcelerację wideo jak i Flash 3D. Trudno mi jednak określić na ile to usprawnia działanie przeglądarki.

Benchmarki porównawcze PCIe x16 kontra x1

Benchmarki Unigine

Benchmarki Unigine

Benchmarki gier

Benchmarki gier

W przypadku benchmarków Unigine tylko Heaven wykazał wyraźną różnicę. Ten benchmark w odróżnieniu od dwóch pozostałych i tak za bardzo chyba nie obciążał karty graficznej - na pozostałych dwóch temperatura jak i głośność wentylatora były znacznie większe.

W przypadku pozostałych gier widać że niektóre mocno tracą po podłączeniu karty graficzne poprzez PCIe x1. Nexuiz HDR może mieć większe zapotrzebowanie na transfer ze względu na większą rozdzielczość grafik/tekstur, ale np. Urban Terror traci chyba trochę za dużo. Xonotic traci około 15-20% w zależności od ustawień. Lżejsze gry notują minimalny spadek wydajności.

Otrzymane wyniki pokazują że na szynie PCIe x1 da się dość efektywnie korzystać z zewnętrznych kart graficznych, ale nie aż na tyle by budować w oparciu o nią komputer do masowego grania. Straty osiągów mogą być spore, a różnica w cenie pomiędzy PCtem x16 a x1 niewielka.

Kopanie Bitcoinów

Karty Nvidii z rdzeniami CUDA można wykorzystać do kopania Bitcoinów. Sam riser, którego używam został stworzony z myślą o wykorzystaniu wielu kart graficznych podłączonych do jednego PCta. Czy tracimy coś podłączając kartę poprzez PCIe x1 zamiast x16?. Benchmark CudaMiner pokazał że przynajmniej w przypadku Quadro FX 3700 strata sięga zaledwie 0,18%, co można przyjąć za błąd pomiaru (np. zmienne obciążenie generowane przez środowisko graficzne). Test pokazuje też że stare karty (compute capability 1.1) wypadają dość blado w porównaniu z nowymi (compute capability 3.5 w przypadku laptopowej Nvidii przełączonej przez nvidia-prime).

Benchmark CudaMiner

Benchmark CudaMiner

Podsumowanie testów

Eksperyment pokazał że nawet na PCIe x1 można podłączyć i używać zewnętrzną kartę grafiki. W przypadku niektórych zastosowań straty będą nawet pomijalne, ale jeżeli chodzi nam o wydajności w grach to chyba lepiej zbudować bardziej klasyczny komputer z szyną PCIe x16. To pozwoli osiągnąć maksymalną wydajność z karty graficznej, za którą trochę zapłacimy.

Wyniki pokazują też jak wiele można jeszcze zrobić jeżeli chodzi o zintegrowaną grafikę Intela. W 10W serii Bay Trail-D chodziło raczej o energooszczędność. Oby w przyszłej serii Braswell opartej o grafikę Broadwell stare i słabe zewnętrzne karty graficzne nie były w stanie jej pokonać.

W powyższych testach nie brały nowe Athlony i Semprony AMD. Na szynie pracującej z przepustowością x4 straty wydajności byłyby zapewne znacznie niższe (o ile by występowały). Z drugiej strony zintegrowana grafika jest też bardziej wydajna (to procesor może być tą słabszą częścią), więc przyrost wydajności może dać tylko bardziej wydajna karta graficzna.

Trochę rozważań

Jako że rośnie sprzedaż urządzeń mobilnych jak tablety, smartphony, czy ultrabooki, a sprzedaż dużych klasycznych PCtów maleje to producenci idą w kierunku gotowych układów SoC ze zintegrowaną grafiką i małym TDP umożliwiającym długą pracę na akumulatorze. Domowe PCty o ile nie są laptopami dość często są bezgłośnymi PCtami opartymi właśnie o Bay Trail-D, czy wspominane układy AMD. Sloty PCIe na płytach głównych wyposażone w takie procesory nie mają większego sensu. Zazwyczaj będą osadzone w małej obudowie z niezbyt silnym zasilaczem. Nie będzie miejsca ani mocy na zewnętrzną kartę graficzną.

Lepiej byłoby gdyby PCIe było wyprowadzone na zewnątrz w postaci złącza ExpressCard - co pozwoli podłączyć kontrolery USB3, ESATA, Firewire 800, czy modemy 3G, Ethernet, RS232 i inne. Jeżeli rozważać lepszej wydajności grafiki to może warto w takim przypadku rozważyć użycie np. złącza MXM używanego w lepszych laptopach jako sloty na mobilne karty graficzne. Wykorzystanie MXM mogłoby zapewnić kompaktową budowę małego PCta, ale też wymagałoby opracowania jakiegoś standardu dla takich płyt głównych. Wiele grafik na MXM jest dość potężnych o TDP np. 100W więc potrzebne są radiatory, wentylatory, rurki cieplne no i oczywiście zasilanie. Do tego płyta główna musi obsługiwać przełączanie między zintegrowaną a zewnętrzną grafiką, w tym na swoich wyjściach obrazu.

RkBlog

Komputery PC, 25 May 2014

Comment article
Comment article RkBlog main page Search RSS Contact