نقد و بررسی کارت گرافیک Nvidia GTX 780

amirmahmood

کاربر سایت
Nov 12, 2009
3,202
نام
امیر محمود
سلام

در این تاپیک قصد دارم کارت گرافیک Nvidia GTX 780 را بررسی کنم. نقد و بررسی های معتبر فراوانی در اینترنت موجود هستش اما از انجایی که دوست داران PC و بازی در این فروم کم نیستن،مایل هستم که بررسی جامع و مفیدی رو برای دوستان اماده کنم.
کارت مورد استفاده در این نقد و بررسی ASUS GTX 780 رفرنس می باشد.

Galaxy-ASUS-and-MSI-All-Launch-Reference-GTX-780-Boards-4.jpg


این کارت گرافیک در ماه May امسال توسط nVIDIA به بازار عرضه شد. در واقع بعد از GTX Titan ، این کارت سریعترین Single GPU دنیا هستش.

این بررسی شامل شش قسمت هست:
1-مشخصات کلی کارت گرافیک GTX 780
2- بررسی اجمالی معماری GK110 و مقایسه ان با GK104 و GF110
3- سیستم و جزئیات تست
4- نتایج تست بازی ها و بنچمارک ها
5- دما و مصرف
6- نتیجه گیری

----------------------------------------------
قسمت اول:

مشخصات کلی:

Base Clock: 836 MHZ
Boost Clock: 900 MHZ
Memory Clock: 6 Gbps
Memory Amount: 3 GB GDDR5
Bandwith: 288 GB/S
Interface: 384 Bit
معماری: GK110
فناوری ساخت: 28 نانومتر
کانکتور های مورد نیاز: یک 8 پین و یک 6 پین
طول کارت گرافیک : 26.7 سانتی متر
قیمت: 650 دلار

یکی از اتنقاداتی که به GTX 780 وارد هستش ، کم بودن مقدار Core Clock و Memory Clock است. شاید دلیل ان عدم ایجاد رقیب برای GTX Titan و GTX690 هستش. از دیگر دلایل هم پایین نگه داشتن مصرف است.
به هر شکل Nvidia می توانست با بیشتر کردن مقادیر Core Clock و Memory کارایی GTX780 را بیشتر از این کند.


--------------------------------------
قسمت دوم: بررسی اجمالی معماری کارت گرافیک GTX 780

در این کارت از معماری Kepler با نام GK110 استفاده شده است.
تصویر از معماری GK 110 مورد استفاده در 780:


gk110-block-diagram-large.jpg

مشخصات کلی معماری کارت:

تعداد Stream Processor ها : 2304
تعداد GPC ها: 4
تعداد SMX ها : 12
تعداد Rasteriser ها: 4
تعداد Tesselation Unit ها: 12
تعداد Texture Unit ها : 194
تعداد ROP ها: 48

تعداد ترانزیستور ها: 7.1 میلیارد
اندازه سطح تراشه: 551 میلی متر مربع

معماری GTX 780 و GTX Titan یکسان هستند و در هر دو انها از GK110 استفاده شده است.
GTX Titan دارای 5 تا GPC و 14 تا SMX می باشد. یعنی 2 تا SMX بیشتر نسبت به 780 و در نتیجه 16 واحد Tesselation
در ادامه این بررسی، حتما تست اختصاصی از Tesselation خواهیم داشت.


برای مقایسه GK104 و GK110 ، مشخصات معماری GK104 هم در زیر قرار دادم.

تصویر معماری GK104

gtx680-20b.jpg


مشخصات GK104:

تعداد Stream Processor ها: 1536
تعداد GPC ها: 4
تعداد Rasteriser ها: 4
تعداد SMX ها: 8
تعداد Tessellation Unit ها: 8
تعداد Texture Unit ها: 128
تعداد ROP ها: 32
تعداد ترانزیستور ها: 3.5 میلیارد
اندازه سطح تراشه: 294 میلی متر مربع
فناوری ساخت: 28 نانومتر

در ظاهر در GK110 تعداد GPC ها و SMX ها افزایش یافته است و هر GPC شامل 3 تا SMX می باشد. در صورتی که در GK104 هر GPC شامل 2 تا SMX می باشد.

مقایسه ای بین SMX های بکار رفته در GK104 و GK110:

gk104-smx.jpg

gk110_smx.jpg

تعداد Core ها در SMX های هر دو معماری GK104 و GK110 یکسان است و تعداد Texture Unit ها در SMX های هر دو معماری یکسان می باشد.
در GK110 اضافه شده DP Unit ها در SMX ها مشاهده می شود.


برای درک بهتر تغییرات کپلر GK110 بهتر است، یک مقایسه اجمالی با معماری Fermi-GF110 داشته باشیم.

تصویر معماری GF110:

gf100-l.jpg


مشخصات معماری GF110:



تعداد Stream Processor ها: 512
تعداد GPC ها: 4
تعداد SM ها: 16
تعداد
Rasteriser ها: 4
تعداد Tesselation Unit ها: 16
تعداد Texture Unit ها: 64
تعداد ROP ها: 48
تعداد ترانزیستور ها: 3 میلیارد
اندازه سطح تراشه: 530 میلی متر مربع
فناوری ساخت: 40 نانومتر


مشخصات یک SM در GF110:


sm.png


مقایسه GK110 و GF110:

1- GK110-Titan شامل 5 تا GPC است و GF110 هم 4 تا GPC
2- در GF110 هر GPC شامل 4 تا SM می باشد.
3- در GK110 هر GPC شامل 3 تا SMX می باشد.
4-در GK110 شاهد Polymorph Engine نسخه 2 هستیم که نسبت PE1 در GF110 بهینه تر و بهتر است.
5- در هر دو معماری یک GigaThread Engine وجود دارد.

مقایسه GF110 SM و GK110 SMX:

1- یک SM در GF110 شامل 32 تا CUDA Core می باشد.
2- یک SMX در GK110 شامل 192 تا CUDA Core می باشد.
3- تعداد Texture Unit ها در یک SM معماری GF110 ، مقدار ان 4 تا است و در یک SMX معماری GK110 مقدار ان به 16 تا افزایش یافته است.
4- وجود PolyMorph Engine نسخه 2 در SMX های معماری GK110
5- وجود 4 تا Warp Sheduler در SMX های GK110
6- وجود 2 تا Warp Sheduler در SM های GF110
7- هر WS در SMX ها شامل دو تا Dispatch Unit است و هر WS در SM شامل یک Dispatch Unit

-------------------------------------
قسمت سوم: سیستم و جزئیات تست

سیستم مورد استفاده در این نقد و بررسی:



CPU: Intel Core i5 3570K @ 3.4 GHZ Default Clock
Main: MSI Z77-AG43
RAM: Gskill 4*2GB (8GB) DDR3 1600
VGA: ASUS GTX 780 3GB
HDD: Seagate 1TB
Power Supply: Green GP785B
Case:Green X5 Fusion
Monitor:Samsung LED S22B375H Plus
Operation System: Microsoft Windows 8 Enterprise 64 Bit
VGA Driver: 326.19 Beta




برای اندازه گیری فریم در بازی از نرم افزار Fraps استفاده شده است.
سه مقدار در بنچمارک بازی ها لحاظ شده است: 1-کمترین فریم 2- میانگین فریم 3- بیشترین فریم
اهمیت کمترین فریم بسیار مهم است و بهتر است نزدیک به میانگین فریم باشد.

مسئله مهم دیگر FrameTime است. یعنی صرفا عدد فریم مهم نیست. در واقع مقدار زمانی که طول می کشد هر فریم توسط GPU پردازش شود مهم تر از عدد فریم است. این مقدار زمان به میلی ثانیه بیان می شود و بالاتر از 50 میلی ثانیه باعث کند شدن گیم پلی بازی یا نشان دهنده Suttering است.

بازی ها و بنچمارک هایی که در این بررسی از انها استفاده شده است:

3D Mark11
3D Mark 2013
3D Mark Vantage
Nvidia New Dawn
Tessmark
Unique Heaven 4
Unique Valley 1
Sandra 2013 SP4
FluidMark Physx Test
LuxMark 2 OpenCL

Crysis 3
Far Cry 3
Battlefield 3
Tomb Raider 2013
Metro Last Light
Hitman Absolution

تصویر GPU-Z:


90272887491975902222.jpg


-------------------------------------------
قسمت پنجم: نتایج تست بازی ها و بنچمارک ها:

تست بنچمارک ها:


تست 3D Mark11 در حالت Performance:

28678110970014991881.jpg


تست 3D Mark 11 در حالت Extreme:

26529219048279343060.jpg


بنچمارک 3D Mark 2013

10884115560764370337.jpg

بنچمارک 3D Mark Vantage در حالت Performance:

03880093289639407936.jpg


بنچمارک Unique Heaven 4: (تست اختصاصی Tesselation )

58061659504101292817.jpg
04846560055538655376.jpg


بنچمارک Unique Valley:

38501786463096571988.jpg

34316108970119796571.jpg

بنچمارک Tessmark: (تست اختصاصی Tesselation)

04538861841975837071.jpg

بنچمارک FluidMark : ( تست اختصاصی Physx )

18385559350276760089.jpg


Sandra 2013 SP4: ( تست OpenCL GP)

53039880707119330592.jpg

بنچمارک Luxmak 2:
تست Rendring با OpenCL که بار پردازشی روی CUDA Core های کارت GTX780 قرار می گیرد.
این بنچمارک در سه حالت تست شده است:
1- تست Rendering فقط با GPU
2- تست Rendering فقط با CPU Intel Core i5 3570K
3- تست Rendreing با GPU و CPU

نتیجه تست با Luxmark2:

31491984806912072588.jpg


همانطور که در نتیجه تست مشاهده می کنید، کارت گرافیک GTX780 در تست Rendering حدودا 5 برابر سریعتر نسبت به Intel Core i5 3570K ظاهر شده است.

demo بسیار سنگین Nvidia NewDawn:

89459550800387590559.jpg

----------------------------------
تست بازی ها:

Battlefield 3
تنظیمات:
1080*1920
Overall: Ultra
AA: 4X MSAA
Field of View: 85
مرحله: Operation Swordbreaker

57797657972755894286.jpg

تست مولتی پلیر BF3:
نقشه Caspian Border و 64Player:
تنظیمات:
1080*1920
Overall: Ultra
AA: 4X MSAA
Field of View: 85

76363751102082291487.jpg

تست بازی FarCry 3
Ver 1.4
تنظیمات:
1080*1920
Overall Setting: Ultra
HBAO
AA: 8X MSAA

83681749022500351029.jpg


تست بازی Crysis 3
Ver 1.2
تنظیمات:
1080*1920
Spec: Very High
AA: SMAA LOW 1X

08855612669032985031.jpg


بنچمارک بازی Tomb Raider 2013
Ver: 1.0.743
تنظیمات:
spec: Ultimate
Shadow:Ultra
TressFX ON
2XSSAA

91479385676910069556.jpg

------------------------------------------------
این نقد و بررسی حداکثر تا فردا تکمیل میشه.
و نتایج بنچمارک ها و بازی ها به پست اول اضافه خواهد شد.


 
آخرین ویرایش:

کاربرانی که این قسمت را مشاهده می‌کنند

Top
رمز عبور خود را فراموش کرده اید؟
or ثبت‌نام سریع از طریق سرویس‌های زیر