بحث در مورد كارتهاي گرافيك (nVIDIA - ATI)

LORD5

کاربر سایت
Mar 29, 2009
1,177
نام
عباس
سلام
اين تاپيك رو زدم(واقعا لازم بود، چند بار خودم تصميم گرفتم بودم اين تاپيك رو بزنم چندبار هم ساير دوستان) تا بحث‌هاي حاشيه‌اي كه در بخش مشاوره صورت مي‌گيره به اينجا منتقل بشن تا هم اون تاپيك شلوغ نشه و هم يك تاپيك پر محتوا و جمع و جور داشته باشيم تا بار علمي فروم هم بالاتر بره.
پس بسم ا...

اما قبل از شروع خواهش مي‌كنم از پست هايي كه هيچ گونه بار محتوايي ندارند پرهيز كنيد. البته در پاسخ به سوالاتي كه داده مي‌شه يا پرسيده مي‌شه.
اگر دليل و مدركي براي اثبات حرفتون داريد بيان بكنيد تا ما هم استفاده ببريم، وگرنه نيازي نيست كه حتما در زمينه اي كه تخصص ندارين تز بدين.
رامين جان(supra) هم همت بكنند و اگر اين پست‌ها داده شد سريعا پاكشون بكنند.

خب يك جمله توجه من رو معطوف كرد و باعث شد كه به اين بهانه تاپيك رو بزنم كه اون جمله اين بود:
باید همه کارت مثل همه باشند معماری و همه چی شون تا مقایسه بشه کرد!(نگارنده: علامت سوالي هم اضافه مي‌كنيم براي شروع بحث)
بله كاملا بايد شبيه به هم باشن.

اما چرا بايد شبيه باشن؟ و مقايسه يك كارت رادئون با جيفورس تقريبا هيچگاه به نتيجه نمي‌رسه؟

توجه كردين كه پردازنده‌هاي گرافيكي كارتهاي ATi استريم پروسس(SP) بيشتري(سه يا چهار برابر) از كارتهاي انويديا دارن؟
با وجودي كه پردازنده استريم يكي از مهمترين پارامترهاي تاثير گذار در كارت گرافيكي هست پس بايد هميشه كارتهاي ATi قوي‌تر باشن. اما اينطور نيست.
چون SP ها كارتهاي انويديا از نوع Scalar هستند كه توانايي همه نوع پردازش رو دارند. پردازندش‌هاي همچون ضرب، تقسيم، عدد صحيح، تقسيم عدد صحيح، مميز شناور و به طور كلي هر پردازش كه كارت گرافيك وظيفه پروسس اون رو داره.

اما SPهاي ATi از نوع SuperScalar بوده و توانايي انجام تنها چند نوع پردازش رو دارند. مثلا يك گروه دهتايي وظيفه پردازش تقسيم رو به عهده داره، يك گروه پنجاهتايي وظيفه پردازش مميز شناور رو عهده داره و همينطور الي آخر هر گروه از SPها به يك پردازش خلاصه مي‌شن.

پس از نظر من يا شايد هم خيلي‌ها دليل اينكه كارتهاي انويديا در يك بازي فريم بالاتر مي‌دن و يا كارتهاي ATi فريم بالاتر مي‌دن برمي گرده به نحوه نوشتن كدهاي اون بازي و سازگارتر بودن اون كدها با SP هاي كارتهاي يكي از شركت‌هاي سازنده كه اصولا انويديا به خاطر سرمايه‌اي كه داره و مبلغي كه مي‌ده در اكثر موارد برنامه‌هاي نوشته شده با كارتهاي انويديا سازگاري بيشتري دارند كه در نتيجه موجب افزايش پرفورمنس كارتهاي انويديا نسبت به كارتهاي ATi مي‌شه.
اما ATi اين خرج رو نمي كنه در عوض با ارايه پچ و يا درايور، خودش مشكل رو جبران مي‌كنه(يك نوع صرفه جويي در سرمايه).

ولي اگر نظر من يا سايرين رو بخوايد بايد بگم كه SPهاي پردازنده‌هاي گرافيكي ATi پتانسيل بيشتري دارند كه به دليل پيچيده بودن SPها پتانسل كارتهاي ATi هميشه به طور كامل به كار گرفته نمي‌شن.

خب طرح يك سوال ديگه كه جوابش درون خودش هست و بحثم رو فعلا به اتمام مي‌رسانم.
توجه كردين كه كارتهاي انويديا هميشه اينترفيس حافظه بيشتر و فركانس كمتر نسبت به ATi دارن؟
 

A-L-I

El amor es la fuerza más poderosa del mundo, amant
کاربر سایت
Jul 18, 2010
6,283
آقا ما یه 480 خریدیم دیگه به رحمت خدا ، خدارو شکر :D
یه خورده از بار فنی ـش بگیری برامون ؟
 

LORD5

کاربر سایت
Mar 29, 2009
1,177
نام
عباس
آقا ما یه 480 خریدیم دیگه به رحمت خدا ، خدارو شکر :D
یه خورده از بار فنی ـش بگیری برامون ؟
توي اينجا در مورد معماري فرمي چيزهايي گفتم كه او مواردش رو اينجا هم نقل قول مي‌كنم.

نکته حائز اهمین در مورد این پردازنده(GF100)، وجود 512 پردازنده استریم است. سوالی که مطرح می‌شود، پس چگونه است که در مشخصات این کارت مقدار 480 پردازنده استریم(کودا) ذکر می شود؟ دلیل این امر غیر فعال شدن 32پردازنده استریم است که در یک بسته موسوم SM قرار داده شده است. علاوه بر 32 پردازنده استریم درون SMها موتور Polymorph در قسمت فوقانی هر SM تعبیه شده که وظیفه پردازش هندسی(که از مهمترین مزیت‌های GF100 است) را بر عهده دارد. هر چهار SM شامل 128 پردازنده‌استریم است. این 128 پردازنده در یک کلاستر یا خوشه‌ی پردازشی قرار می‌گیرد. درون این کلاستر یک موتور پرداشگر تصویر(Raster Engin) قرار گرفته که با SM‌ها در تعامل می‌باشد. و این تعامل به صورت دوجانبه است. این پردازشگر در کنار پردازشگر Polymorph قلب اصلی این پردازنده را گرافیکی را تشکیل می‌دهند و نحوه پردازش بر دوش این دو پردازشگر است. نحوه پردازش هم بر مبنای رابط DirectX11 است. تمامی این موارد در بلوکی به نام GPC قرار ‌گرفته و در این پردازنده(GF100) مجموعاً چهار GPC قرار دارد. در دو طرف این GPCها شش واحد کنترلر حافظه تعبیه که سه واحد در هر سمت قرار می‌گیرد. حافظه نهان سطح2 موجب تقسیم چهار GPC‌شده است. این حافظه در شش بسته و هر بسته دارای 8 واحد حافظه است و در مجموع 48 واحد حافظه را شاهد هستیم. تمامی این اجزا دست به دست همدیگر داده‌ و پردازنده پر قدرت GF100 را به عمل آورده‌اند.

gtx460_core1.png
 

LORD5

کاربر سایت
Mar 29, 2009
1,177
نام
عباس
این عکس رو یه خورده توضیح میدی ؟!:d
توي اون لينك كه دادم دقيقا تمامي موارد مورد نياز در اين تصوير رو توضيح دادم.
و همچنين همون قسمت نقل قول هم توضيحات مربوط به GF100 هست كه در كارت 480 استفاده شده.
 

amirmahmood

کاربر سایت
Nov 12, 2009
3,047
نام
امیر محمود
ممنون که همچینین تاپیک را ایجاد کردی!
لازم بود!
-------------
ولي اگر نظر من يا سايرين رو بخوايد بايد بگم كه SPهاي پردازنده‌هاي گرافيكي ATi پتانسيل بيشتري دارند كه به دليل پيچيده بودن SPها پتانسل كارتهاي ATi هميشه به طور كامل به كار گرفته نمي‌شن.

تایید میشه!

ضمنا نقل قولی که گذاشتی در قالب سوال مطرح کرده بودم و جواب نبود!اونم از اقا رامین!
اما وقتی شما عرض کردی که باید معماری کارت ها برای مقایسه یکسان باشند خب این نمیشه!
کارت انودیا و Atiهر کدوم معماری خودشون را دارند و هر کدوم در مواقعی بهتر از رقیبش هست به دلیل تفاوت معماری!
اما به هر شکل کارت ها باید مقایسه بشند وگرنه بخوایم فکر کنیم که معماری تفاوت داره و باید از بعضی تست ها پرهیز کرد!
شاید درست نباشه!شاید هم درست باشه!
به نظر من باید علی رغم تفاوت بسیاری که وجود داره باید تمام تست ها صورت بگیره و کسی می خواد کارت را بخره بفهمه کارتی که می خره در هر شرایط چجوری عمل می کنه!(شاید دلیلی نباشه برای اینکه معماری دو شرکت باید حتما یکی باشه اتفاقا باید هر کدوم به تناسب به معماریشون در شرایط مختلف نتیجه متفاوت بده!اساسا کارت ها باید با هم فرقی داشته باشند تا ادم قانع بشه تا انها رو بخره!بقول معروف نسبت به رقیبش وجه مثبت هم داشته باشه! شما وقتی خواستار خرید یک محصول میشید و حاضرید پول زیادی براش بپردازید حتما نکات متفاوت و مهمی نسبت به کالا های مشابه داشته که شما را قانع کرده تا بخرید وگرنه اگر همش شباهت باشه که خرید کالا بهتر معنایی نداره!البته این مثال بود برداشت نادرست نکین خواهشا!)
اینترفیس Atiهم بخاطرgddr5جبران میشه و پهنای باند افزایش پیدا می کنه اما کارت انودیا به غیر از 400 که قبلا از ddr3ستفاده می شد از اینترفیس بالا مثل 512استفاده می کردند!(البته دلایل دیگه هم داره!)

اما SPهاي ATi از نوع SuperScalar بوده و توانايي انجام تنها چند نوع پردازش رو دارند. مثلا يك گروه دهتايي وظيفه پردازش تقسيم رو به عهده داره، يك گروه پنجاهتايي وظيفه پردازش مميز شناور رو عهده داره و همينطور الي آخر هر گروه از SPها به يك پردازش خلاصه مي‌شن.
TeraScale 2 Unified Processing Architecture

توي اينجا در مورد معماري فرمي چيزهايي گفتم كه او مواردش رو اينجا هم نقل قول مي‌كنم.



gtx460_core1.png

معماری سری 480 فوق العاده درست شه و انکار ناپذیر هستش!و عملکرد خیلی خوبی در DX11داره!
اون چهار تا GPCکه ساختار مشابهی دارند و تقریبا یکسان مثل هم کار می کنند!
به نظر من نصف این معماری فقط بخاطر POLYMORPH ENGINEوRASTERENGINEهستش ببنید چگونه در معماری کارت نقش بستند!ارتباط RASTERبا SMهم تکمیل کرده این قضیه رو!
diag_gpc.png

البته یکی از علل تاخیر انتشار کارت های انویدیا خب درست کردن همچین معماری خوبی بود!
متاسفانه Atiیک مقدار هول هول کردی کارت ها رو عرضه کرد بخاطر کسب بیشتر درصد بازار که معماری خوب از اب در نیمد!

این هم معماری Streaming Multiprocessors
diag_sm.png


یک کلمه شاهکار هست این معماری!

Double Warp Scheduler

diag_warp.png


Raster Engines

diag_raster.png


Memory subsystem
diag_mem.png


دوستانی که علاقمند به تست معماری GF100هستند می تونند تست های زیر را ببینید که در DX9-10-11انجام شده!تست های synthetic هستش!و تست بازی در الویت اخر هست!

 
آخرین ویرایش:

vahid_ba

کاربر سایت
May 25, 2008
3,141
حالا که همه گیر دادن به fermi منم یه چند تا مطلب نیمه تخصصی جهت اطلاع عمومی دوستان اماتور مثل خودم بدم:d
---------------------



اول بگم از اسم معماری fermi مشخصه که nvidia در تولید چیپ جدید کارتهای گرافیکیه خودش از یه معماریه منحصر به فرد استفاده کرده و دلیل انتخاب این اسم هم همین بود
Enrico Fermi نام فیزیک دان خبره ای بود که واسه اولین بار تونس به کشف تازه ای از ذرات هسته دست پیدا کنه و کلا یه اندیشه نو در باره سلسله هسته ای بیان کرد
و دلیل انتخاب این اسم از سوی انویدیا فکر میکنم به خاطر معماری جدید و منحصر به فرد خودش در رابطه با چیپ های گرافیکی بوده که در پایین یه سری تفاوت این نسل رو با نسل پیش کارتهای خودش یعنی gt200 میگم براتون


ECC: فرمی اولین چیپی از کارتهای گرافیکیه که از این قابلیت پشتیبانی ممیکنه
این قابلیت کمک میکنه تا خطاهای نرم افزاری تصحیح بشن و در نتیجه کارت بسیار پایدارتر نسبت به رقیب خودش یعنی ati عمل کنه


Polymorph Engine: پردازش شکل های هندسی توسط این موتور انجام میشه
به این صورت که اول راس ها رو مشخص میکنه سپس با استفاده از Tessellator فاصبه بین راس ها رو پر میکنه. در قسمت Attribute ویژگی های هر شکل پردازش و در اخر شکل نهایی باری خروجی به Stream Output فرستاده میشه

cache: میزان کش های به کار رفته در gf100 خیلی بالاتر از سری gt200 هست و این تفاوت باعث میشه gpu بتونه فضای وسیع تری از تکسچر ها رو پوشش بده (به درد بازیهای open world مثل مافیا میخوره:d) و پردازش رو راحت تر انجام بده

جدول مقایسه کش های بکار رفته در هر دو سری:
9d5a4908730343f48947.jpg



در کل باید بگم درسته معماری فرمی خیلی عالیه اما هنوز خیلی جای پیشرفت داره....
 
آخرین ویرایش:

amirmahmood

کاربر سایت
Nov 12, 2009
3,047
نام
امیر محمود
یکی از تفاوت های اصلی حافظهL2نسبت به GT200این است همانطور در جدول مشخص شده حافظه فقط خواندنی نیست بلکه نوشتنی هم هست! یعنی READ/WRITE!

فکر می کنم یکی از عوامل برتری انویدیا در DX11 TESSLATIONهمین Polymorph Engineهست!که همانطور وحید جان اشاره کرد فاصله بین راس ها را پر میکنه!

ضمنا در معماری GF104ما دو تا GPCداریم اما در GF100ما چهار تا GPCداریم که عملکرد کارت را در DX11ببینید چقدر زیاد می کنه!

12788968667K0gVsvzTK_1_6_l.jpg


اما کارایی کارت ها در مجموع در 104و100اینطوریه!(همین کارایی 460نسبت به 480 که حدود 1.6برابر کمتر هست باعث قیمت کارایی فوق العاده شده!)

یعنی 2 برابر هم کارایی 100و104 نیست اما قیمت حدودا3 برابر هست!

GTX400_Series.jpg


GPC=GRAPHICS PROCESSING CLUSTERS
 
آخرین ویرایش:

کاربرانی که این قسمت را مشاهده می‌کنند

Top
رمز عبور خود را فراموش کرده اید؟
or ثبت‌نام سریع از طریق سرویس‌های زیر