پیش برسی کپلر GK110 در بخش تسلا HPC : تراشه ای برای Cloud Computing

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
DSC_5080.JPG



Tesla_GK104_K10_3Qtr_Covr_575px.jpg

Tesla_GK110_K20_3Qtr_NCovr_575px.jpg


خوب دوستان همونطور که میدونید مشخصات کلی کپلر اصلی و بزرگ در GTC2012 مشخص شد و حالا با اینکه خیلی به عرضه GK110 در بخش Gforce ها مونده و ما فعلا این هیولارو قسمت نیست ببنیم یک برسی اجمالی و کوتاه و تفاوت های اون با GK104 تراشه میان رده انودیا میکنم.


همونطور که میدونید انودیا در بخش تسلا ها باید تنها به روی نه تنها قدرت محاسباتی تراشه - بلکه کارایی تراشه در کنار کار با دیگر همنوعانش به صورت جریانی موفق باشه.


پس بیاید این بار برخلاف گذشته از سطح بالا به سطح پایین و اجزای تراشه نگاه کنیم:


اول از همه این DIE SHOT و شامل کل احزای تراشه در یک تصویر هست(خبری از هسته های ARM نیست)


nvidia_gk110_die.jpg

155a.jpg


همونطور که میبینید ابعاد setup pipline ها نسبت به GK104 اصلا تفاوتی نداشته اما smx ها بعدا خواهد دید بسیار بزرگتر شدن و قیاسشون در beyond3d هست.


این بلاک دیاگرام GK110 عظیم :


DSC_5081.JPG




خوب بیاید دقیق تر به کل تراشه نگاه کنیم :


GK110Block.png


همونطور که میبینید تراشه شامل 15smx هست که البته هر smx تفاوت هایی هایی داره که در نهایت باعث میشه smx های GK110 بسیار نیرومند باشن.


بیاید به هر SMX در کپلر نگاهی بیندازیم:


GK110SMX.png


هموطور که میبینید بر خلاف SMX های GK104 این SM دارای بخش های زرد رنگی به نام DP Unit هست که همان هسته های double precision هستن.


command processor ابعادش چند برابر (شاید نزدیک به 4 برابر GK104) شده اما تراشه بدون داشتن 1SMX دیگه نسبت به 690 تقریبا بیش از 2 برابر ترانزیستور روی سطحش موجوده(خب در نظر بگیرید ابعاد Setup pipline ها هیچ تفاوتی نکردن :D)


dp رو من قبلا توضیح دادم بزارید اینجا هم بگم:


Dynamic parallisim :


DyPar_575px.png


این درواقع کلید اصلی براورده کردن هردو نیاز ILP-TLP بودن تراشه برای امور محاسباتی هست .


این قابلیتی هست که انودیا اون رو به صورت هر کنرل میتونه کرنل بعدی رو اعزام یا ISSUE کنه وصف کرده - به این معنا که در نسل قبل یعنی فرمی تراشه برای برسی و انطباق تراشه با کرنل های جدید برای انجام اعمالش نیاز به این داشته که به پردازنده برگرده و کرنل جدید رو دریافت کنه - در نسل جدید این قابلیت DP هست که وظیفه اعزام دوباره کرنل هارو داره و تراشه به صورت خود کفا بدون بازگشت به پردازنده این کار رو انجام میده.


این جز کلید ای اصلی Autonomously شدن SMX هاست و از قابلیت ها بسیار مهم اون تلقی میشه.


Feature بعدی همون HYPER-Q هست که در بخش سری 700 توضیح دادم و بیشتر به درد انتباق با راک های تسلا که پردازنده های زیادی نیاز به دسترسی به منابع GPU دران میخوره - با 32 تایی کردن صف های دسترسی پردازنده ها به هسته های بیشمار تراشه کپلر .(شکل ننگین زیر : دی )


HyperQ2_575px.png


خوب بیایم یک مروری به مشخصات کلی و تایید شده بندازیم :


91521746053626333483.jpg


2 نکته در این تصویر جالبه - 1 وجود واحد ECC نسل 2 برای خطا یابی بهتر داده های با دقت 64bit و اینکه نسبت fp32 به fp64 ها اونی نیست که قدیم فکر میکردیم - نسبت درواقع 1:3 هست و در گذشته تصور میشد 1:2 هست.


قدرت محسباتی Double precision بالای 1.5 ترافلاپس هست که به نسبت نسل تسلا m2090 نزدیک به 3 برابر میشه.


یکی دیگه از ویژگی های جدید تراشه احتصاص 255 رجیستر به ازای هر ترد هست که با این ویژگی انودیا توسنته ISA های جدید رو برای تراشه فراهم کنه.در نسل فرمی این تا 63 رجیستر محدود بود.


DSC_5086.JPG


البته این ISA های جدید بیشتر به درد بخش Fp64 ها میخوره اما در نهایت توان برنامه ریزی ترشارو میتونه بسیار بالا ببره و HPC ها میتونن بسیار بهتر عمل کنن.


این بود پیش نمایش حظور اصلی کپلر در اینده - خیلی از توضیحات دیگه SMX ها در تاپیک GK104 داده شده م اینجا به برسی چند ویژگی جدید تراشه پرداختیم.


اگر سوالی درمورد کپلر GK110 بود حتما بفرمایید در همین تا خدمتتون توضیح بدم


موفق باشید


,ویرایش:


خاک بر سر سایت المانی pcgameshardware. کنن که واسه سورساش deep link restricted گذاشته - راستش منم اصلا حال اپلود جای دیگه ندارم (اما واقعا خاک )
 
آخرین ویرایش:

کاربرانی که این قسمت را مشاهده می‌کنند

Top
رمز عبور خود را فراموش کرده اید؟
or ثبت‌نام سریع از طریق سرویس‌های زیر