خوب دوستان همونطور که میدونید مشخصات کلی کپلر اصلی و بزرگ در GTC2012 مشخص شد و حالا با اینکه خیلی به عرضه GK110 در بخش Gforce ها مونده و ما فعلا این هیولارو قسمت نیست ببنیم یک برسی اجمالی و کوتاه و تفاوت های اون با GK104 تراشه میان رده انودیا میکنم.
همونطور که میدونید انودیا در بخش تسلا ها باید تنها به روی نه تنها قدرت محاسباتی تراشه - بلکه کارایی تراشه در کنار کار با دیگر همنوعانش به صورت جریانی موفق باشه.
پس بیاید این بار برخلاف گذشته از سطح بالا به سطح پایین و اجزای تراشه نگاه کنیم:
اول از همه این DIE SHOT و شامل کل احزای تراشه در یک تصویر هست(خبری از هسته های ARM نیست)
همونطور که میبینید ابعاد setup pipline ها نسبت به GK104 اصلا تفاوتی نداشته اما smx ها بعدا خواهد دید بسیار بزرگتر شدن و قیاسشون در beyond3d هست.
این بلاک دیاگرام GK110 عظیم :
خوب بیاید دقیق تر به کل تراشه نگاه کنیم :
همونطور که میبینید تراشه شامل 15smx هست که البته هر smx تفاوت هایی هایی داره که در نهایت باعث میشه smx های GK110 بسیار نیرومند باشن.
بیاید به هر SMX در کپلر نگاهی بیندازیم:
هموطور که میبینید بر خلاف SMX های GK104 این SM دارای بخش های زرد رنگی به نام DP Unit هست که همان هسته های double precision هستن.
command processor ابعادش چند برابر (شاید نزدیک به 4 برابر GK104) شده اما تراشه بدون داشتن 1SMX دیگه نسبت به 690 تقریبا بیش از 2 برابر ترانزیستور روی سطحش موجوده(خب در نظر بگیرید ابعاد Setup pipline ها هیچ تفاوتی نکردن )
dp رو من قبلا توضیح دادم بزارید اینجا هم بگم:
Dynamic parallisim :
این درواقع کلید اصلی براورده کردن هردو نیاز ILP-TLP بودن تراشه برای امور محاسباتی هست .
این قابلیتی هست که انودیا اون رو به صورت هر کنرل میتونه کرنل بعدی رو اعزام یا ISSUE کنه وصف کرده - به این معنا که در نسل قبل یعنی فرمی تراشه برای برسی و انطباق تراشه با کرنل های جدید برای انجام اعمالش نیاز به این داشته که به پردازنده برگرده و کرنل جدید رو دریافت کنه - در نسل جدید این قابلیت DP هست که وظیفه اعزام دوباره کرنل هارو داره و تراشه به صورت خود کفا بدون بازگشت به پردازنده این کار رو انجام میده.
این جز کلید ای اصلی Autonomously شدن SMX هاست و از قابلیت ها بسیار مهم اون تلقی میشه.
Feature بعدی همون HYPER-Q هست که در بخش سری 700 توضیح دادم و بیشتر به درد انتباق با راک های تسلا که پردازنده های زیادی نیاز به دسترسی به منابع GPU دران میخوره - با 32 تایی کردن صف های دسترسی پردازنده ها به هسته های بیشمار تراشه کپلر .(شکل ننگین زیر : دی )
خوب بیایم یک مروری به مشخصات کلی و تایید شده بندازیم :
2 نکته در این تصویر جالبه - 1 وجود واحد ECC نسل 2 برای خطا یابی بهتر داده های با دقت 64bit و اینکه نسبت fp32 به fp64 ها اونی نیست که قدیم فکر میکردیم - نسبت درواقع 1:3 هست و در گذشته تصور میشد 1:2 هست.
قدرت محسباتی Double precision بالای 1.5 ترافلاپس هست که به نسبت نسل تسلا m2090 نزدیک به 3 برابر میشه.
یکی دیگه از ویژگی های جدید تراشه احتصاص 255 رجیستر به ازای هر ترد هست که با این ویژگی انودیا توسنته ISA های جدید رو برای تراشه فراهم کنه.در نسل فرمی این تا 63 رجیستر محدود بود.
البته این ISA های جدید بیشتر به درد بخش Fp64 ها میخوره اما در نهایت توان برنامه ریزی ترشارو میتونه بسیار بالا ببره و HPC ها میتونن بسیار بهتر عمل کنن.
این بود پیش نمایش حظور اصلی کپلر در اینده - خیلی از توضیحات دیگه SMX ها در تاپیک GK104 داده شده م اینجا به برسی چند ویژگی جدید تراشه پرداختیم.
اگر سوالی درمورد کپلر GK110 بود حتما بفرمایید در همین تا خدمتتون توضیح بدم
موفق باشید
,ویرایش:
خاک بر سر سایت المانی pcgameshardware. کنن که واسه سورساش deep link restricted گذاشته - راستش منم اصلا حال اپلود جای دیگه ندارم (اما واقعا خاک )
آخرین ویرایش: