چیزی که شما نقل قول کردید کم و بیش درسته منتهی نظر نا کامل شخصی خارج از تیم اکسید هست، دلیل دقیقتر این تفاوت رو خود سازنده بازی امروز بیان کرده که میتونید در این پست بخونید:
[Various] Ashes of the Singularity DX12 Benchmarks - Page 121
در واقع گفته که انجین اونها که تحت DX12 هست از Async Compute پشتیبانی میکنه و در حالی که درایورهای GPUهای Nvidia نشون میدن که از Async Compute پشتیبانی میکنن اما در عمل توانایی این کار رو ندارن یا احتمالاً میشه گفت برای انجام این کار از راههای نرم افزاری استفاده میکنن (بر خلاف GPUهای AMD با معماری GCN که ساپورتش از این قابلیت سخت افزاری هست). و حتی گفته که اونها به درخواست Nvidia این قابلیت رو برای کارتهای Nvidia خاموش کردن. این در حالی هست که گفتن با استفاده از Async Compute میشه حدود 30% به پرفورمنس بازیها اضافه کرد (البته این یک چیز ثابت نیست و میتونه کمتر هم بشه بسته به نوع بازی). در این تصویر هم میتونید ببینید که هر معماری این دو شرکت چند تا دستور گرافیکی و چند تا دستور محاسباتی رو میتونه ساپورت کنه:
سه تا نکته در مورد جدول بالا وجود داره:
1- برای GCN 1.0 تعداد ACE ها و Queueها برابر هستن، یعنی GCN 1.0 کلاً دو تا Queue داره.
2- برای GCN 1.1/1.2 تعداد Queueها در هر ACE هشت تا هست (یعنی باید ضرب در 8 بشه). یعنی GCN 1.1/1.2 دارای 64 Queue هستن.
3- برای معماری GCN (نسل اول تا سوم) انجام کامپیوت و گرافیک بطور همزمان امکان پذیر هست یعنی Compute Processorها و Command Processor میتونن در کنار هم کار کنن. اما برای GPU های Nvidia فقط سری Maxwell 2 دارای این قابلیت هست که اون هم احتمالاً بخاطر مناسب نبودن طراحیش در مقایسه با 290X نتونسته خوب ظاهر بشه.
در واقع دلیل اصلی این تفاوتها پشتیبانی ضعیف Nvidia از Async Compute بیان شده (که این هم حدس یا اطلاعات دسته اول سازنده انجین بازی هست). اما هنوز مقایسهای انجام نشده که نشون بده چه مقدار Queue برای انجام این محاسبات کافی، چه مقدار از اونها بهینه هستن. PS4 از 64 Queue برای GPUـش استفاده کرده و XB1 هم از 16 تا Queue (که فکر میکنم مشابه 7790 باشه) در کنار دو تا Command Processor استفاده کرده.
نکته مثبت این هست که تمامی GPUهای AMD که با معماری GCN هستن از این قابلیت پشتیبانی میکنن و کلاً برای بکارگیری چنین روشهایی انعطاف پذیری بیشتری دارن.
با این حساب اختلاف فنی و پتانسیلی که gpu ps4داره تا چند وقت دیگه باید انتظار اختلاف بازدهی بیشتری نسبت به xone هم باشیم
Ashes of the Singularity الان مقایسه درستی نیست که دارید میکنید حرف انودیا کاملا درست
ساپورت نداشتن بازی از کارت انودیا ، الان تمام دمو که با موتور UE4 انجام شده افزایش پروفنمنس انودیا میشه دید
Unreal Engine 4 Elemental DX12 در یوتیوب سرچ کنید یا فایل میتونید بگیرید که 1 گیگ حجم
با این حساب اختلاف فنی و پتانسیلی که gpu ps4داره تا چند وقت دیگه باید انتظار اختلاف بازدهی بیشتری نسبت به xone هم باشیم
اوکساید رو نمیدونم قضیش چی هست ولی تا اونجا که من دیدم سری 9 انویدیا قابلیت هندل 31 compute queues داره حتی طوری طراحی شده که تو حالت Compute mode خالص 32 تا compute queues رو هندل کنه.
مسأله دقیقاً همین هست که 980 ti که آخرین معماری و بیشترین پرفورمنس GPUهای Nvidia رو داره روی DX12 نتایج مشابه 290X ارائه میده و به درخواست Nvidia قابلیت Async Compute رو برای این GPU غیر فعال کردن (این یعنی تعداد 32 تا Compute Queue صرفاً مهم نیست و نوع طراحی و انعطاف پذیریش هم مهمه) و حتی سازنده موتور بازی هم برگشته گفته GPUهای Nvidia از Async Compute ساپورت نمیکنن و نمیدونن چرا درایورهای Nvidia طوری نشون میدن که انگار از Async Compute ساپورت میکنه. حالا این وسط کی اشتباه میگه و کی درست رو باید صبر کرد و دید.
یه دوستی خصوصی گفت که اگه برای این حرفا منبع داری بزار:تو بازیای PS4 همین الان دارن از Async compute استفاده میکنن چون این قابلیت از روز اول فعال بوده نمونش Battlefield و ISS, احتمالا اولین بازی ایکه روی Xone از Async compute استفاده کنن TR باشه.
eSRAM خوراک Async compute هست.
منم اتفاقا همین تیکه پست طرف رو خوندم تعجب کردم توی بنچمارک Async compute کلا روی کارت انویدیا شات دان شده در حالیکه یه سایتی مثل Anandtech نوشته این قابلیت رو داره:
AMD Dives Deep On Asynchronous Shading
خیلی عجیبه که این فیچر رو نداشته باشه ولی جزو فیچرهاش لیست کرده باشن!!!!
- - -ویرایش - - -
یه دوستی خصوصی گفت که اگه برای این حرفا منبع داری بزار:
منبع اول اسلایدهای AMD هست.
لینک
منبع دوم هم اسلایدهای مایکروسافت هست
منبع سوم هم گفته های سازنده بازی هست که توی تاپیک بازی تو قسمت xo لینکشو گذاشتم.
Ryan Cooper: We’re really excited about DX12 and I think there is going to be a ton of potential with that. However, We’re don’t have any plans for using DX12 in Forza Motorsport 6.
Ashes of the Singularity فقط در مورد DX12 و APIـه Low Level و Overhead پایین برای CPU و ... نیست. اتفاقاً روی GPUهای Nvidia بازی رو خیلی خوب برای DX11 بهینه کردن و خود نتایج هم نشون میدن (این بهینه سازیها یک ماه قبل از اینکه این بنچمارکها بیرون بیان انجام شدن). بحث اینجا سر یک قابلیت هست که حتی جزو Feature Levelهای DX12 هم معرفی نشده (همون Multiengine یا Async Compute) که در معماری GCN بسیار بهتر و کاملتر کار شده و میتونه تأثیر مستقیم روی بهرهوری GPU و کیفیت گرافیکی بازیها داشته باشه و حتی در کنار این قابلیت، قابلیتهای دیگهی DX12 هم هستن که میتونن باز به بهینهتر شدن کدها و ماکزیمم شدن پرفورمنس GPUها کمک کنن (و حتی چیزهای جدیدتر و بیشتری هم برای اضافه شدن به فیچرهای کلی DX12 هم وجود دارن که هنوز اضافه نشدن).
اینکه DX12 میتونه به بازیهایی مثل Ashes of the Singularity که استراتژی هستن و آبجکتهای زیادی رو همزمان برای پردازش دارن (CPU Bound هستن) کمک کنه یک بحث هست و اینکه با Async Compute میشه از واحدهای پردازشی GPU که به دلایل مختلف و در مراحل مختلف کار نمیکنن استفاده کرد و حدود 30% پرفورمنس بالاتر گرفت هم یک بحث دیگست. این دو تا رو نباید با هم قاطی کرد. مورد اول برای بازیهایی خوب هست که به این منظور طراحی شدن ولی مورد دوم میتونه برای خیلی از بازیها با انجین بروز صدق کنه.
این بنچمارک از نسخه بتا این بازی ـست و خیلی وقت هم هست منتشر شده و بازخورد های بسیاری داشته ، مسئله مربوط به عدم توانایی پردازش ناهمگام پردازشگر انویدیا هست که به احتمال بسیار زاد نرم افزاری ـست و مشکل قابل رفع ـست و مشکلی وجود نداره . اگه دقت کنید میبینید که در DX12 کاهش پرفورمنس رو مشاهده میکنید در انیویا.
=========================
می تونه برای دوستان جالب باشه R9 290X نسل قبل با GTX 980 TI نسل حاضر تفاوت ها در حدو 2 الی 3 فریم در وضوح تصویر متفاوت
این بنچمارک از نسخه بتا این بازی ـست و خیلی وقت هم هست منتشر شده و بازخورد های بسیاری داشته ، مسئله مربوط به عدم توانایی پردازش ناهمگام پردازشگر انویدیا هست که به احتمال بسیار زاد نرم افزاری ـست و مشکل قابل رفع ـست و مشکلی وجود نداره . اگه دقت کنید میبینید که در DX12 کاهش پرفورمنس رو مشاهده میکنید در انیویا.