DX12 دارای قابلیتهایی برای نسل آینده GPU ـها خواهد بود.[ پست اول تاپیک حتماً خوانده ]

BOBBY ROODE

کاربر سایت
Feb 27, 2014
108
نام
Saeed
ساخت DX12 با کم کردن Overhead روی GPU ـهای nVidia زمان DX11 استارت خورده و مدتها قبل از رونمایی رسمی از DX12 ادامه داشته از اونجایی که DX یک API یونیورسال هست و همه نوع GPU رو ساپورت میکنه خیلی طبیعی هست که باید با همه کمپانیها همکاری کنن ولی شکی نیست که استارت این پروژه با انویدیا بوده، دلیل اینکه مایکروسافت AMD رو برای ساختن کنسول انتخاب کرده این نبوده که از اسم AMD خوشش میومده یا یکی تو مایکروسافت فن AMD بوده دلیلش اینه که برای پروژه ساخت Xbox one رقم پیشنهادی AMD از بقیه کمپانیها به قول خودشون Profitable ـتر بوده، درضمن مایکروسافت از AMD امتیاز سیلیکن GCN رو خریده و فقط لایسنس نکرده، یعنی با این قرارداد رسما میتونه الان GPU تولید کنه و به جمع شرکتهای سازنده GPU اضافه بشه، قراردادی که بعید بوده بتونه با nVidia ببنده مگر به قیمت خیلی خیلی بالا.
تنها کارتهایی که الان FL 12_1 رو ساپورت میکنن سری 900 انویدیا هستن، اگر توی این چند ماهه کنفرانسهای مرتبط با توسعه و ساخت گیم رو دیده باشین علی الخصوص SIGGRAPH 2015 اکثر انجین سازها دارن میرن سمت تکنیکهای Voxelization برای نورپردازی و ... دقیقا چیزی که انویدیا سخت افزارهای شتابدهنده براشون تعبیه کرده و FL 12_1 تاکید خیلی زیادی روی به کارگیری این نوع الگوریتمها دارن.



GeForce GTX 980 Ti - DX12 Feature Level and Tier Details - Legit Reviews

https://developer.nvidia.com/content/basics-gpu-voxelization

https://msdn.microsoft.com/en-us/library/windows/desktop/dn914605(v=vs.85).aspx?f=255&MSPPError=-2147217396

اگر AMD نتونه تو فاصله کوتاه نبودن FL ـهای 12.1 رو روی کارتهاش جبران کنه بدون هیچ شکی تو بازیهای آینده مشکل پیدا میکنه چون روز به روز تعداد استودیوهایی که دارن از این تکنیکهای جدید برای توسعه انجین استفاده میکنن بیشتر میشه، و این الگوریتمها به احتمال قریب به یقین روی GPUـهای AMD به خاطر نبودن سخت افزار پشتیبانی کننده کندتر از nVidia اجرا میشن.
نه ندیدم یعنی وقت نکردم ... مرسی که گفتین عزیز فکر میکنم باید بزارمش تو لیست دانلود
Dx12.1 فعلا که بازی قرارنیست ازش استفاده کنه ولی بعیده سری 400 از این استاندارد DX پشتیبانی نکنه وگرنه وضع ای ام دی بدتر از اینم میشه
در مورد فیوچر vxgi که یکی از قابلیت های DX12.1 هست که انویدیا توصعه داده ... سازنده کوانتوم بریک هم گفته از قابلتیتی شبیه vxgi استفاده میکنه در حالی که کنسول ایکس1 به صورت سخت افزاری از 12.1 پشتیبانی نمیکنه ..... و با همکاری ای ام دی یا مایکرو ساختن
{ اینم بگم منصف باشیم با 100 دلار که به ای ام دی میدن سخت افزار کنسول های نسل هشت خوبه ... حالا سرمایه گزاران انویدیا بیاین به من بر چسب ای ام دی فن بوی بزنین }

فکر میکنم شما اشتباه به خاطرت میاد. کدهای Mantle در واقع برای Vulkan (که API نسل بعدی OpenGL هست) بکار گرفته شده و در واقع کدهای Vulkan به هیچ وجه با کدهای OpenGL سازگاری نداره و برای اینکه GPU شما بتونه از Vulkan پشتیبانی کنه به درایورهای جدید نیاز خواهید داشت. اما DX12 با اینکه همه/اکثر ویژگیهای مهم این دو API رو داره با ورژن های قبلی خودش هم سازگار هست و اینطور نیست که تماماً جدید باشه.

صرف نظر از اینکه مایکروسافت کارش در ارتباط با DX12 رو با کدوم یک از این شرکتها شروع کرده باشه باید به این نکته توجه داشت که DX12 در GDC 2014 معرفی شد (اگر اشتباه نکنم) و از اون زمان تا الان حدوداً 2 سال زمان داشته/داره تا بخواد از سایر شرکتها هم برای بهتر کردن API خودش استفاده کنه. اما نکته مهم این هست که زمانی که مایکروسافت برای اولین بار از DX12 پرده برداری کرد یک دموی آماده برای GPUهای Nvidia داشت و روی اون دموی Forza 5 با استفاده از DX12 رو نشون داد و بعد هم که یک دمو برای Intel تدارک دیدن و هر دوی این شرکتها از نظر درایور و ساپورت جلوتر از AMD بودن. حتی برای اولین بار در نمایش Dx11.2 هم مایکروسافت از GPUهای Nvidia استفاده کرد. پس عجیب نیست که Nvidia تونسته GPUـی با فیچر لول DX12_1 عرضه کنه و بیش از یکسال جلوتر از AMD باشه (در یسری قسمتها، مثلاً GPUهای AMD در کامپیوت بهتر از Nvidia عمل میکنن که همین یکی از نقاط قوت DX12 هم هست، هرچند جزو FLها نیومده).
اما شاید بشه گفت که از اونجایی که Ashes Of Singularity اولین بار با استفاده از منتل روی GPUهای AMD به نمایش دراومده پس انجین این بازی با GPUهای AMD سازگارتر هست.
درسته عزیز
در مورد DX12 در واقع بین اجرای بازی و سخت افزار فاصله کم میشه و دیگه درایور نقش خاصی این بین نمیتونه ایفا کنه ... شاید موتور انجین بازی برای ای ام دی اپتیمایز باشه با این که سازنده بازی گفته با هر سه شرکت اینتل و ای ام دی و انویدیا چند ماه بازی رو برای سخت افزارشون بازی اپتیمایز کردیم/کردن .... با DX11 انویدیا ای ام دی رو لوله میکنه و این حرف که اپتیمایز ای ام دی هست وارد نیست .... ولی با DX12 نتیجه چیز دیگه ای هست
شاید چون این بازی از قابلیت مخصوص معماری جی سی ان asynchronous shaders استفاده میکنه این جوری کارتای ای ام دی بهتر کار میکنند .....
بر هر حال Fable Legends در راهه .... که از UE4 استفاده میکنه که با انویدیا همکاری نزدیکی داره .... ببینیم این نبرد DX12 چی میشه


نسل قبل خیلی داستانش فرق داشت wii باعث شد امار فروش به هم بخوره 1 نواوری تازه باعث تغییر در نسل شد اما در نهایت اخرای نسل برای همه عادی شد فروشش خیلی افت کرد.

در نهایت هر 3 کنسول نسل قبل عالی فروختن همه 3 تا هم برنده شدن حالا حتما نباید 100 ملیون تا نسخه رکوردش زده بشه که حتی همین ps4 هم براش تضمینی نیست که 100 تا هم بزنه مگه همین شکل ادامه پیدا کنه

این رو در نظر داشته باشید که نسل قبل فروش بین 3 کنسول تقسیم شد اما الان افتاده دست ps4

خلاصه اینکه من حاضرم بیشتر خرج کنم جنس بهتر و با کیفیت تر بگیرم بعضی ها هم ارزان ترین مد نظرشون هست(هر چند در نهایت این عده بیشتر از لحاظ مالی در خرج می افتن تازه کلی هم عذاب می کشن) حتی کیفیت ساخت دسته با جنس بدنه دستگاه های این نسل هم به مراتب افت کرده

اصلا من نمی فهمم چراهر چیزی می گم به کنسول ختم می شه حرف من سر amd هست که باعث افت ati سابق هم شده تنها 18 درصد بازار هم الان دستشه 82 درصد برای nvidia شده اما اینکه چرا 1 عده nvidia مسخره می کنن مشخص نیست دیگه بهتر از nvidia نداریم که حتی در بازار موبایل هم با اختلاف بسیار زیاد بهترین بنچمارک ها برای nvidia هست هر چند به خاطر قیمت بالا با مصرف زیادش کسی زیاد سمتش نمی ره
چی میزنی ؟
من خودم هم انویدیا داشتم و هم ای ام دی
ATI رو دوست داشتم و وقتی amd خریدش فکر میکردم این جوری باعث پیشرفت amd در cpu و gpu میشه و بهتر پیش میره با هم .... ولی این جوری نشد
این که همیشه طرفداران سونی / انویدیا رقیب رو تخریب و تحقیر میکنند شکی نیست .... فقط چون همه خودشون رو درست کار میبینند واقعیت مشخص نیست
با این که نظر مثبتی به AMD دارم ... ولی چون به بی راهه رفته .... خرید بعدیم یک کارت از شرکتی هست که پاسکال رو میده بیرون .... ازش خوشم نمیاد ....ولی کارتش که گناهی نکرده : دی
در مورد بنچ که گزاشتم با لحنی رک و کمی تند صحبت کردم این بود این همه ای ام دی رو مسخره میکردن سرمایه گزاران انویدیا ، این جوری شد اولین بازی DX12 !
بعش هم شما مصرف کارت ......... سهم بازار ..... و قاطی کردی مثل این که عنوان تاپیک رو نخوندی
باشه .... فقط تصور کن ای ام دی نباشه همین Fury داغون به قول شما ها رو ، رو کنه .... اون وقت عشقتون انویدیا چطوری حالتون رو میگره ... پاسکال هم اومد gameworks زیاد برای مکسول اپتیمایز نمیشه ... همون طور که gtx 780ti با فعال بودن تمام تنظیمات گیم ورکس در پروجکت کارز از 960 پیشی نگرفت ! منتظر باشین پاسکال هم بیاد همین اتفاق برای مکسول بیافته !
در اخر معذرت که کمی تند صحبت کردم { شکلک گل چرا نیست : دی}
 
آخرین ویرایش:

benjohn

کاربر سایت
Jun 19, 2012
4,528
نام
ehsan
چند روز گذشته DF طی مقاله ای پرفورمنس DX12 رو روی کارتهای AMD و nVIDIA با استفاده از بنچمارک Ashes of the Singularity بررسی کرده بود که نتایج واقعا عجیب غریبی حاصل شده بود. من طی این پست مقاله رو تا حدی منعکس کردم


DFمقاله منتشر کرده و پرفورمنس DX12 رو روی پی سی بررسی کرده
متاسفانه با تبلت پست میدم و نمیتونم کامل مقاله رو منعکس کنم فقط بطورخلاصه DX12 بیشر روی سی پی یو موثره و گاهی این تاثیر تا ۷۵ درصد هم میرسه
منتها پرفورنس روی محصولات AMD به مراتب بهتر ز nVIDIA و Intel بوده (حداقل در حال حاضر)

مشخصا سی پی یوهایی که تعداد هسته های بالاتری دارن (معماری AMD) به مراتب سود بیشتری از DX 12 میبرن


مشخصا طراحی کنسولای نسل حاضر هم با این دید صورت گرفته


طی بنچمارک ارائه شده کارتی مثل R9 290 x که در در DX11 بسیار ضعیفتر از Titan X است ( 50%) در DX12 پرفورمنسی برابر ارائه میکنه حتی گاهی حتی پرفورمنس بهتری داره

به طبعش سرو صدای زیادی در بردهای مختلف به راه افتاد حالا Oxide سازنده این بنچمارک توضیح داده که این تفاوت عجیب و غریب بین کارتها AMD و nVIDIA از کجا حادث شده


AMD’s DirectX 12 Advantage Explained – GCN Architecture More Friendly To Parallelism Than Maxwell
Oxide میگه معماری GCN شرکت AMD به مراتب نسبت به Maxwell با پردازش موازی همخوانی بیشتری داره.

As Mahigan pointed out, Maxwell’s Asychronous Thread Warp can queue up 31 Compute tasks and 1 Graphic task, whereas AMD’s GCN 1.1/1.2 is composed of 8 Asynchronous Compute Engines (each able to queue 8 Compute tasks for a total of 64 coupled) with 1 Graphic task by the Graphic Command Processor.
توضیح داده شده که معماری Maxwell شرکت nVidia در پردازش های موازی و غیر همزمان میتونه 31 کار/پردازش رو انجام بده ولی GCN AMD میتونه 64 تا رو پردازش کنه این به این معناست که در در DX12 معماری AMD به مراتب کارآمد تره



This basically means that in terms of parallelism, GCN GPUs should be able to surpass their direct Maxwell rivals, something we’ve been witnessing in the Ashes of the Singularity benchmark.

البته معماری Maxwel در DX11 عملکرد بهتری داشته و احتمالا خواهد داشت.

“nVIDIA, on the other hand, does much better at Serial scheduling of work loads (when you consider that anything prior to Maxwell 2 is limited to Serial Scheduling rather than Parallel Scheduling). DirectX 11 is suited for Serial Scheduling therefore naturally nVIDIA has an advantage under DirectX 11.”


“People wondering why Nvidia is doing a bit better in DX11 than DX12. That’s because Nvidia optimized their DX11 path in their drivers for Ashes of the Singularity. With DX12 there are no tangible driver optimizations because the Game Engine speaks almost directly to the Graphics Hardware. So none were made. Nvidia is at the mercy of the programmers talents as well as their own Maxwell architectures thread parallelism performance under DX12. The Devellopers programmed for thread parallelism in Ashes of the Singularity in order to be able to better draw all those objects on the screen. Therefore what we’re seeing with the Nvidia numbers is the Nvidia draw call bottleneck showing up under DX12. Nvidia works around this with its own optimizations in DX11 by prioritizing workloads and replacing shaders. Yes, the nVIDIA driver contains a compiler which re-compiles and replaces shaders which are not fine tuned to their architecture on a per game basis. NVidia’s driver is also Multi-Threaded, making use of the idling CPU cores in order to recompile/replace shaders. The work nVIDIA does in software, under DX11, is the work AMD do in Hardware, under DX12, with their Asynchronous Compute Engines.”


به اعتقاد Oxide شرکت nVIDIA تمامی تلاش خودش رو معطوف DX11 کرده ولی از اون سمت AMD بیشتر روی DX12 متمرکز بوده. دلیل اینکه nVidia در DX11 اینقدر بهتر عمل میکرده هم همین بوده.

“But what about poor AMD DX11 performance? Simple. AMDs GCN 1.1/1.2 architecture is suited towards Parallelism. It requires the CPU to feed the graphics card work. This creates a CPU bottleneck, on AMD hardware, under DX11 and low resolutions (say 1080p and even 1600p for Fury-X), as DX11 is limited to 1-2 cores for the Graphics pipeline (which also needs to take care of AI, Physics etc). Replacing shaders or re-compiling shaders is not a solution for GCN 1.1/1.2 because AMDs Asynchronous Compute Engines are built to break down complex workloads into smaller, easier to work, workloads. The only way around this issue, if you want to maximize the use of all available compute resources under GCN 1.1/1.2, is to feed the GPU in Parallel… in comes in Mantle, Vulcan and Direct X 12.”



نکته قابل ذکر اینه که در کارتهای سری GCN واحدهای ACE وجود دارن که وجودشون باعث این برتری شده.

این مقاله کاملا توضیح داده که وظیفه این موتورها دقیقا چیه و چه کاری انجام میدن


مشخصا کارتهای سری GCN و کنسولهای نسل 8 براساس این معماری طراحی شدن.
در PS4 دقیقا 8 عدد واحد ACE وجود داره و GPU ی اکس باکس وان هم از 2 ACE بهره میبره که در آینده ممکنه فاصله پرفورمنس دو کنسول رو بیشتر از این افزایش بده
 
آخرین ویرایش:

Tommy Fisher

Shit happens
کاربر فعال
Apr 5, 2009
5,954
نام
رضـا
مشخصا کارتهای سری GCN و کنسولهای نسل 8 براساس این معماری طراحی شدن.
در PS4 دقیقا 8 عدد واحد ACE وجود داره و GPU ی اکس باکس وان هم از 2 ACE بهره میبره که در آینده ممکنه فاصله پرفورمنس دو کنسول رو بیشتر از این افزایش بده
"Our belief is that by the middle of the PlayStation 4 console lifetime, asynchronous compute is a very large and important part of games technology." - Mark Cerny
 

LiviNG D3AD

کاربر سایت
Dec 7, 2008
3,141
نام
Mohsen
چند روز گذشته DF طی مقاله ای پرفورمنس DX12 رو روی کارتهای AMD و nVIDIA با استفاده از بنچمارک Ashes of the Singularity بررسی کرده بود که نتایج واقعا عجیب غریبی حاصل شده بود. من طی این پست مقاله رو تا حدی منعکس کردم
چیزی که شما نقل قول کردید کم و بیش درسته منتهی نظر نا کامل شخصی خارج از تیم اکسید هست، دلیل دقیقتر این تفاوت رو خود سازنده بازی امروز بیان کرده که میتونید در این پست بخونید:

[Various] Ashes of the Singularity DX12 Benchmarks - Page 121

در واقع گفته که انجین اونها که تحت DX12 هست از Async Compute پشتیبانی میکنه و در حالی که درایورهای GPUهای Nvidia نشون میدن که از Async Compute پشتیبانی میکنن اما در عمل توانایی این کار رو ندارن یا احتمالاً میشه گفت برای انجام این کار از راه‌های نرم افزاری استفاده میکنن (بر خلاف GPUهای AMD با معماری GCN که ساپورتش از این قابلیت سخت افزاری هست). و حتی گفته که اونها به درخواست Nvidia این قابلیت رو برای کارتهای Nvidia خاموش کردن. این در حالی هست که گفتن با استفاده از Async Compute میشه حدود 30% به پرفورمنس بازیها اضافه کرد (البته این یک چیز ثابت نیست و میتونه کمتر هم بشه بسته به نوع بازی). در این تصویر هم میتونید ببینید که هر معماری این دو شرکت چند تا دستور گرافیکی و چند تا دستور محاسباتی رو میتونه ساپورت کنه:


سه تا نکته در مورد جدول بالا وجود داره:

1- برای GCN 1.0 تعداد ACE ها و Queueها برابر هستن، یعنی GCN 1.0 کلاً دو تا Queue داره.
2- برای GCN 1.1/1.2 تعداد Queueها در هر ACE هشت تا هست (یعنی باید ضرب در 8 بشه). یعنی GCN 1.1/1.2 دارای 64 Queue هستن.
3- برای معماری GCN (نسل اول تا سوم) انجام کامپیوت و گرافیک بطور همزمان امکان پذیر هست یعنی Compute Processorها و Command Processor میتونن در کنار هم کار کنن. اما برای GPU های Nvidia فقط سری Maxwell 2 دارای این قابلیت هست که اون هم احتمالاً بخاطر مناسب نبودن طراحیش در مقایسه با 290X نتونسته خوب ظاهر بشه.

در واقع دلیل اصلی این تفاوتها پشتیبانی ضعیف Nvidia از Async Compute بیان شده (که این هم حدس یا اطلاعات دسته اول سازنده انجین بازی هست). اما هنوز مقایسه‌ای انجام نشده که نشون بده چه مقدار Queue برای انجام این محاسبات کافی، چه مقدار از اونها بهینه هستن. PS4 از 64 Queue برای GPUـش استفاده کرده و XB1 هم از 16 تا Queue (که فکر میکنم مشابه 7790 باشه) در کنار دو تا Command Processor استفاده کرده.

نکته مثبت این هست که تمامی GPUهای AMD که با معماری GCN هستن از این قابلیت پشتیبانی میکنن و کلاً برای بکارگیری چنین روشهایی انعطاف پذیری بیشتری دارن.
 

FaRd!N

Nothing as it Seems
کاربر سایت
Aug 30, 2007
14,872
نام
فردین
پست انتقال داده شدن به این تاپیک. موضوع ربطی به تاپیک کیفیت اجرایی بازی ها نداشت.
 

NO ps3

کاربر سایت
May 5, 2009
2,049
نام
محسن
پس این وعده وعید انویدیا چی میشه واسه دایرکت 12 (کارتهای سری 900 ) خودم به شخصه به دلیل دایرکت 12 رفتم سمت انویدیا :|ولی به نظرم تا یه بازی با پشتیبانی کامل از دایرکت 12 ساخته نشه و بنچمارکاش از کارتای هر دو شرکت بیرون نیاد

نمیشه قضاوت کرد
 

Fusion

کاربر سایت
Sep 21, 2006
1,211
نام
هکر SQL INJECTION
Ashes of the Singularity الان مقایسه درستی نیست که دارید میکنید حرف انودیا کاملا درست
ساپورت نداشتن بازی از کارت انودیا ، الان تمام دمو که با موتور UE4 انجام شده افزایش پروفنمنس انودیا میشه دید
Unreal Engine 4 Elemental DX12 در یوتیوب سرچ کنید یا فایل میتونید بگیرید که 1 گیگ حجم
 

g4m3r

کاربر سایت
Oct 7, 2013
777
نام
saeid
چیزی که شما نقل قول کردید کم و بیش درسته منتهی نظر نا کامل شخصی خارج از تیم اکسید هست، دلیل دقیقتر این تفاوت رو خود سازنده بازی امروز بیان کرده که میتونید در این پست بخونید:

[Various] Ashes of the Singularity DX12 Benchmarks - Page 121

در واقع گفته که انجین اونها که تحت DX12 هست از Async Compute پشتیبانی میکنه و در حالی که درایورهای GPUهای Nvidia نشون میدن که از Async Compute پشتیبانی میکنن اما در عمل توانایی این کار رو ندارن یا احتمالاً میشه گفت برای انجام این کار از راه‌های نرم افزاری استفاده میکنن (بر خلاف GPUهای AMD با معماری GCN که ساپورتش از این قابلیت سخت افزاری هست). و حتی گفته که اونها به درخواست Nvidia این قابلیت رو برای کارتهای Nvidia خاموش کردن. این در حالی هست که گفتن با استفاده از Async Compute میشه حدود 30% به پرفورمنس بازیها اضافه کرد (البته این یک چیز ثابت نیست و میتونه کمتر هم بشه بسته به نوع بازی). در این تصویر هم میتونید ببینید که هر معماری این دو شرکت چند تا دستور گرافیکی و چند تا دستور محاسباتی رو میتونه ساپورت کنه:


سه تا نکته در مورد جدول بالا وجود داره:

1- برای GCN 1.0 تعداد ACE ها و Queueها برابر هستن، یعنی GCN 1.0 کلاً دو تا Queue داره.
2- برای GCN 1.1/1.2 تعداد Queueها در هر ACE هشت تا هست (یعنی باید ضرب در 8 بشه). یعنی GCN 1.1/1.2 دارای 64 Queue هستن.
3- برای معماری GCN (نسل اول تا سوم) انجام کامپیوت و گرافیک بطور همزمان امکان پذیر هست یعنی Compute Processorها و Command Processor میتونن در کنار هم کار کنن. اما برای GPU های Nvidia فقط سری Maxwell 2 دارای این قابلیت هست که اون هم احتمالاً بخاطر مناسب نبودن طراحیش در مقایسه با 290X نتونسته خوب ظاهر بشه.

در واقع دلیل اصلی این تفاوتها پشتیبانی ضعیف Nvidia از Async Compute بیان شده (که این هم حدس یا اطلاعات دسته اول سازنده انجین بازی هست). اما هنوز مقایسه‌ای انجام نشده که نشون بده چه مقدار Queue برای انجام این محاسبات کافی، چه مقدار از اونها بهینه هستن. PS4 از 64 Queue برای GPUـش استفاده کرده و XB1 هم از 16 تا Queue (که فکر میکنم مشابه 7790 باشه) در کنار دو تا Command Processor استفاده کرده.

نکته مثبت این هست که تمامی GPUهای AMD که با معماری GCN هستن از این قابلیت پشتیبانی میکنن و کلاً برای بکارگیری چنین روشهایی انعطاف پذیری بیشتری دارن.
با این حساب اختلاف فنی و پتانسیلی که gpu ps4داره تا چند وقت دیگه باید انتظار اختلاف بازدهی بیشتری نسبت به xone هم باشیم
 

DieDie

کاربر سایت
Feb 28, 2010
2,773
با این حساب اختلاف فنی و پتانسیلی که gpu ps4داره تا چند وقت دیگه باید انتظار اختلاف بازدهی بیشتری نسبت به xone هم باشیم
تو بازیای PS4 همین الان دارن از Async compute استفاده میکنن چون این قابلیت از روز اول فعال بوده نمونش Battlefield و ISS, احتمالا اولین بازی ایکه روی Xone از Async compute استفاده کنن TR باشه.
eSRAM خوراک Async compute هست.
 

DieDie

کاربر سایت
Feb 28, 2010
2,773


اوکساید رو نمیدونم قضیش چی هست ولی تا اونجا که من دیدم سری 9 انویدیا قابلیت هندل 31 compute queues داره حتی طوری طراحی شده که تو حالت Compute mode خالص 32 تا compute queues رو هندل کنه.
 

LiviNG D3AD

کاربر سایت
Dec 7, 2008
3,141
نام
Mohsen
Ashes of the Singularity الان مقایسه درستی نیست که دارید میکنید حرف انودیا کاملا درست
ساپورت نداشتن بازی از کارت انودیا ، الان تمام دمو که با موتور UE4 انجام شده افزایش پروفنمنس انودیا میشه دید
Unreal Engine 4 Elemental DX12 در یوتیوب سرچ کنید یا فایل میتونید بگیرید که 1 گیگ حجم
Ashes of the Singularity فقط در مورد DX12 و APIـه Low Level و Overhead پایین برای CPU و ... نیست. اتفاقاً روی GPUهای Nvidia بازی رو خیلی خوب برای DX11 بهینه کردن و خود نتایج هم نشون میدن (این بهینه سازیها یک ماه قبل از اینکه این بنچمارکها بیرون بیان انجام شدن). بحث اینجا سر یک قابلیت هست که حتی جزو Feature Levelهای DX12 هم معرفی نشده (همون Multiengine یا Async Compute) که در معماری GCN بسیار بهتر و کاملتر کار شده و میتونه تأثیر مستقیم روی بهره‌وری GPU و کیفیت گرافیکی بازیها داشته باشه و حتی در کنار این قابلیت، قابلیتهای دیگه‌ی DX12 هم هستن که میتونن باز به بهینه‌تر شدن کدها و ماکزیمم شدن پرفورمنس GPUها کمک کنن (و حتی چیزهای جدیدتر و بیشتری هم برای اضافه شدن به فیچرهای کلی DX12 هم وجود دارن که هنوز اضافه نشدن).

اینکه DX12 میتونه به بازیهایی مثل Ashes of the Singularity که استراتژی هستن و آبجکتهای زیادی رو همزمان برای پردازش دارن (CPU Bound هستن) کمک کنه یک بحث هست و اینکه با Async Compute میشه از واحدهای پردازشی GPU که به دلایل مختلف و در مراحل مختلف کار نمیکنن استفاده کرد و حدود 30% پرفورمنس بالاتر گرفت هم یک بحث دیگست. این دو تا رو نباید با هم قاطی کرد. مورد اول برای بازیهایی خوب هست که به این منظور طراحی شدن ولی مورد دوم میتونه برای خیلی از بازیها با انجین بروز صدق کنه.

با این حساب اختلاف فنی و پتانسیلی که gpu ps4داره تا چند وقت دیگه باید انتظار اختلاف بازدهی بیشتری نسبت به xone هم باشیم
برای XB1 فکر میکنم تازه اوایل 2015 قابلیت Async Compute رو روی ورژن بهینه تر و Low Level شده DX11 پیاده سازی کردن و هنوز این قابلیت تحت DX12 احرا نشده که اگر بشه احتمالاً نتایج بسیار بهتری هم میتونن بگیرن. از طرفی برای استفاده از Async Compute هم لازم نیست که حتماً تعداد زیادی ACE یا Queue داشته باشید. یعنی بودن Queueهای بیشتر به خودی خود بد نیست و شاید بتونه در یسری موارد کمک هم بکنه ولی تعداد بیش از حد و استفاده بیش از حد از اونها هم میتونه بخاطر Overheadـی که ایجاد میکنه از پرفورمنس سیستم کم کنه. اولیه ترین معماری GCN یا Gen1/GCN 1.0 از 2 تا Queue برای پردازشهای موازی غیر همزمان استفاده میکنه که با همون 2 تا هم میشه به نتایج خوبی رسید.

بحث PS4 بیشتر در مورد Fine Grain Async Compute بود با ایده کلی در خصوص خرد کردن پردازشها و حداکثر استفاده از واحدهای پردازشی بلا استفاده. در واقع یه چیزی شبیه HyperThreading در CPU ها که چندتا پردازش رو بطور همزمان به یک هسته CPU میدادن و با اینکار راندمان کلی رو بالاتر میبردن اما در مورد CPUها الزاماً با بیشتر کردن کارها از 2 مورد نتایج بهتری بدست نمیاد و خیلی وقتها هم باعث افت راندمان میشه. حالا ایده کلی AMD برای این تعداد ACE و Queue هم همین هست. منتهی باید توجه داشت که چندتا واحد پردازشی مستقل در هر GPU هست و زیاد کردن Jobها برای هر کدوم از این واحدهای پردازشی چه تبعاتی داره (چون قاعدتاً هر Job برای بکارگیری منابع موجود مثل ALUها و کشها و پهنای باند و ... با بقیه Jobها رقابت میکنه و ممکنه با زیاد بودنشون در کار همدیگه اختلال ایجاد کنن که معمولاً هم این کار رو میکنن).

لپ کلام اینکه زیادتر بودن ACE و Queue الزاماً به پرفورمنس سیستم اضافه نمیکنه (نسبت به GPUهایی که ACE و Queueهای کمتری دارن) و خود بازیسازها هم نمیتونن بازی رو برای تک تک سیستمها طراحی و مدیریت کنن و این کار رو خود API باید به عهده بگیره. و حتی اگر هم با بهترین نوع برنامه نویسی و ... بتونن چنین کاری رو هم با ACE و Queueهای بیشتر انجام بدن باز هم فکر نمیکنم بتونن به درصدهای خیلی بالاتری برسن. در هر صورت با توجه به این نکته که یک GPU از نظر انعطاف پذیری و مدیریت منابع خیلی ضعیفتر و دست و پا بسته تر از CPU ها هستش و اینکه پرفورمنس CPUها هم با زیادتر شدن Jobها بطور خطی بیشتر نمیشه میشه گفت که همین مسأله در مورد GPUها هم صدق میکنه. PS4 دارای 64 تا Queue و XB1 دارای 16 تا Queue برای این نوع پردازشها هستن (از نظر طراحان XB1 این مقدار برای GPUـه XB1 کافی بوده) و همین مقدار (برای XB1) هم از خیلی از GPUهای موجود در بازار بیشتر هست.

در مورد خود XB1 و معماریش هم بعد از گذشت این همه وقت واقعاً حرف زدن و نظر دادن (اونم نظرات رادیکال و ...) جرأت و جسارت میخواد. ولی الان و بعد از مشخص شدن یسری نکات و خصوصیات و Bottleneckهای کلی ناشی از بکاربردن DX12 شاید بشه یسری نظراتی داد که هم به واقعیت نزدیک باشن و هم توضیح بهتری در مورد یسری انتخابها و طراحیها در ساخت XB1 اشاره کنن. کلیت ماجرا این هست که بنظر میاد XB1 با اعمال یسری تغییرات ریز و درشت در معماریش سعی داشته یسری از این Bottleneckهای ناشی از DX12 رو رفع کنه (بنظر من اینجور میاد) اما در عین حال فکر میکنم که چنین بحثها و پیشبینی‌های ارزش وقت گذاشتن و ... رو ندارن، بهتره اگر چیزی هست خود سازندگان XB1 بهش اشاره کنن نه من و امثال من (که فعلاً در بهترین حالت میشه گفت همشون 2-3 سالی رفتن گل بچینن و در بدترین حالت هم میشه گفت ما توهم زدیم).



اوکساید رو نمیدونم قضیش چی هست ولی تا اونجا که من دیدم سری 9 انویدیا قابلیت هندل 31 compute queues داره حتی طوری طراحی شده که تو حالت Compute mode خالص 32 تا compute queues رو هندل کنه.
مسأله دقیقاً همین هست که 980 ti که آخرین معماری و بیشترین پرفورمنس GPUهای Nvidia رو داره روی DX12 نتایج مشابه 290X ارائه میده و به درخواست Nvidia قابلیت Async Compute رو برای این GPU غیر فعال کردن (این یعنی تعداد 32 تا Compute Queue صرفاً مهم نیست و نوع طراحی و انعطاف پذیریش هم مهمه) و حتی سازنده موتور بازی هم برگشته گفته GPUهای Nvidia از Async Compute ساپورت نمیکنن و نمیدونن چرا درایورهای Nvidia طوری نشون میدن که انگار از Async Compute ساپورت میکنه. حالا این وسط کی اشتباه میگه و کی درست رو باید صبر کرد و دید.
 

DieDie

کاربر سایت
Feb 28, 2010
2,773
مسأله دقیقاً همین هست که 980 ti که آخرین معماری و بیشترین پرفورمنس GPUهای Nvidia رو داره روی DX12 نتایج مشابه 290X ارائه میده و به درخواست Nvidia قابلیت Async Compute رو برای این GPU غیر فعال کردن (این یعنی تعداد 32 تا Compute Queue صرفاً مهم نیست و نوع طراحی و انعطاف پذیریش هم مهمه) و حتی سازنده موتور بازی هم برگشته گفته GPUهای Nvidia از Async Compute ساپورت نمیکنن و نمیدونن چرا درایورهای Nvidia طوری نشون میدن که انگار از Async Compute ساپورت میکنه. حالا این وسط کی اشتباه میگه و کی درست رو باید صبر کرد و دید.
منم اتفاقا همین تیکه پست طرف رو خوندم تعجب کردم توی بنچمارک Async compute کلا روی کارت انویدیا شات دان شده در حالیکه یه سایتی مثل Anandtech نوشته این قابلیت رو داره:

AMD Dives Deep On Asynchronous Shading

خیلی عجیبه که این فیچر رو نداشته باشه ولی جزو فیچرهاش لیست کرده باشن!!!!

- - -ویرایش - - -

تو بازیای PS4 همین الان دارن از Async compute استفاده میکنن چون این قابلیت از روز اول فعال بوده نمونش Battlefield و ISS, احتمالا اولین بازی ایکه روی Xone از Async compute استفاده کنن TR باشه.
eSRAM خوراک Async compute هست.
یه دوستی خصوصی گفت که اگه برای این حرفا منبع داری بزار:



منبع اول اسلایدهای AMD هست.
لینک

منبع دوم هم اسلایدهای مایکروسافت هست




منبع سوم هم گفته های سازنده بازی هست که توی تاپیک بازی تو قسمت xo لینکشو گذاشتم.
 

benjohn

کاربر سایت
Jun 19, 2012
4,528
نام
ehsan
منم اتفاقا همین تیکه پست طرف رو خوندم تعجب کردم توی بنچمارک Async compute کلا روی کارت انویدیا شات دان شده در حالیکه یه سایتی مثل Anandtech نوشته این قابلیت رو داره:

AMD Dives Deep On Asynchronous Shading

خیلی عجیبه که این فیچر رو نداشته باشه ولی جزو فیچرهاش لیست کرده باشن!!!!

- - -ویرایش - - -


یه دوستی خصوصی گفت که اگه برای این حرفا منبع داری بزار:



منبع اول اسلایدهای AMD هست.
لینک

منبع دوم هم اسلایدهای مایکروسافت هست




منبع سوم هم گفته های سازنده بازی هست که توی تاپیک بازی تو قسمت xo لینکشو گذاشتم.
موضوع این نیست که حالا تو یکی دو بازی استفاده شده باشه. مسئله اینجاست که یواش یواش همونطور که سرنی پیش بینی کرده از سال سوم به بعد این موضوع تو بازی ها عمومی میشه و بازی های مولتی هم استفاده میکنن که خوب به طبعش تاثیراتش هم مشخص میشه.
 

DieDie

کاربر سایت
Feb 28, 2010
2,773
Ryan Cooper یه مصاحبه با Gamingbolt داشته گفته ما در مورد DX12 خیلی هیجان زده هستیم و من فکر میکنم پتانسیل خیلی زیادی در اون وجود داره ولی ما هیچ برنامه ای برای استفاده از DX12 برای Forza 6 نداریم.

Ryan Cooper: We’re really excited about DX12 and I think there is going to be a ton of potential with that. However, We’re don’t have any plans for using DX12 in Forza Motorsport 6.
Forza Motorsport 6 Interview: Setting A New Bar for Racing Games GamingBolt.com: Video Game News, Reviews, Previews and Blog
 

Fusion

کاربر سایت
Sep 21, 2006
1,211
نام
هکر SQL INJECTION
Ashes of the Singularity فقط در مورد DX12 و APIـه Low Level و Overhead پایین برای CPU و ... نیست. اتفاقاً روی GPUهای Nvidia بازی رو خیلی خوب برای DX11 بهینه کردن و خود نتایج هم نشون میدن (این بهینه سازیها یک ماه قبل از اینکه این بنچمارکها بیرون بیان انجام شدن). بحث اینجا سر یک قابلیت هست که حتی جزو Feature Levelهای DX12 هم معرفی نشده (همون Multiengine یا Async Compute) که در معماری GCN بسیار بهتر و کاملتر کار شده و میتونه تأثیر مستقیم روی بهره‌وری GPU و کیفیت گرافیکی بازیها داشته باشه و حتی در کنار این قابلیت، قابلیتهای دیگه‌ی DX12 هم هستن که میتونن باز به بهینه‌تر شدن کدها و ماکزیمم شدن پرفورمنس GPUها کمک کنن (و حتی چیزهای جدیدتر و بیشتری هم برای اضافه شدن به فیچرهای کلی DX12 هم وجود دارن که هنوز اضافه نشدن).

اینکه DX12 میتونه به بازیهایی مثل Ashes of the Singularity که استراتژی هستن و آبجکتهای زیادی رو همزمان برای پردازش دارن (CPU Bound هستن) کمک کنه یک بحث هست و اینکه با Async Compute میشه از واحدهای پردازشی GPU که به دلایل مختلف و در مراحل مختلف کار نمیکنن استفاده کرد و حدود 30% پرفورمنس بالاتر گرفت هم یک بحث دیگست. این دو تا رو نباید با هم قاطی کرد. مورد اول برای بازیهایی خوب هست که به این منظور طراحی شدن ولی مورد دوم میتونه برای خیلی از بازیها با انجین بروز صدق کنه.
سلام ممنون عزیز من الان این مطلب گفتید جریان گرفتم چون خبر نداشتم در یوتیوب الان دیدم عملکرد چطوری
الان در پارات اپلود کردم همه ببین خیلی ساده باچند مقایسه کوچیک رو ریل قطار عملکرد نشون میده در این ویدئو حتما ببینید.
[video=aparat;slr4G]http://www.aparat.com/v/slr4G[/video]

این هم بنچمارک مربوطه هست
www.aparat.com/v/RVse2


پ.ن : .لی بلاخره من نگرفتم انودیا تکلیف چی شد هیچ خبر فعلا از سمت انودیا نیست ایا کارت این قابلیت DX12 لحاظ کرده یا نه خاموش ؟!
 
آخرین ویرایش:

کاربرانی که این گفتگو را مشاهده می‌کنند (کاربران: 0, مهمان: 1)

Top
رمز عبور خود را فراموش کرده اید؟