DX12 دارای قابلیتهایی برای نسل آینده GPU ـها خواهد بود.[ پست اول تاپیک حتماً خوانده ]

  • Thread starter Thread starter DieDie
  • تاریخ آغاز تاریخ آغاز
تاپیک جالب و پر محتوایی ولی یک انتقاد.
هدف این تاپیک چیه؟ اطلاع رسانی؟ یا اثبات شخصی؟ تا جایی که من دیدم نصف کامنت ها برداشت شخصی از یک سری نمودار بوده بقیه هم " من درست میگم تو غلط" . با ارامش نمیتونین چیزی را اثبات کنین؟ همین لحنتون باعث میشه حرف هاتون برای ادم بی ارزش بشه. ادم میمونه چی را باور کنه. با این وضعیت فقط مقاله ترجمه کنین بذارین به نظر من بهتره تا 2 تا عکس بزارین و زیرش برداشت شخصی بنویسید هر کیم مخالفت کرد متهم کنین. البته اگر سواد کافی دارید که هیچی. ولی به نظر من کسی که علم داره تا یک نظر مخالف ببینه جوش نمیاره و با ارامش حرفش را ثابت میکنه که نمونه هم داریم تو این تاپیک دوستمون مرده ی زنده.
البته الان به احتمال زیاد جواب منم میشه اعتماد به نفس و داعش که مهم نیست بلاخره از هر کسی در حد خودش انتظار میره ولی خب در کل 80000 نفر می بینند. 50 نفر مینویسند. اگر به نظر اون 80000 نفر یک ذره اهمیت بدید با جدل و متلک پرانی جواب نمیدید.

دلیل این همه بحث خودنمایی یه عده هست...اینکه ماهیت این تایپک فنی هست و یک عده از سر سوزش تایپک رو به حاشیه می برند...
 
nVIDIA داره با سازندگان Ashes of Singularity کار میکنه تا Asynchronous Compute رو روی GPU های خودش نهایی کنه. ادعا کردن که مشکل درایور باعث این اختلاف با AMD بوده

NVIDIA Will Fully Implement Async Compute Via Driver Support

همونطور که در بالا توضیح دادم:

درایو بهینه نشده و باگ geometry برای سرپوش گذاشتن روی مشکل فعلیه! استدیو امسیاد دیتاهاش رو برای gcn بهینه کرده! بهینه کردن کارت های انویدیا با این بازی هم یه کار بسیار سخته که به نظرم ازش صرف نظر میشه. بستگی داره شرکت ها بار پردازشی رو چجوری تقسیم کنن و داده های ارسالی async رو چجوری برنامه ریزی کنن. انویدیا کار سختی برای بهینه سازی این بازی داره چون احتمالا دیتا ها ادرس دهی های ۶۴ تایی دارن و amd favor ان و از طرفی اگر بنا باشه حرفای آناندک و گوش کنیم نتیجه میتونه اینجوری هم باشه!
http://images.anandtech.com/graphs/graph8962/71450.png

سازندگان Ashes of Singularity هم یه جورایی از دوستان ای ام دی هستن! باید صبر کنید فیبل جدید با موتور آنریل انجین 4.4 عرضه بشه تا ببینیم دوستان انویدیا روی dx12 با این بازی چیکار میکنن. بنابراین لینکی شما بازار گرمیه
 
همونطور که در بالا توضیح دادم:



سازندگان Ashes of Singularity هم یه جورایی از دوستان ای ام دی هستن! باید صبر کنید فیبل جدید با موتور آنریل انجین 4.4 عرضه بشه تا ببینیم دوستان انویدیا روی dx12 با این بازی چیکار میکنن. بنابراین لینکی شما بازار گرمیه

فکر نمیکنم اصلا همچین چیزی موضوعیت داشته باشه. تو همون مقاله هم کاملا اشاره شده که Oxide بصورت کاملا نزدیکی داره با انویدیا کار میکنه تا AC رو روی کارتای انویدیا هم پیاده کنن. حتی خود انویدیا ازشون خواسته بوده که این ویژگی رو روی کارتای امویدیا خاموش کنن.

And they've got Oxide from Ashes of Singularity to confirm that. Oxide’s developer “Kollock” wrote that NVIDIA has not fully implemented yet Async Compute in its driver, Oxide is working closely with them in order to achieve that.

نکته اینجاست که بدلیل وجود ACE ها در معماری GCN ای ام دی کارتای Rdeon بصورت سخت افزاری از این قضیه پشتیبانی میکنن. حالا باید دید در نهایت چی میشه.
 
این شفاف سازی مورد نیاز دوستان در خصوص مسائل بیان شده از طرف یکی از کارکنان AMD.
DX12 Async Shaders A Big Advantage For AMD Over Nvidia Explains Oxide Games Dev


معماری که فاقد اینجین یا اینجین های لازم جهت پردازش موازی و ناهمگام اطلاعات می باشد قرار چطوری با درایور و نرم افزار از این فناوری پشتیبانی کند؟ تا اونجایی که من می دونم نرم افزار جهت عملکرد صحیح سخت افزار طراحی میشه، ولی اول باید سخت افزار باشه تا نرم افزار بتونه بر پایه اون اجرا و طراحی بشه. معماری مکسول در در انجام پردازش های گرافیکی و محاسباتی به صورت موازی عاجز است که این دقیقآ به معنای فناوری پردازش های ناهمگام یا همون Asynchronous Shaders می باشد و گرنه پردازش های خطی خیلی خوب دارن توسط این معماری اجرا میشن.

فرق معماری GCN و مکسول در اجرای همزمان این عملیات است. در معماری مکسول ابتدا اطلاعات ذخیره شده در Main Graphic Queue توسط Command Processor پردازش می شن، بخشی از شتاب دهنده گرافیکی به حالت بیکار قرار می گیره تا اطلاعات ذخیره شده در در Compute Queue آماده برای پردازش بشن. پس از پردازش اطلاعات واحد محاسباتی مجددآ اطلاعات Main Graphic Queue آماده پردازش میشن و بعد اطلاعات Compute Queue و همین روند ادامه دارد تا تمامی اطلاعات موجود به صورت صد در صد پردازش بشه. اگر به حالت کلی به این قضیه نگاه بشه معلومه که مکسول داره اطلاعات را به صورت خطی پردازش می کنه. دلیل وجود فارآیندی تحت عنوان Context Switching در معماری مکسول هم همین مورد است.

در معماری GCN انجین های مخصوصی تحت عنوان ACE که مخفف Asynchronous Engine می باشند قرار گرفته اند. اطلاعات Main Graphic Queue هنگامی که داره توسط Mian Processor پردازش میشه در همان زمان اطلاعات Compute Queue نیز توسط واحد های پردازش ناهمگام پردازش می شن که به معنای پردازش موازی اطلاعات (پردازش اطلاعات گرافیکی و محاسباتی در یک زمان) می باشد و تمامی نیت خوابیده پشت ارائه فناوری Asynchronous Shaders پردازش موازی اطلاعات می باشد، چیزی که در معماری مکسول داره به صورت خطی پردازش میشه. حالا کارت های انویدیا دارای تعداد 31 یا 32 واحد ذخیره اطلاعات یا همون Queue باشه، وقتی اطلاعات داره به صورت خطی پردازش میشه دلیل وجود این همه واحد چیست؟

معماری مکسول کبیر با عنوان فول ساپورت DX12.1 عرضه شد. معماری که قابلیت پردازش های ناهمگام را به صورت بهینه نداره (نمی گم کلآ نداره) چطوری با عنوان فول ساپورت عرضه شده، این مورد هم حتمآ قراره به سهل انگاری انویدیا ربط داده بشه که یادش رفته اینجین های مربوطه را در تراشه هاش بذاره؟ فیچر لول DX12-1 در حال حاظر همونطور که دوستان می دونن فقط از قابلیت های Conservation Resterization و Resterizer Order View بهره می بره که این دو تکنیک در بازی Dirt بدون ساپورت سخت افزاری کارت های گرافیک AMD شبیه سازی شدن. پس عدم پشتیبانی از فیچر لول فرقی چندان فرقی نداره، ولی عدم ساپورت سخت افزاری ... .

DX12 خیلی خیلی فراتر از اون چیزی هست که بشه اینقدر راحت دربارش بحث کرد و گفت که فلان معماری کاملا از ویژگی های این رابط پشتیبانی می کنه. معماری هایی که قبل از عرضه رسمی DX12 عرضه شدن بر چه منطق و پایه و اساسی قراره از تمامی ویژگی های رابطی که هنوز عرضه نشده و در دست طراحی است به صورت کامل پشتیبانی کنن. اینم اضافه کنم که همین فناوری پردازش های ناهمگام افزایش 46 درصدی تا 50 درصدی برای کارت های amd به ارمغان آورده.

r9ql62dnnz3ivorcehy5.jpg


دوستان عزیز به کلمه May در تصویر بالا دقت کنند. مطمئنآ پشتیبانی سخت افزاری کارت های AMD از پردازش های موازی خوبی های خودش رو داره.

در آخرم اضافه کنم اگر اشتباه نکنم یکی تو یه پستی دیدم که در مورد کارت 970 و عدم پتانسیل اورکلاک Fury x صحبت شده بود! خواستم بگم عدم اورکلاک کارت های Fury به خاطر نسخه اول بودن حافظه های HBM و ضعف اونها در اورکلاک هست.
 
با این اتفاق میشه منتظر چه اختلاف هایی تو عملکرد انجین داشت؟؟؟
توی کارت های ای ام دی که 46 درصد افزایش کارایی داشته! روی کنسول های بازی هم به نظرم کم کمش 30 درصد افزایش کارایی رو داریم. چون کنسول های به دلیل ماهیت API هایی مثل DX12 و منتل و اپل جی ال 5 و حتی ولکان که دسترسی سطح پایین دارن از مدت ها پیش از این اتفاقات از Asynchronous Shaders و AsyncCompute پشتیبانی میکردن. Asynchronous Shaders هم یکی از مهمترین فیچر لول های DX12 هست که بسیار بسیار مهمه که همراه با DX12 و در کنار AsyncCompute میتونه میزان عملکرد کنسول ها در بازی ها رو به شدت افزایش بده.

پست زیر و چند صفحه قبل یکی از بچه ها (فک کنم سامی فیشر بود) گذاشته بود که اهمیت موضوع رو میرسونه:

مارک سرنی در رابطه با پردازش های ناهمگون PS4 گفته که:

«Our belief is that by the middle of the PlayStation 4 console lifetime, asynchronous compute is a very large and important part of games technology»«Mark Cerny»
r9ql62dnnz3ivorcehy5.jpg
 
توی کارت های ای ام دی که 46 درصد افزایش کارایی داشته! روی کنسول های بازی هم به نظرم کم کمش 30 درصد افزایش کارایی رو داریم. چون کنسول های به دلیل ماهیت API هایی مثل DX12 و منتل و اپل جی ال 5 و حتی ولکان که دسترسی سطح پایین دارن از مدت ها پیش از این اتفاقات از Asynchronous Shaders و AsyncCompute پشتیبانی میکردن. Asynchronous Shaders هم یکی از مهمترین فیچر لول های DX12 هست که بسیار بسیار مهمه که همراه با DX12 و در کنار AsyncCompute میتونه میزان عملکرد کنسول ها در بازی ها رو به شدت افزایش بده.

پست زیر و چند صفحه قبل یکی از بچه ها (فک کنم سامی فیشر بود) گذاشته بود که اهمیت موضوع رو میرسونه:


r9ql62dnnz3ivorcehy5.jpg

داداش میگم ولکان که جانشین opengl هست که...یه بنیاد متشکل از مایکروسافت و گوگل تا اینتل و انویدیا...این هم هست که گوگل با کورونوس قرار داد بکار گیری ولکان مخصوص اندروید امضا کرده...
...
نه...واقعا خوبه که کنسول ها هم پشتیبانی می کنند از AsyncCompute ...

- - -ویرایش - - -


بلوف نمی زنه...؟
 
کم کم دارم ترغیب می شم کارت بعدی رو AMD بگیرم، اون از مسخره بازی های تایتان 1000 دلاری! اون از دروغ گفتنشون سر 4 گیگ رم 970، اینم الان که همه جا تو بوغ و کرنا کردن که آره ما تا خرخره از DX12 پشتیبانی می کنیم، آخرشم از Async Compute پشتیبانی نمی کنن کارتاش. حالا 100 واتم کمتر مصرف کنه فدا سرم.
 
با این اتفاق میشه منتظر چه اختلاف هایی تو عملکرد انجین داشت؟؟؟

والا درباره این چیزا که نمیشه قطعی نظر داد 100% بازی با بازی تفاوت میکنه اوایل نسل یکی از مشکلاتی که بعضی بازی سازها بهش انتقاد میکردن و یوروگیمر هم بهش اشاره داشت کم بودن فضای ای اس رم برای جا دادن فریم بافر های با رزولوشن 1080 روی رندرهای پیچیده بود، ولی چیزی که الان اکثر کسایی که سرشون به تنشون میارزه میگن این هست که Async compute برای رسیدن به رزولوشن بالاتر روی Xbox one کمک بزرگیه چون انجام خیلی کارا روی Async compute باعث میشه eSRAM آزاد بمونه، این خودش یعنی یکی از باتلنک ها رفع میشه.

hnq_untitled.jpg


If someone wonders why the G-buffer only uses 18 MB of ESRAM,the answer is: we are doing lighting, post processing, VT page generation and particle rendering using async compute in the background. Only culling + g-buffer draws + shadow draws are in the render pipeline. Everything else is async compute. This gives us huge perf gains. Unfortunately I had only a 25 minute slot, meaning that I had to remove all my async compute slides.

گفته که: اگه کسی تعجب کرده چرا جی بافر فقط از 18 مگ ای اس رم استفاده کرده جوابش اینه که برای خیلی کارا مثل نور پردازی و PP افکتها و ... از Async compute استفاده کردیم که این قضیه به ما افزایش عظیمی توی کارایی میده.

- - -ویرایش - - -

بلوف نمی زنه...؟

چی بگم والا؟ حالا از نظر من بلوف بزنه یا نه، یعنی شما حرفای منو از حرفای یه نفر تو ای ام دی بیشتر قبول داری؟ :d
 
کم کم دارم ترغیب می شم کارت بعدی رو AMD بگیرم، اون از مسخره بازی های تایتان 1000 دلاری! اون از دروغ گفتنشون سر 4 گیگ رم 970، اینم الان که همه جا تو بوغ و کرنا کردن که آره ما تا خرخره از DX12 پشتیبانی می کنیم، آخرشم از Async Compute پشتیبانی نمی کنن کارتاش. حالا 100 واتم کمتر مصرف کنه فدا سرم.

شما AMD بخر
 
والا درباره این چیزا که نمیشه قطعی نظر داد 100% بازی با بازی تفاوت میکنه اوایل نسل یکی از مشکلاتی که بعضی بازی سازها بهش انتقاد میکردن و یوروگیمر هم بهش اشاره داشت کم بودن فضای ای اس رم برای جا دادن فریم بافر های با رزولوشن 1080 روی رندرهای پیچیده بود، ولی چیزی که الان اکثر کسایی که سرشون به تنشون میارزه میگن این هست که Async compute برای رسیدن به رزولوشن بالاتر روی Xbox one کمک بزرگیه چون انجام خیلی کارا روی Async compute باعث میشه eSRAM آزاد بمونه، این خودش یعنی یکی از باتلنک ها رفع میشه.

hnq_untitled.jpg




گفته که: اگه کسی تعجب کرده چرا جی بافر فقط از 18 مگ ای اس رم استفاده کرده جوابش اینه که برای خیلی کارا مثل نور پردازی و PP افکتها و ... از Async compute استفاده کردیم که این قضیه به ما افزایش عظیمی توی کارایی میده.

- - -ویرایش - - -



چی بگم والا؟ حالا از نظر من بلوف بزنه یا نه، یعنی شما حرفای منو از حرفای یه نفر تو ای ام دی بیشتر قبول داری؟ :d

))) ...والا مثل بقاله و ماستش...تا نبینیم که باور نمی کنیم...الآن خود انویدیا میگه کامل از dx12 و فیچرلول 12_1 پشتیبانی می کنه خب با این قضیه اخیر باور کردن حرف های amd سخت میشه...
 

کاربرانی که این گفتگو را مشاهده می‌کنند

Top
رمز عبور خود را فراموش کرده اید؟
اگر میخواهی عضوی از بازی سنتر باشی همین حالا ثبت نام کن
or