مقایسه سخت افزاری XBOX One و PlayStation 4

مقایسه اندازه die و تعداد ترانزیستور پردازنده Xbox one با پردازنده های گرافیکی:

97345368494397632507.jpg
 
مقایسه اندازه die و تعداد ترانزیستور پردازنده Xbox one با پردازنده های گرافیکی:

97345368494397632507.jpg

از يك غول. 5 بيليون ترانزيستوري با transistor density معقول و كم (براي بالاتر بردن حد tj max limited ) چيزي بين 460mm2 تا 500mm2 پيشبيني ميشد

مايكرو احتمالا transistor density رو كم كرده تا با اينكه با بزرگ شدن die size قيمت تراشه ها بخاطر كمتر شدن تعداد چيپ ها روي 28nm HKMG Wafer زياد يا حتي بسيار زياد ميشه اما در ازاي اون تراشه اي با توانايي تحمل TJ =thermal junction بالاتر و طول عمر بالاتر تحويل ميگيره.

اين نسل مايكرو براي كنسول هيچي كم نذاشته - يك heat sink بسيار بزرگ و كم نويز كه نصف كنسول رو اشغال كرده . نويز و سر وصداي توليدي فن مسئله مهمي هست كه اميدوارم سوني هم رعايت كرده باشه و فداي حجم كوچك كنسول با استفاده از فن هاي سانتريفيوژ نكرده باشه.

تراشه عظيمي هست و اميدوارم حدود 2 بيليون ترانزيستوري كه خرج esram و move engine و عدوات يونيك كنسول شده در اينده برتري خاص خودشو نشون بده.
 
چیزی که جالبه اینه که تراشه ای با این تعداد ترانزیستور اگر معماری متعارف داشت حتی با احتساب CPU میتونست حدود 14-15 تا GCN Core بیشتر از چیزی که الان اعلام شده (ولی هنوز تایید نشده) داشته باشه یعنی طبق اطلاعاتی که تا الان به دست اومده میتونست به جای 768 Threads در حدود 1,664 Threads و به فرض کار کردن در کلاک 800Mhz حدودا 2.66 ترافلاپس قدرت خام داشته باشه....
البته اگر BF4 رو بتونه با کیفیت very high به صورت 1080/60p اجرا کنه ، حتی با احتساب efficiency بالاتری که به خاطر معماریش به وجود اومده باید حتما همین حدود قدرت داشته باشه! چون کارتی مثل 7970GE با 4.3 ترافلاپس قدرت و 4 میلیارد ترانزیستور هم نمیتونه BF4 رو به صورت پایدار روی 1080/60 حتی با FXAA اجرا کنه.
من فکر میکنم با توجه به اینکه مایکرو اعلام کرده که قابلیتهای DX 11.2 روی Xone امکان پذیر هست یا باید تکنولوژی GPU ـش بالاتر از سری HD 77xx-79xx باشه یا اینکه فوق العاده ریشه ای کاستومایزش کرده باشن و کلا یه چیز ناشناخته نسبت به GPU های متداول باشه.
 
آخرین ویرایش:
اگر ماکروسافت از 5 میلیارد ترانزیستور استفاده کرده باشه برای ساخت چیپ امار و ارقام یه طورائی جور در نمیاد .Bonaire XT که 896تا پردازنده جریانی داره 2میلیارد و80 میلیون ترانزیستور در ساختش بکار رفته و Cape Verde XT که 640تا پردازندی جریانی داره فقط 1.5 میلیارد.

الان قدرتمندترین cpu حال حاضر amd برای دسکتاپ با 4 رو خورده ایی گیگاهرتز سرعت و 8 تا هسته با 16 مگ کش فقط 1.2 میلیارد ترانزیستور داره.تازه cpu ایکس باکس وان هم کلاکش پایینتره هم اصلا در رده این پردازنده نیست و ضعیفتره .

بخوایم دسته بالا بگیریم تا اینجا با 896 تا پردازنده جریانی و یه cpu هشت هسته ایی نیرومند ما 3.2 میلیارد ترانزیستور داریم.
سوال اینجاست اون 1.8 میلیارد دیگه که اصلا عدد کمی هم نیست در کجا بکار رفته .10 مگابایت edram داخل ایکس باکس360 فقط از 105 میلیون ترانزیستور ساخته شده بود با اون پهنای باند و وظایف دیگه .
اصلا هیچ طوره نمیشه ثابت کرد فقط یه حافظه پرسرعت 32 مگابایتی و 4 تا موو انجین که بقول خودشون شتاب دهنده هستن این همه ترانزیستور در ساختش بکار رفته بشه.
1.8 میلیارد اصلا تعداد کمی نیست .کل تعداد ترانزیستورهای ایکس باکس 360 فقط حدود 500 میلیون بود و ps3 هر دو تا پردازندش نزدیک 550 تا 600 میلیون تقریبی.
شما حتی اگه عدد ps3 با ایکس باکس360 رو جمع بزنی میشه 1.1 میلیارد برای هر 2 تا کنسول!
این بازم خیلی فاصله داره تا 1.8

قبلا هم گفتم کمی صبر کنید تا نتیجه بررسی اجرای بازیها رو هر 2 کنسول بیاد اینطوری فایده نداره .بنظرم ماکروسافت کلی گویی کرده.
dieسایز پردازنده ایکس باکس وان اصلا کوچیک نیست و تقریبا با 5 میلیارد ترانزیستور داره جور در میاد!با توجه به 28 نانو بودنش.
 
32 مگابیات حافظه SRAM میتونه حدود 1.6 میلیارد ترانزیستور داشته باشه.چطوری؟
32 MB مساوی هست با 32,768,000 بایت
هر بایت = 8 بیت
32,768,000X8=262,144,000 بیت
اگر حافظه SRAM از نوع 6T باشه که متداول ترین نوع حافظه های استاتیک برای کچه های امروزی هست یعنی به ازای هر بیت 6 تا ترانزیستور داشته باشه :
262,144,000X6=1,572,864,000
که حدودا 1.57 میلیارد ترانزیستور میشه.
 
32 مگابیات حافظه SRAM میتونه حدود 1.6 میلیارد ترانزیستور داشته باشه.چطوری؟
32 MB مساوی هست با 32,768,000 بایت
هر بایت = 8 بیت
32,768,000X8=262,144,000 بیت
اگر حافظه SRAM از نوع 6T باشه که متداول ترین نوع حافظه های استاتیک برای کچه های امروزی هست یعنی به ازای هر بیت 6 تا ترانزیستور داشته باشه :
262,144,000X6=1,572,864,000
که حدودا 1.57 میلیارد ترانزیستور میشه.

کاری ندارم این محاسبه درسته یا نه.ولی سوالی که پیش میاد اینه که فقط برای 32 مگ حافظه پرسرعت چرا باید 1.57 میلیار ترانزیستور به تعداد die اصلی اضافه بشه که هم باعث مصرف بیشتر و هم حرارت بیشتر بشه ؟
فقط برای یه حافظه 32 مگابایتی واسط؟
اصلا این با عقل جور در میاد؟
چرا نیومد از یه حافظه پرسرعت gddr5 برای بافر و واسط استفاده کنه که ظرفیتش میتونست 30 تا 40 برابر 32 مگابایت باشه با همون پهنای باند حالا با تاخیر بیشتر؟
 
کاری ندارم این محاسبه درسته یا نه.ولی سوالی که پیش میاد اینه که فقط برای 32 مگ حافظه پرسرعت چرا باید 1.57 میلیار ترانزیستور به تعداد die اصلی اضافه بشه که هم باعث مصرف بیشتر و هم حرارت بیشتر بشه ؟
فقط برای یه حافظه 32 مگابایتی واسط؟
اصلا این با عقل جور در میاد؟
چرا نیومد از یه حافظه پرسرعت gddr5 برای بافر و واسط استفاده کنه که ظرفیتش میتونست 30 تا 40 برابر 32 مگابایت باشه با همون پهنای باند حالا با تاخیر بیشتر؟

روش محاسبه درسته معمولا سطح بزرگی از die پردازنده ها متعلق به کچه هاش هست که اونها هم از نوع حافظه های استاتیک (SRAM) هستن مثلا:

cache.jpg


تو این عکس شاید حتی نصف بیشتر سطح die پردازنده رو کچه هاش که حافظه های استاتیک (SRAM) هستن اشغال کردن .

***********************************************
خوب من اگر دلیلش رو به صورت فکت میدونستم مطمئن باش الان تو اینتل یا آی بی ام یه شغل خوب داشتم ساعت 4:40 صبح تو بازی سنتر نبودم :d ولی تا اونجایی که من میدونم (با سواد محدود) نقش این eSRAM خیلی میتونه مهم باشه:

1) میتونن به عنوان کچه مشترک بین CPU و GPU ازش استفاده کنن (بحث scheduling یا زمانبندی)

2) تاخیر (Latency) این حافظه خیلی پایینه نقش Latency حافظه تو عملکرد GPU خیلی حیاتیه حتی تا جایی که نقش تاخیر رو تو عملکرد GPU از سرعت اجرا مهمتر میدونن!! مثلا میگن GPU ای که 100 کلاک برای رسیدن داده صبر میکنه 1% قدرت تئورتیکالش (تازه نه واقعیش) بهره وری داره.

The latency of the main memory directly influences the efficiency of the GPU, thus its performance: reducing wait time can be more important than increasing execution speed. Unfortunately, memory has huge latency (today, by a factor of 100 or more): A GPU waiting for 100 clocks for data would run at 1/100 efficiency, i.e. 1% of theoretical performance!

SiSoftware Zone

3) ramـی که روی یه die با CPU یا GPU قرار داشته باشه (embedded) تاخیر فوق العاده کمتری نسبت به تاخیری که clock cycle خارجی حافظه اصلی ایجاد میکنه داره (بین 500 تا چند 1000 برابر) یعنی تو فاصله ای که CPU یا GPU از حافظه اصلی یک داده رو میخونن داده های یه حافظه embedded صدها یا حتی هزاران بار Read/Write و پردازش شدن برای همین هست که پهنای باند یک حافظه کوچیک embedded باعث بالا رفتن پهنای باند کل سیستم میشه چیزی که طراح PS4 هم بهش اذعان داره:


"One thing we could have done is drop it down to 128-bit bus, which would drop the bandwidth to 88 gigabytes per second, and then have eDRAM on chip to bring the performance back up again," said Cerny
"یکی از کارهایی که ما میتونستیم انجام بدیم این بود که گذرگاه رو به 128 بیت تقلیل بدیم که باعث میشد پهنای باند به 88 گیگ بر ثانیه برسه و اونوقت با قرار دادن یک eDRAM عملکرد بالا رو دوباره به اون برگردونیم"

Gamasutra - Features - Inside the PlayStation 4 With Mark Cerny

صحبت سرنی در مورد یه حافظه DRAM هست حافظه های SRAM که به دلیل نداشتن تایم رفرش خیلی سریعترن.

4) از eSRAM به عنوان فریم بافر میتونن استفاده کنن و .....

خلاصه اینقدر نقشش مهم بوده که حتی خود مایکروسافت تو توضیحات سخت افزاریش خیلی برجسته بهش اشاره میکنه:

36584970757752061781.jpg


Xbox One | What It Is - Xbox.com

************************************************************

حالا از همه این حرفا گذشته کل قضیه پیچیده تر از این حرفاس که کسی تو سطح آدمای معمولی که هیچی حتی بالاتر بتونه در موردش نظر قطعی بده , تاثیر همه اینا فقط تو واقعیت مشخص میشه یا تو عمل کارایی تئوریکشو داره یا اینکه نداره که فقط زمان ثابت میکنه ولی به نظر من اگر BF4 رو 1080/60p اجرا کنه یعنی یه کارایی کرده! :d
 
آخرین ویرایش:
اینکه سرعت انتقال این sram و تاخیرش بسیار کمه بحثی درش نیست .مسئله سر ظرفیت کمش هست .
یه مسئله دیگه هم که هست فکر نکنم یه حافظه کش این همه ترانزیستور در ساختش بکار بره.چون الان یه fx8150 با 16 مگ کش کلا 1.2 میلیارد ترانزیستور داره.
البته یه بحث دیگه هم هست اونم تعداد way ها هست الان کش l2 برای هر cu در fx8150 از 16way بهره میبره که 4 تا L2 هست هر کدوم 2 مگابایت که میشه 8 مگ فقط برای L2 و 8مگ هم با 64WAY برای کش L3 هست که 64WAY هست.
die.jpg


اینجا قشنگ نشون داده مقدار فضایی که کش2 و3 اشغال کردن .

حافظهای کش CPU وحشتناک سرعت و تاخیر کم دارن.

نمیدونم شاید ماکروسافت اومده تعداد WAY ها رو بالاتر برده تا سرعت رو به حداکثر و تاخیر رو به حداقل برسونه برای همین شاید به احتمال کم از نظر من از این همه ترانزیستور استفاده کرده.ولی در حالت معمولی الان این عکس قشنگ نشون داده کل DIE یک CPU نیرومند و کشها رو.

بازم قبول کردن این موضوع که 1.57 میلیارد ترانزیستور فقط برای 32 مگ حافظه پرسرعت باشه برام قابل قبول نیست چون الان حافظهای کش L2 وL3 این CPU به زور نصف DIE رو اشغال میکنن و نهایت نصف 1.2 میلیارد برای ساختشون بکار رفته باشه که حتی از نظر من از نصف 1.2 هم کمتر هست.

ماکرو کلی گویی کرده.به جزئیات نپرداخته .اینکه این SRAM فقط از 32 مگ حافظه پرسرعت تشکیل شده و همراهش چیز دیگه هم هست یا نه اشاره ایی نشده.تا بازیهای مشترک بین 2 پلتفرم نیاد واقعا سخته اظهار نظر کردن
 
اون مقادیر ذکر شده برای پهنای باند دو کنسول و قدرت خام پردازشی بقول معروف Peak و تئوری هستند.حالا باید صبر کرد تا چند تا بازی روی کنسول های نسل بعد ببینیم تا بشه بیشتر بحث کرد. درباره بنچمارک های ALPHA بازی BF4 نمیشه زیاد صحبت کرد و تعمیم بدیم به این کنسول ها.نسخه ALPHA به هیچ وجه بهینه با سخت افزار ها نیست.
ولی کلا AMD از ضعف هاش در معماری Cypress-5800 و Cayman-6900 به خوبی اگاه بود و در معماری GCN به خوبی مشکلات معماری های قبل رو برطرف کرد.عملکرد GCN در DX11 بسیار خوب هستش و تقریبا تفاوتی با Kepler نداره.از نظر Latency هم بهبود های زیادی یافته و فریم ها پایدار هستن. بنچمارک های GCN رو مشاهده کرده باشید، متوجه می شید که بین min frame و avg frame تفاوت کم هستش یعنی اینکه نوسان فریم در صحنه های مختلف کم هستش.برعکس کارت های 5870 و 5970 که min frame بسیار پایینی ثبت می کردند.از دلایل انتخاب این معماری از طرف مایکرو و سونی، حرارت کم و مصرف کم هم هست.
خلاصه اینکه GCN امتحانش رو پس داده و مطمئنا گیمران کنسول باز هم از جهش گرافیکی زیاد نسبت به نسل قبل و خصوصا ویژگی های DX11 لذت خواهند برد.
--------------------------
DICE تایید کرده BF4 روی کنسول های نسل بعد 60 فریم خواهند بود و اجرا کردن تنظیمات very high و رزولوشن 1080 در 60 فریم، نمیشه نظر قطعی داد.ولی مطمئنا تنظیمات high و fxaa روی 1080 و اجرا شدن روی 60 فریم امکان پذیره.
 
خیلی عالی بود. یه سوال داشتم ممکنه مشخصات xbox one یا ps4 عوض بشه؟ یا اصلا با چیزی که میگن فرق داشته باشه؟
نه گمان نمیکنم که قابل تغییر باشه الکی که نیست اینی که میبینی الان بحث سر پهنای باند هست مربوط میشه به اطلاعات جدید مایکروسافت که قبلا هیچی نگفته بود به طور رسمی
 
نه گمان نمیکنم که قابل تغییر باشه الکی که نیست اینی که میبینی الان بحث سر پهنای باند هست مربوط میشه به اطلاعات جدید مایکروسافت که قبلا هیچی نگفته بود به طور رسمی

پهنای باند هر قدر هم بالا پایین شه تاثیری روی پردازش خامش که 1.2 ترافلاپس هستش نداره ...مشکل کنسول ها هم پردازش خام هستش نه پهنای باند.
 
پهنای باند هر قدر هم بالا پایین شه تاثیری روی پردازش خامش که 1.2 ترافلاپس هستش نداره ...مشکل کنسول ها هم پردازش خام هستش نه پهنای باند.
100% اشتباه گفتی یعنی پهنای باند تاثیر نداره روی قدرت محاسبه :))؟ پس اگه xone از رم ddr2 هم استفاده میکرد فرقی نداشت چون بازم پهنای باندش نصف میشد در ضمن چرا سونی تو کنفرانسش در میاد میگه 176gb/s کنسولش پهنای باند داره ؟
 
پس چه جوریه که مایکرو مشخصاتشو عوض کرده؟
عوض نکرده خودشون چیزی که ساختن بعد از یک مدت تعجب کردن دیدن قدرتش بیشتر شده اول بهش پی نبردن:d
دور از شوخی چیزیو عوض نکردن فقط از یک سری سیلیکون های جدید اضافه کردن که به گفته خودشون پهنای باند تا 88% افزایش یافته یه همچین چیزی
دوستان توضیحات کامل تر رو میدن
 

کاربرانی که این گفتگو را مشاهده می‌کنند

تبلیغات متنی

Top
رمز عبور خود را فراموش کرده اید؟
اگر میخواهی عضوی از بازی سنتر باشی همین حالا ثبت نام کن
or