شایعه چیپ ست نسل بعد کنسول XBOX, در دست ساخت !

وضعیت
گفتگو بسته شده و امکان ارسال پاسخ وجود ندارد.

Tommy Fisher

Shit happens
کاربر سایت
Apr 5, 2009
5,954
نام
رضـا
28387455551757508334.jpg

بر طبق اخبار و گزارش های معتبر تکنولوژی: از ماه گذشته, چیپ ست نسل بعد کنسول XBOX در دست ساخت می باشد و تا پایان سال جاری به تولید کامل یا انبوه خواهد رسید .

بر طبق گزارشی از سایت معتبر Fudzilla در زمینه تکنولوژی و فن آوری "حدس و گمانه زنی ها پیرامون سیستم اصلی چیپ ست سازنده کنسول بعدی XBOX ظاهراً معتبر و دقیق است و در حقیقت کار ساخت این سیستم و تکنولوژی چیپ ست از ماه دسامبر سال سال 2011 استارت خورده است . منبع ما در این رابطه میگوید که Code Name یا نام فعلی این پردازنده Oban خوانده میشود و توسط دو کمپانی بزرگ IBM و Global Foundries برای مایکروسافت تولید خواهد شد" .

در این گزارش ادعا میشود که "قدرت پشت ساخت XBOX بعدی از یک CPU با قدرتی و کارائی همچون CPU کامپیوتر بهره خواهد برد که پیوسته با یک GPU چند قسمتی (از خانواده Southern Islands) یا سری تغییر یافته 7000 از کمپانی ATI همراه خواهد بود همچنین اضافه میشود که بعید بنظر میرسد تا پایان سال 2012 شاهد شیپ یا عرضه انبوه این کنسول باشیم".

این اولین اجرا از چیپ ست های 32 نانومتری Oban خواهد بود که برای ساخت کنسول استفاده خواهد شد پس هرگونه انتظار برای ریلیس XBOX بعدی در تعطیلات 2012 غیر واقعی یا بعید به نظر میرسد اما رونمایی از این کنسول تا قبل از پایان سال جاری دور از ذهن نیست . ما اینطور فکر میکنیم که کار تولید تراشه های سازنده کنسول نسل بعد مایکروسافت تا پایان سال جاری به اتمام خواهد رسید و همچنین شاهد عرضه XBOX720 (یا هرچیزی که نامیده خواهد شد) در سال 2013 خواهیم بود .

سایت SemiAccurate نیز در همین زمینه گمانه زنی های مشابه ای داشته است و به تجزیه و تحلیل شایعات پیرامون این موضوع پرداخته است .

پیش از این مایکل پکتر نیز شایعات پیرامون عرضه XBOX720 در سال 2012 را احمقانه خوانده بود .
Xbox 720 Chipset "in Production" - Xbox360 News at IGN
 
آخرین ویرایش:

amir-yorke

کاربر سایت
Mar 11, 2007
170
نام
امیر
اطلاعات ویکیپدیا رو اشخاص عادی مینویسن و آپدیت میکنن!
ویکیپدیا یه دانشنامه آزاد متن بازه.هرکی میتونه توش مطلب بنویسه.
بدترین نوع منبع واسه اینجور اطلاعات تخصصی میتونه ویکیپدیا باشه!
شما توی پست بالاترتون نشون دادین که علاوه بر اطلاعات ناقص از سطح ادب پایینی هم بهره میبرین که اونجوری میفرمایین برین بریک بزنین.
بحث با امثال شما بی فایده اس.فاکتور میزان سن شما رو هم باید در نظر گرفت.
شما از اینکه میبینی همه بچه ها دونه دونه میگن با شما بحث نمی کنن خوشحال میشین و فک میکنین حرفتون درسته بجای اینکه به خودتون بیاین و بفهمین کجای حرفاتون مشکل داره.
موفق باشید.
 

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
دوستان 360فن زیاد بخودتون فشار نیارید حقیقت همینه .کسی هم بخواد این اعداد وارقام رو انکار کنه اینها همش از ویکیپدیا گرفته شده بهتره برید سراغ ویکیپدیا وبا مدیرای اونجا دعوا کنید که چرا قدرت gpuایکس باکس 360رو نویسنده اونجا اندازه یه 7970در نظر نگرفته بلکه شما راضی بشید.
این همه هم زور نزنید برای تخریب به هیچ جا نمیرسه.
این بحث رو هم همینجا تمومش کنید .
کسی اگه میخواد بحث تخصصی درباره سخت افزار کنسولها کنه من حاضرم وگرنه :|

رفيق مطمئني؟ :دي

عاقبت خوبي نداره ها (از اين بابت ميگم كه شما خودت رو خيلي دسته بالا ميگيري و به ديگران توهين ميكني و تصور ميكنيد از سخت افزار تراشه ها بسيار ميدونيد(كه احتمال بسيار زياد هم انشالا همينطور هست و اميدوارم برداشت بد از حرفم نكني) و اگر كسي نظر غير بده برخورد بدي ميكنيد هر چند من پايه اينجور برخورد هام و حالا اگر علاقه داشتي بحث تخصص كني بيشتر اشنا ميشي :دي) . بحث هاي تخصصي اونم واسه سخت افزار كنسول ها براي براورد دقيق عملي توان محاسباتي تراشه هاشون كار اسوني نيست . بايد در عمل مقايسه بشه كه براي كنسول ها ممكن نيست و تراشه هاي معادلشون براي pc بنا به يكسري دلايل غير قابل مقايسه هستن.(اگر ديدم بحث اونهارو وسط بكشي درمورد اونها هم روشن سازي ميكنم )

كامنت هاي اين تاپيك رو هم خوندم و يه تعداد سوتي و اشتباه كوچولو ديدم كه البته لپي بود اما بلاخره پيش مياد :دي

خلاصه من چون حال نداشتم واسه سخت افزار كنسول هاي نسل بعدي يه مقاله بدم احتمالا توي اين بحث به حايي ميرسيم كه مجبور ميشم اين كارو بكنم .خلاصه بدم نمياد .

اطلاعات ویکیپدیا رو اشخاص عادی مینویسن و آپدیت میکنن!
ویکیپدیا یه دانشنامه آزاد متن بازه.هرکی میتونه توش مطلب بنویسه.
بدترین نوع منبع واسه اینجور اطلاعات تخصصی میتونه ویکیپدیا باشه!
شما توی پست بالاترتون نشون دادین که علاوه بر اطلاعات ناقص از سطح ادب پایینی هم بهره میبرین که اونجوری میفرمایین برین بریک بزنین.
بحث با امثال شما بی فایده اس.فاکتور میزان سن شما رو هم باید در نظر گرفت.
شما از اینکه میبینی همه بچه ها دونه دونه میگن با شما بحث نمی کنن خوشحال میشین و فک میکنین حرفتون درسته بجای اینکه به خودتون بیاین و بفهمین کجای حرفاتون مشکل داره.
موفق باشید.

اگر بخوايم منبع رو ويكيپديا هم در نظر بگيريم به اين حرف دوستمون كه ميخوريم كه خوب اشتباه هست اگر از اون منبع باشه:

نوشته شده توسط 8030

دوستانی که گیر میدن که چرا پلی3تو مولتیها ضعیف ظاهر میشه یه علت روشن داره:

gpuایکس باکس360از فن اوری روز کارت گرافیکهای امروزی بهره میبره که به Unified shading architectureهست این امتیاز به gpuکنسول 360این امکان رو میده که از مجموع 192تا پردازنده جریانی{192داخل edramپردازنده جریانی نیستند فقط برای کارهای خاصی تعبیه شدن}همزمان میتونن به عنوان رئس زن یا پیکسل شیدر عمل کنن ولی جی پی یو پلی3 اینطور نیست وپردازندهای رئس زن وپیکسل شیدر از هم جدا هستند .بخاطر همین gpuپلی3که از نسلسری7000انویدیا هست دارای پردازش رئس زن کمتری نصبت به جی پی یو 360هست ولی توانی حدود 50درصد بیشتر در پیکسل شیدر داره.

اين اول از همه نشون ميده دوستمون روي معماري تراشه ها اشنايي چنداني نداره چون اگر ميداشت به اين نكته دقت ميكرد كه تعداد sp هاي xenos برابر 192 نيست بلكه اين تراشه 240 sp داره كه به اين قراره:

xenos در 3 SIMD core شكل نسل(البته هر simd core نسل فعلي براي برنامه پذيي بالاتر داراي 64 عدد ALU يا sp هستن درصورتي كه در زنوس به 80 تا alu در simd core رسيده بودن) فعلي قرار گرفته كه هركدوم داراي 16 تا 5wide vector unit قرار گرفته .كه مجموع اونهارو به 240 عدد ميرسونه نه 192.البته شايد ايشون از روي منبعي خاص ميگه كه من خوشحالم درموردش بشنوم.(هرچند هر منبعي باشه با يك حساب منطقي ازدور خارج ميشه چون قدرت 240gflops زنوس روي حساب هست كه حتي تا نسل فعلي تراشه هاي amd هم مصداق داره)

On the chip, the shader units are organized in three SIMD groups with 16 processors per group, for a total of 48 processors. Each of these processors is composed of a 5-wide vector unit

قدرت محاسباتي ذكر شده هم صحيح هست كه روش ساده اي براي بدست اوردن داره كه من در يكي از فرم هاي فارسي زبان روش بدست اوردنش رو توضيح دادم.درمورد مقايسه زنوس و rsx هم بحث بسي طولاني و بسياره صرفا مقايسه توان محاسباتي بينشون نيست دوست عزيز.در اون مورد هم اگر لازم شد بحث ميكنيم.

بحث هاي سخت افزاري منابع زيادي داره و هركس ميتونه اگر علاقه داشته باشه اطلاعات زيادي رو بدست بياره.هيچكس هم علامه نيست.

موفق باشيد
 
آخرین ویرایش:

Paranormal

کاربر سایت
Jan 9, 2010
936
نام
علی
اطلاعات ویکیپدیا رو اشخاص عادی مینویسن و آپدیت میکنن!
ویکیپدیا یه دانشنامه آزاد متن بازه.هرکی میتونه توش مطلب بنویسه.
بدترین نوع منبع واسه اینجور اطلاعات تخصصی میتونه ویکیپدیا باشه!
دوست عزیز شما یا متن باز رو به درستی متوجه نشدید یا راجع به ویکی پدیا اطلاعات درستی ندارید. درسته هر کسی میتونه مطالب رو ویرایش کنه اما همینطوری الکی نیست که هر کی هرچی بنویسه. کنترل مطالب بسیار بالاست. شما یه دانشنامه ویکی بزن، راجع به گیم مطلب بزار هر چی خواستی بنویس، یه روزه جمعت میکنن. انقدر با این حرفا اعتبار ویکی پدیا رو پایین نیارید :|
 

amir-yorke

کاربر سایت
Mar 11, 2007
170
نام
امیر
متن باز یعنی همین که همه میتونن توش مطلب بنویسن برادر.
بنده به علت شغلم (مترجمی) به این سایت زیاد سر میزنم.
درضمن مطالب ناقص و پیش پا افتاده توی ویکیپدیا فراوونه.
بیشتر سرچ کنید.
 

Paranormal

کاربر سایت
Jan 9, 2010
936
نام
علی
مطالب ناقص و پیش پا افتاده کاملاً با مطالب نا معتبر فرق میکنه.
ممکنه بخشی از یه مطلب معتبر رو قرار داده باشند یا مطلب از نظر شما پیش پا افتاده باشه. ولی مطلب نامعتبر معنی دیگه ای داره
 

8030

کاربر سایت
Dec 10, 2010
2,445
نام
mohammad
اين اول از همه نشون ميده دوستمون روي معماري تراشه ها اشنايي چنداني نداره چون اگر ميداشت به اين نكته دقت ميكرد كه تعداد sp هاي xenos برابر 192 نيست بلكه اين تراشه 240 sp داره كه به اين قراره:

xenos در 3 SIMD core شكل نسل(البته هر simd core نسل فعلي براي برنامه پذيي بالاتر داراي 64 عدد ALU يا sp هستن درصورتي كه در زنوس به 80 تا alu در simd core رسيده بودن) فعلي قرار گرفته كه هركدوم داراي 16 تا 5wide vector unit قرار گرفته .كه مجموع اونهارو به 240 عدد ميرسونه نه 192.البته شايد ايشون از روي منبعي خاص ميگه كه من خوشحالم درموردش بشنوم.(هرچند هر منبعي باشه با يك حساب منطقي ازدور خارج ميشه چون قدرت 240gflops زنوس روي حساب هست كه حتي تا نسل فعلي تراشه هاي amd هم مصداق داره)

On the chip, the shader units are organized in three SIMD groups with 16 processors per group, for a total of 48 processors. Each of these processors is composed of a 5-wide vector unit

قدرت محاسباتي ذكر شده هم صحيح هست كه روش ساده اي براي بدست اوردن داره كه من در يكي از فرم هاي فارسي زبان روش بدست اوردنش رو توضيح دادم.درمورد مقايسه زنوس و rsx هم بحث بسي طولاني و بسياره صرفا مقايسه توان محاسباتي بينشون نيست دوست عزيز.در اون مورد هم اگر لازم شد بحث ميكنيم.

بحث هاي سخت افزاري منابع زيادي داره و هركس ميتونه اگر علاقه داشته باشه اطلاعات زيادي رو بدست بياره.هيچكس هم علامه نيست.

موفق باشيد
بنده شما رو میشناسم از زمانی که داخل انجمن hotoverclockبودید.بنده هم طرفم رو میشناسم که اینطوری برخورد میکنم وگرنه تو حالت عادی بحث منطقی باشه من حرفی ندارم

اما در مورد چیزی که گفتید

3تا piplineداریم هر pipدارای 16پردازنده جریانی داریم که روی هم میشه 48تا حالا هر یک از این 48تا به5 واحد برداری تقسیم میشن که روی هم میشه 240واحد برداری حالا این تیکه رو داشته باش نکته اینجاست برادر که میگم 192تا:

Maximum shader operations: 96 billion shader operations per second (3 shader pipelines × 16 processors × 4 ALUs × 500 MHz)

حالا چرا 4تا alu؟؟؟؟اینجا در 500ضرب شده .از هر 5wide vector unit (total 5 FP32 ALUsپنج تا واحد برداری یکیش به عنوان پخش کننده{issue } اطلاعات بین 4تای دیگه بکار میره برادر .که میشه 4در 48ضرب میشه تعداد192رو میده .قبلا دقیق یادم نیست این مطلب داخل ویکی خونده بودم ویا جای دیگه ولی مطمئن هستم .اون یک واحد برداری از 5واحد کم میشه وعملا نقش پخش کننده اطلاعات بین 4تا aluدیگه رو داره.

زود قضاوت نکن برادر .
 
آخرین ویرایش:

R.I.P

Father
کاربر سایت
Jun 5, 2006
3,217
من کاری ندارم که کدوم کنسول قوی تره کدوم ضعیف تر...اصلا برام اهمیتی نداره چون 2 تاشو دارم!
فقط یه چیزی راجع به X360 بگم: اگر فکر میکنید 360 رو همه توی ایران سره کپی خور بودنش خریدند سخت در اشتباهید! هر چی نداشته باشه یه Xbox Live داره که منو واسه نسل بعدش هم بکشونه! همین! چون وقتی پول
گیم اوریج بدم مسلما توقع امکانات انلاین بالایی هم دارم! چه توی خود گیم! چه توی ارتباطات.
یه چیز دیگه هم توی این تاپیک خوندم خیلی با مزه بود! اقا PS3 قوی تر از Xbox 360! قبول! ولی این حرف که بگیم یه نسل جلوتره خیلی "باحال" بود! یه جورایی مثل شعر همراه با شمع.همین حرف باعث میشه ادم اصلا وارد بحث نشه دیگه! اونم از نوع علمی و منطقیش!
خیلی حال میده این تاپیک یکی یه رل وید برداره بیاد اینجا بخندیم :D 8030 بیا یه 3 کام بگیر حیف تو نیست مغزتو نمیتازونی؟ LMFAO

bf7e7_a865G.gif
 
آخرین ویرایش:

M ξ λ δ ζ

کاربر سایت
Feb 11, 2011
6,215
نام
مهدی
@mehdi ps3
خود مدیران ناتی داگ (شرکت سازنده آنچارتد) گفتند که از 100% توان کنسول در ساخت uncharted3 استفاده کرده اند.
گویا شما از اونا بیشتر در جریان هستین!
بله درسته باید هم بگن چون یه جوری باید بازیشونو تبلیغ کنن یا نه ؟!! مگه زمانی که کلیزون 3 رو ساختن نگفتن تمام قدرتشه یا موقعی که GT5 اومد!! یا همین GOW3؟ الانم که میگن نهایت قدرتشو THE LAST GUARDIAN استفاده میکنه!! راستی یه سوال بنظرت اگه U3 نهایتش باشه پس تو این یکی دوسالی که از عمرش باقی میونده نباید بازیه بهتری از U3 بیاد دیگه درسته؟! باشه صبر کنید همه میبینیم ، البته من جواب هیچکدوم از سوالامو نگرفتم پیچوندید؟!!
 

u.s.a

کاربر سایت
May 19, 2009
15,142
نام
حسین
آدم میاد توو این تاپیک فکر میکنه تازه اول نسله..این دو کنسول فرق خاصی با هم ندارن خیالتون راحت

 

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
بنده شما رو میشناسم از زمانی که داخل انجمن hotoverclockبودید.بنده هم طرفم رو میشناسم که اینطوری برخورد میکنم وگرنه تو حالت عادی بحث منطقی باشه من حرفی ندارم

اما در مورد چیزی که گفتید

3تا piplineداریم هر pipدارای 16پردازنده جریانی داریم که روی هم میشه 48تا حالا هر یک از این 48تا به5 واحد برداری تقسیم میشن که روی هم میشه 240واحد برداری حالا این تیکه رو داشته باش نکته اینجاست برادر که میگم 192تا:

Maximum shader operations: 96 billion shader operations per second (3 shader pipelines × 16 processors × 4 ALUs × 500 MHz)

حالا چرا 4تا alu؟؟؟؟اینجا در 500ضرب شده .از هر 5wide vector unit (total 5 FP32 ALUsپنج تا واحد برداری یکیش به عنوان پخش کننده{issue } اطلاعات بین 4تای دیگه بکار میره برادر .که میشه 4در 48ضرب میشه تعداد192رو میده .قبلا دقیق یادم نیست این مطلب داخل ویکی خونده بودم ویا جای دیگه ولی مطمئن هستم .اون یک واحد برداری از 5واحد کم میشه وعملا نقش پخش کننده اطلاعات بین 4تا aluدیگه رو داره.

زود قضاوت نکن برادر .

درود:

خوب سعادت از بنده نبوده كه شمارو بشناسيم

اول از همه شما بحث قدرت محاسباتي fp رو وسط كشيديد و اونهارو با هم مقايسه كرديد .بحث shader op جداست و اصلا به نحوه محاسبه قدرت محاسباتي fp ربطي نداره و اين نشون ميده كه متاسفانه براي توجيح از يك شاخه به شاخه ديگه اي پريديد(اونجا زنوس به وضوح قوي تره و شما بنا به سياستت اصلا بحث shader ops ةارو وسط نكشيدي :دي).شما از اول بنا رو بر محاسبه نقاط شناور گذاشتي.اميدوارم در ادامه بحث ديگه جاده خاكي نريد و روي مسير مستقيم بحث رو ادامه بديد.من از اين شاخه به اون شاخه پردين متنفرم. :دي

اما توضيحاتي در مورد alu/sfu ها:

.دقت كنيد در ارايش 5wide vector ما در هر processor برابر 5 تا alu32bit داريم كه هركدوم ميتونن تا دو دستورالعمل رو در هر سيكل انجام بدن به وضوح در اينجا گفته:

processors is composed of a 5-wide vector unit (total 5 FP32 ALUs) that can serially execute up to two instructions per cycle

پس ميبينيد تا اينجا بين 5 ALU موجود تفاوتي نيست (بعدا در مورد تفاوت خدمتتون ميگم كه چرا يكي از ALU ها در انجام عمليات Shader operation دخيل نيست :دي)

دقت كنيد اينجا هنوز حرفي از انجام عمليات هايي كه توسط FFU ها به هسته ها ارجاع ميشه زده نشده(مثل انجام عمليات هاي shader operation كه بايد توسط ffu مربوط به اون به core ها ارسال بشه) اما توان خام محاسباتي GPU رو بايد در نظر بگيريم كه به اين صورت محاسبه ميشه:

48processor *10ops/cycle * 500mhz=240gflops

اين فرمول حتي براي جديد ترين محصولات AMD هم به همين صورته:

طبق فرمول بالا برای 4870 داریم: 4870 از 800 واحد SP تشکیل شده وبرای بدست اوردن SIMD باید بر تعداد ALU/SFU که برای SIMD های VLIW5 برابر 5 تا هست ما 160 هسته 5wide vector بدست میاریم:

محاسبه:


750mhz * 160 * 10 = 1200 Gflops

پس دیدیم برای 4870 ما 1.2Tera flops بدست اوردیم.

حالا بیاید برای 5870 هم محاسبه کنیم

محاسبه قدرت پردازشی hd 5870

در 5870 یا همون cypress ما 1600 واحد پردازشی sp یا ALU/SFU هارو داریم.پس با تقسیم بر 5 عدد 320 واحد SIMD رو بدست میاریم.فرکانس هسته هم 850 هست و طبق متد VLIW5 مثل 4870 در هر سیکل 10 عمل fp ضرب یا جمع رو انجام میده.(5 عمل MAD 32 bit رو انجام میده که هر MAD خود از ADD+MUL یعنی 2 عمل ضرب و جمع تشکیل شده پس ضرب در 2 میشود)

طبق فرمول گفته شده:

Stream Cores number * ops * frequncy = GFLOPS

320 * 10 * 850 = 2.72 Tflops

این قدرت 5870 در محاسبه single precision یعنی fp 32 اما برای fp 64 داریم:

320 * 2 * 850 = 544 Gflops
اين يك تز نيست بلكه يك يك حقيقت درمورد توان محاسباتي تراشه هاي amd هست.

اما در مورد shader operation :

حالا چرا 4تا alu؟؟؟؟اینجا در 500ضرب شده .از هر 5wide vector unit (total 5 FP32 ALUsپنج تا واحد برداری یکیش به عنوان پخش کننده{issue } اطلاعات بین 4تای دیگه بکار میره برادر

پسر issue كجاست؟اصلا اعمال ffu ربطي به EU ها يا Execution unit h ها ندارن :دي

اين فرض كاملا غلطه دوست من واحد هاي ISSUE اصلا در FFU قرار دارن و
ربطي به واحد هاي محاسباتي ALU ندارن.براتون بيشتر توضيح ميدم

دوست من همونطور كه خدمتتون گفتم اون alu هم دقيقا مثل alu هاي ديگر توان محاسباتي مشابهي داره(بالا بهش اشاره شد) دقيقا كار اونها رو انجام ميده + عمليات محاسبات خاص كه به اونها special function ميگن و اين alu ها كه بهشون SFU هم ميگن از XENOS تا همين نسل CYPRESS يعني 5870 هم به كار ميرفتن:

براي اينكه بيشتر اشنا بشيد و بدونيد SFU ها چي هستن به شكل زير كه نحوه قرار گيري alu ها درون processor يا stream core رو نشون ميده دقت كنيد:

CypressSP.jpg


SFU دقيقا براي انجام محاسبات خاص هست و در كنار ALU ها علاوه بر انجام 32BIT FP كه براي محاسبه توان محاسباتي به كار ميرفت ميتونه توابع خاص مثل SIN و logaritm و .. انجام بده.

اما چرا sfu در محاسبات shader opeartion شركت نميكنه؟ATI اون زمان در زمان طراحي هميشه يك SFU رو براي انجام عمليات هاي غير جبر در كنار ديگر ALU ها در نظر ميگره كه كار انجام
SIN, COS, LOG, etc رو انجام بدن به همين خاطر در بخش FFU خط لوله هاي ارجاع SHADER OPS تنها به 4 ALU عادي سپرده ميشدن.

تفاوت كلي sfu با alu در اضافه بودن يك sfu در كنار fp/int processor هست:براي درك بهتر:

اين شكل كلي يك ALU براي براي AMD هست:

streamprocessingunit.png


اينم براي sfu :

tunit.png


در واقع SFU ميتواند تمام اعمال ALU هارو انجام بده + transcendental ops ها به همين خاطر amd اين واحد رو به ffp مربوط به shader ops متصل نكرده براي همين هست كه 3 تا pipline مربوط به ffu براي انجام shader ops به 4 تا alu ميسپرده و براي transcendental ها هم SFU رو كنار ميگذاره.

خوب اميدوارم متوجه شده باشيد كه SFU ها دقيقا همون ALU ها هستن كه توانايي انجام Special function ها و transcendental ops هارو دارن اما به طور مستقيم به FFP هايي مثل Shader pipline براي انجام shader ops ها متصل نيست.

درمورد issue هم بايد بگم اين واحد در بخش ffu ها هست و اصلا ربطي به alu نداره براي allocating data براي alu ها هست مثل اين براي gt200b :دي

نوشته شده توسط 8030

قبلا دقیق یادم نیست این مطلب داخل ویکی خونده بودم ویا جای دیگه ولی مطمئن هستم .اون یک واحد برداری از 5واحد کم میشه وعملا نقش پخش کننده اطلاعات بین 4تا aluدیگه رو داره.

خوب ديديد كه كاملا اشتباه هست و اصلا ربطي به پخش كننده نداره اون پخش كننده اصلا در بخش ffu هستن و ربطي به ندارن execution unit ها ندارن دوست گلم.

اينم از اين.

اما نكته جالب

اينه كه شما ابتدا تراشه هارو بر اساس قدرت محاسباتي fp خامشون با هم مقايسه كردي


نوشته شده توسط 8030

از مقدار محاسبات هر پردازنده میشه اینو فهمید:

پلی3:
400گیگافلاپ gpuبعلاوه 230گیگافلاپ cpuمیشه 630گیگافلاپ

حالا ایکس باکس360

240گیگافلاپ gpuبعلاوه 99گیگافلاپ cpuمیشه حدود340گیگافلاپ

الان این دوتا 290گیگافلاپ توان محاسباتی اختلاف دارن اختلافی که اصلا کم هم نیست برای همینه که میگم ps3یه نسل جلوتره.


مثلا 240gflpos رو در برابر 400gflops براي RSX مقايسه كردي(اونجوري بايد 240 alu رو مد نظر قرار ميداديم) . اما حالا كه بحث Shader ops هارو وسط اوردي ميدوني كه قدرت shader ops زنوس بالاتر از RSX هست اگر ميخواستي از اول RSX رو قوي تر جلو بدي نبايد بحث Shader ops رو وسط ميكشديد.(يه جورايي ... :دي )

xenos: 96 billion shader operations per second

RSX:74.8 billion shader operations per second

نحوه محاسبشون هم اسونه و در ويكي موجوده

هرچند هيچ يك از اين المان ها در برتري كلي gpu ها تاثير مستقيم نداره و عوامل متعددي مثل حد occupation هسته ها و ميزان dependency limited دستورات اون نرم افزار يا موتور گرافيكي و ... خيلي چيز هاي ديگر عوامل موثر تري هستن.




--------------------------------------------




يك مشكل كه اينجا هست اينه كه اينجا انجمن تخصصي سخت افزار نيست و هركس هر تزي بخواد ميتونه بده و كسي اصلا متوجه نميشه.اگر اينجا همه به سخت افزار اشنايي ميداشتن بحث جالب ميشد و كسايي كه بحث رو دنبال ميكردن ميفهميدن كه قضيه در بحث ها از چه قراره.

موفق باشيد
 
آخرین ویرایش:

8030

کاربر سایت
Dec 10, 2010
2,445
نام
mohammad
درود:

خوب سعادت از بنده نبوده كه شمارو بشناسيم

اول از همه شما بحث قدرت محاسباتي fp رو وسط كشيديد و اونهارو با هم مقايسه كرديد .بحث shader op جداست و اصلا به نحوه محاسبه قدرت محاسباتي fp ربطي نداره و اين نشون ميده كه متاسفانه براي توجيح از يك شاخه به شاخه ديگه اي پريديد(اونجا زنوس به وضوح قوي تره و شما بنا به سياستت اصلا بحث shader ops ةارو وسط نكشيدي :دي).شما از اول بنا رو بر محاسبه نقاط شناور گذاشتي.اميدوارم در ادامه بحث ديگه جاده خاكي نريد و روي مسير مستقيم بحث رو ادامه بديد.من از اين شاخه به اون شاخه پردين متنفرم. :دي

اما توضيحاتي در مورد alu/sfu ها:

.دقت كنيد در ارايش 5wide vector ما در هر processor برابر 5 تا alu32bit داريم كه هركدوم ميتونن تا دو دستورالعمل رو در هر سيكل انجام بدن به وضوح در اينجا گفته:

processors is composed of a 5-wide vector unit (total 5 FP32 ALUs) that can serially execute up to two instructions per cycle

پس ميبينيد تا اينجا بين 5 ALU موجود تفاوتي نيست (بعدا در مورد تفاوت خدمتتون ميگم كه چرا يكي از ALU ها در انجام عمليات Shader operation دخيل نيست :دي)

دقت كنيد اينجا هنوز حرفي از انجام عمليات هايي كه توسط FFU ها به هسته ها ارجاع ميشه زده نشده(مثل انجام عمليات هاي shader operation كه بايد توسط ffu مربوط به اون به core ها ارسال بشه) اما توان خام محاسباتي GPU رو بايد در نظر بگيريم كه به اين صورت محاسبه ميشه:

48processor *10ops/cycle * 500mhz=240gflops

اين فرمول حتي براي جديد ترين محصولات AMD هم به همين صورته:

طبق فرمول بالا برای 4870 داریم: 4870 از 800 واحد SP تشکیل شده وبرای بدست اوردن SIMD باید بر تعداد ALU/SFU که برای SIMD های VLIW5 برابر 5 تا هست ما 160 هسته 5wide vector بدست میاریم:

محاسبه:


750mhz * 160 * 10 = 1200 Gflops

پس دیدیم برای 4870 ما 1.2Tera flops بدست اوردیم.

حالا بیاید برای 5870 هم محاسبه کنیم

محاسبه قدرت پردازشی hd 5870

در 5870 یا همون cypress ما 1600 واحد پردازشی sp یا ALU/SFU هارو داریم.پس با تقسیم بر 5 عدد 320 واحد SIMD رو بدست میاریم.فرکانس هسته هم 850 هست و طبق متد VLIW5 مثل 4870 در هر سیکل 10 عمل fp ضرب یا جمع رو انجام میده.(5 عمل MAD 32 bit رو انجام میده که هر MAD خود از ADD+MUL یعنی 2 عمل ضرب و جمع تشکیل شده پس ضرب در 2 میشود)

طبق فرمول گفته شده:

Stream Cores number * ops * frequncy = GFLOPS

320 * 10 * 850 = 2.72 Tflops

این قدرت 5870 در محاسبه single precision یعنی fp 32 اما برای fp 64 داریم:

320 * 2 * 850 = 544 Gflops
اين يك تز نيست بلكه يك يك حقيقت درمورد توان محاسباتي تراشه هاي amd هست.

اما در مورد shader operation :



پسر issue كجاست؟اصلا اعمال ffu ربطي به EU ها يا Execution unit h ها ندارن :دي

اين فرض كاملا غلطه دوست من واحد هاي ISSUE اصلا در FFU قرار دارن و
ربطي به واحد هاي محاسباتي ALU ندارن.براتون بيشتر توضيح ميدم

دوست من همونطور كه خدمتتون گفتم اون alu هم دقيقا مثل alu هاي ديگر توان محاسباتي مشابهي داره(بالا بهش اشاره شد) دقيقا كار اونها رو انجام ميده + عمليات محاسبات خاص كه به اونها special function ميگن و اين alu ها كه بهشون SFU هم ميگن از XENOS تا همين نسل CYPRESS يعني 5870 هم به كار ميرفتن:

براي اينكه بيشتر اشنا بشيد و بدونيد SFU ها چي هستن به شكل زير كه نحوه قرار گيري alu ها درون processor يا stream core رو نشون ميده دقت كنيد:

CypressSP.jpg


SFU دقيقا براي انجام محاسبات خاص هست و در كنار ALU ها علاوه بر انجام 32BIT FP كه براي محاسبه توان محاسباتي به كار ميرفت ميتونه توابع خاص مثل SIN و logaritm و .. انجام بده.

اما چرا sfu در محاسبات shader opeartion شركت نميكنه؟ATI اون زمان در زمان طراحي هميشه يك SFU رو براي انجام عمليات هاي غير جبر در كنار ديگر ALU ها در نظر ميگره كه كار انجام
SIN, COS, LOG, etc رو انجام بدن به همين خاطر در بخش FFU خط لوله هاي ارجاع SHADER OPS تنها به 4 ALU عادي سپرده ميشدن.

تفاوت كلي sfu با alu در اضافه بودن يك sfu در كنار fp/int processor هست:براي درك بهتر:

اين شكل كلي يك ALU براي براي AMD هست:

streamprocessingunit.png


اينم براي sfu :

tunit.png


در واقع SFU ميتواند تمام اعمال ALU هارو انجام بده + transcendental ops ها به همين خاطر amd اين واحد رو به ffp مربوط به shader ops متصل نكرده براي همين هست كه 3 تا pipline مربوط به ffu براي انجام shader ops به 4 تا alu ميسپرده و براي transcendental ها هم SFU رو كنار ميگذاره.

خوب اميدوارم متوجه شده باشيد كه SFU ها دقيقا همون ALU ها هستن كه توانايي انجام Special function ها و transcendental ops هارو دارن اما به طور مستقيم به FFP هايي مثل Shader pipline براي انجام shader ops ها متصل نيست.

درمورد issue هم بايد بگم اين واحد در بخش ffu ها هست و اصلا ربطي به alu نداره براي allocating data براي alu ها هست مثل اين براي gt200b :دي



خوب ديديد كه كاملا اشتباه هست و اصلا ربطي به پخش كننده نداره اون پخش كننده اصلا در بخش ffu هستن و ربطي به ندارن execution unit ها ندارن دوست گلم.

اينم از اين.

اما نكته جالب

اينه كه شما ابتدا تراشه هارو بر اساس قدرت محاسباتي fp خامشون با هم مقايسه كردي





مثلا 240gflpos رو در برابر 400gflops براي RSX مقايسه كردي(اونجوري بايد 240 alu رو مد نظر قرار ميداديم) . اما حالا كه بحث Shader ops هارو وسط اوردي ميدوني كه قدرت shader ops زنوس بالاتر از RSX هست اگر ميخواستي از اول RSX رو قوي تر جلو بدي نبايد بحث Shader ops رو وسط ميكشديد.(يه جورايي ... :دي )

xenos: 96 billion shader operations per second

RSX:74.8 billion shader operations per second

نحوه محاسبشون هم اسونه و در ويكي موجوده

هرچند هيچ يك از اين المان ها در برتري كلي gpu ها تاثير مستقيم نداره و عوامل متعددي مثل حد occupation هسته ها و ميزان dependency limited دستورات اون نرم افزار يا موتور گرافيكي و ... خيلي چيز هاي ديگر عوامل موثر تري هستن.




--------------------------------------------




يك مشكل كه اينجا هست اينه كه اينجا انجمن تخصصي سخت افزار نيست و هركس هر تزي بخواد ميتونه بده و كسي اصلا متوجه نميشه.اگر اينجا همه به سخت افزار اشنايي ميداشتن بحث جالب ميشد و كسايي كه بحث رو دنبال ميكردن ميفهميدن كه قضيه در بحث ها از چه قراره.

موفق باشيد
ببین دوست عزیز منظورت از یه شاخه پریدن رو شاخه دیگه رو نمیفهمم اگه میخوای حرف خودت رو رو کرسی بنشونی این جریانش فرق میکنه.

شما اومدی نسل جدید رو با اولین نسلی که اتحاد سایه زنی درش بکار رفته مقایسه میکنید .مسئله بسیار ساده هست ولازم نیست لقمه دور سرتون رو بپیچونید.

پسر issue كجاست؟اصلا اعمال ffu ربطي به EU ها يا Execution unit h ها ندارن :دي

بنده اصلا اشاره ایی به اعمال ffuنکردم این مثال درباره قدرت shaderجی پی یو بود:
Maximum shader operations: 96 billion shader operations per second (3 shader pipelines × 16 processors × 4 ALUs × 500 MHz

تعداد aluهایی که در عمل سایه زنی شرکت میکنن 192تا هست به این صورت که طبق نوشته خود سایت وکیپدیا به این صورت حساب میشه 3تا لوله در 16تا پروسسور در 4تا aluاین سه تا رو درهم ضرب که بکنید به عدد 192میرسید ضرب این سه تا هم کار سختیه یا باز میخوای اینم بپیچونی حالا این 192تا در فرکانس کاری gpuضرب میشه که تعداد عملیات سایه زنی gpuرو در ثانیه رو به ما نشون میده.

واما execution unitکه اشاره کردید در زنوس بخاطر اینکه طراحی بسیار قدیمی بوده از بعضی از این قسمتهای اشاره شده استفاده نشده وبا یک جستجوی ساده در اینترنت هم میتونید چارت رو ببینید این عکسهایی رو هم که گذاشتید مال gpuهای نسل جدید هستند که ساختمان داخلی پردازنده جریانی رو نشون میده.

برای بدست اوردن کل محاسبات شناور همه 240واحد برداری در 10opsدرثانیه که میتونن عملیات در ثانیه انجام بدن ضرب میشن.

در کل زنوس دارای 48تا پردازنده جریانی و192تا aluکه میتونن عملیات سایه زنی رو انجام بدن هست وکل محاسبات شناور این پردازنده 240گیگافلاپ هست.

اون عکسهایی رو هم که گذاشتید مال معماری جدید gpuها هست یه عکس از داخل خود spخود زنوس بزارید.

درک این مطلب هم هنوز سخته یا میخواید با گذاشتن چهار تا عکس وچند تا الفاظ خارجی دوستانتون رو خوشحال کنید .
 

shefer

کاربر سایت
Aug 27, 2009
2,365
نام
mazyar
8030
به عنوان یه ناظر که حرف هر دو طرف رو میخونه میتونم بگم که شما تو سفسطه کردن همین الا به lvl 50 رسیدی !
پ.ن : واقعا بعد نیست بعضی وقتا ادم به جای خراب کردن خودش با سفسطه ، یه مقدار منطقی فکر کنه...
 

8030

کاربر سایت
Dec 10, 2010
2,445
نام
mohammad
8030
به عنوان یه ناظر که حرف هر دو طرف رو میخونه میتونم بگم که شما تو سفسطه کردن همین الا به lvl 50 رسیدی !
پ.ن : واقعا بعد نیست بعضی وقتا ادم به جای خراب کردن خودش با سفسطه ، یه مقدار منطقی فکر کنه...
کجاش سفسطه بوده؟
اشاره کن.
 

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
ببین دوست عزیز منظورت از یه شاخه پریدن رو شاخه دیگه رو نمیفهمم اگه میخوای حرف خودت رو رو کرسی بنشونی این جریانش فرق میکنه.

شما اومدی نسل جدید رو با اولین نسلی که اتحاد سایه زنی درش بکار رفته مقایسه میکنید .مسئله بسیار ساده هست ولازم نیست لقمه دور سرتون رو بپیچونید.

پسر issue كجاست؟اصلا اعمال ffu ربطي به EU ها يا Execution unit h ها ندارن :دي

بنده اصلا اشاره ایی به اعمال ffuنکردم این مثال درباره قدرت shaderجی پی یو بود:
Maximum shader operations: 96 billion shader operations per second (3 shader pipelines × 16 processors × 4 ALUs × 500 MHz

تعداد aluهایی که در عمل سایه زنی شرکت میکنن 192تا هست به این صورت که طبق نوشته خود سایت وکیپدیا به این صورت حساب میشه 3تا لوله در 16تا پروسسور در 4تا aluاین سه تا رو درهم ضرب که بکنید به عدد 192میرسید ضرب این سه تا هم کار سختیه یا باز میخوای اینم بپیچونی حالا این 192تا در فرکانس کاری gpuضرب میشه که تعداد عملیات سایه زنی gpuرو در ثانیه رو به ما نشون میده.

واما execution unitکه اشاره کردید در زنوس بخاطر اینکه طراحی بسیار قدیمی بوده از بعضی از این قسمتهای اشاره شده استفاده نشده وبا یک جستجوی ساده در اینترنت هم میتونید چارت رو ببینید این عکسهایی رو هم که گذاشتید مال gpuهای نسل جدید هستند که ساختمان داخلی پردازنده جریانی رو نشون میده.

برای بدست اوردن کل محاسبات شناور همه 240واحد برداری در 10opsدرثانیه که میتونن عملیات در ثانیه انجام بدن ضرب میشن.

در کل زنوس دارای 48تا پردازنده جریانی و192تا aluکه میتونن عملیات سایه زنی رو انجام بدن هست وکل محاسبات شناور این پردازنده 240گیگافلاپ هست.

اون عکسهایی رو هم که گذاشتید مال معماری جدید gpuها هست یه عکس از داخل خود spخود زنوس بزارید.

درک این مطلب هم هنوز سخته یا میخواید با گذاشتن چهار تا عکس وچند تا الفاظ خارجی دوستانتون رو خوشحال کنید .

دوست گلم اول از همه بگو خدايي ميخواي بحث كني يا سفسطه ؟ ميخواي كل كل الكي كني يا بحث مردونه ؟؟؟

نوشته شده توسط 8030

تعداد aluهایی که در عمل سایه زنی شرکت میکنن 192تا هست به این صورت که طبق نوشته خود سایت وکیپدیا به این صورت حساب میشه 3تا لوله در 16تا پروسسور در 4تا aluاین سه تا رو درهم ضرب که بکنید به عدد 192میرسید ضرب این سه تا هم کار سختیه یا باز میخوای اینم بپیچونی

تو باز چرا عمليات سايه زني رو وسط ميكشي؟ مگه تو قدرت تراشه رو براساس gflops توي اين پست

نوشته شده توسط 8030

از مقدار محاسبات هر پردازنده میشه اینو فهمید:

پلی3:
400گیگافلاپ gpuبعلاوه 230گیگافلاپ cpuمیشه 630گیگافلاپ

حالا ایکس باکس360

240گیگافلاپ gpuبعلاوه 99گیگافلاپ cpuمیشه حدود340گیگافلاپ

الان این دوتا 290گیگافلاپ توان محاسباتی اختلاف دارن اختلافی که اصلا کم هم نیست برای همینه که میگم ps3یه نسل جلوتره.

بر اساس gigaflops محاسبه نكرديو بعد نتيجه گرفتي كه ps3 يك نسل هم جلوتره؟؟اگر بخواي بر اساس shader ops محاسبه كني كه باز ps3 يك نسل عقب ميوفته مهندس.96 براي زنوس و 74.8 براي rsx .

لاقل براي رفع گاف سعي نكنيد حرفي كه خودتون زديد رو كتمان كنيد چيز ديگه اي جاش بنشونيد

نوشته شده توسط 8030

برای بدست اوردن کل محاسبات شناور همه 240واحد برداری در 10opsدرثانیه که میتونن عملیات در ثانیه انجام بدن ضرب میشن.

در کل زنوس دارای 48تا پردازنده جریانی و192تا aluکه میتونن عملیات سایه زنی رو انجام بدن هست وکل محاسبات شناور این پردازنده 240گیگافلاپ هست.

پسر تو چرا اينجوري محاسبه ميكني؟؟؟ مگه طرز بدست اوردنشو پست قبلي نگفتم؟؟چجوري با 4 تا alu به 240 گيگافلاپس ميرسي؟با 4 تا alu شما به 192 گيگافلاپس ميرسي؟اصلا شما فهميدي قضيه از چه قراره؟؟

كي گفته هر پروسسور stream برابر 4 تا alu داره پ؟ چرا حرف الكي از خودت در مياري؟كجاي نت نوشته هر processor از 48 تاي اون 4 تا alu داره ؟ مگر منبعت ويكي نيست؟ چيدمان زنوس رو مگر اين ننوشته؟

On the chip, the shader units are organized in three SIMD groups with 16 processors per group, for a total of 48 processors. Each of these processors is composed of a 5-wide vector unit (total 5 FP32 ALUs)l

ميخواي گنده ترش كنم ؟

زنوس 48 تا stream processor داره كه هركدوم شامل 5 تا alu هستن.جان من يكي بياد اينو واسه اين رفيقمون ترجمه كنه.

هر پروسسور ميتونه در هر سيكل 10 عمل fp32 رو انجام بده چون هر alu ميتونه 2 تا عمل fp32 رو انجام بده. 5ALU*2=10 ops اينجا هم اشاره كرده دوست عزيز:

(total 5 FP32 ALUs) that can serially execute up to two instructions per cycle (a multiply and an addition بنا بر اين‌: Thus each of the 48 processors can perform 10 floating-point ops per cycle

حالا قدرت محاسباتي چجوري بدست مياد؟؟

240=2ops * 5alu * 48 stream processor *500hz

رفيق بفهم هر ALU ميتونه 2 عمل رو همزمان انجام بده در هر سيكل و * 5 ميشه 10 تا.اگه 4 تا ALU ميداشت ميشد 8 عمل توسط هر SP يعني : 4ALU * 2 ops= 8 ops

2ops*4alu*48 stream processor*500hz=192

اونجوري ميشد 192 گيگا فلاپس

يعني خدايي شمايي كه اينقدر خودتو خداي سخت افزار ميگيري نميتوني اين محاسبات مربوط به دوره ..... رو درك كني؟؟

پسر اين براي محاسبه fp بود دقت كن 240 giga fp/s كه ميگن مال محاسبه fp ها است نه shader ها .شيدر هارو اگه بادقت ميخوندي ميخوندي ميفهميدي چرا از sfu براي محاسبشون استفاده نميشه.

در مورد معماري هم جدا يعني تو اين رو تا حالا نخوندي؟

the Xenos introduced new design ideas that were later adopted in the R600 series

معماري XENOS اولين نسل از Unidied ها بود كه بر اساس معماري ابتدايي 5wide vector alu اومد و amd با تغييراتي اون رو از نسل R600 كه در واقع اولين Unified shader ها براي pc بود استفاده كرده و اون رو تا نسل Evergreen ادامه دادهamd از نسل R600 تا نسل Evergreen از سيستم VLIW 5 استفاده كرد و همونطور كه ديدي برا محاسبه fp32 بين xenos و HD5870 تفاوتي نيست.

نحوه محاسبشون هم اينطوريه

Stream Cores number * ops * frequncy = GFLOPS

بالاتر براي 5870 هم محاسبه كردم.

حتي SIMD Group ها درنسل evergreen هم تفاوتي نكرده و از 16 تا 5 تايي تشكيل شده به اين صورت: اينجوري كه اينجا نوشته:
the shader units are organized in three SIMD groups with 16 processors per group

براي مثلا 5870 كه اخرين نسل vliw-5 بود داريم:

SIMDcore.png


كه دقيقا 16 تا گروه 5 تايي در هر SIMD group قرار داره و اين از نسل r600 تا
R800 كه همون evergreen باشه ادامه پيدا كرده.تنها تغييرا اضافه شدن محاسبات dp و ..... ديگست كه در يكي از كامنت هاي hotoverclock اشاره كردم.

رفيق اول يكم مطالعه سخت افزاري بكن بعد بيا با هم بحث مردانه داشته باشيم.روي اصول.نه بجث بازي و مسخره بازي كه بيا عكس از داخل gpu اش بزار.اگر بارته و توانايي رد داري بيا عين مرد بحث كن.سفسطه گري در بياري ناراحتم ميكني ژسره خوب

نوشته شده توسط 8030

کجاش سفسطه بوده؟

اشاره کن.


پسر مردم كور كه نيستن.عين مرد بيا بحث كن و حرفاي خودت رو نقض نكن.

تو داري از محاسبات fp ميگي يه هو ميري روي shader ops كه اصلا ربطي به صحبت هاي اون كامنتت نداشت.از روي shader ops ها اومدي نتيجه گرفتي كه اينجوري 4 تا فقط alu داره.كه اون رو به 2 شكل نقض كردم.هم به صورت محاسبه fp كه بايد 5 تا alu باشن هم نوشته خود ويكيپديا كه ديگه داد ميزنه.

لاقل نميري از توي صحبت هاي كامنت بالا بخوني كه چرا توي shader ops ه5 امين alu نمياد توي محاسبه.اصلا اون alu چرا به صورت sfu هست و ...
 
آخرین ویرایش:
وضعیت
گفتگو بسته شده و امکان ارسال پاسخ وجود ندارد.

کاربرانی که این قسمت را مشاهده می‌کنند

Top
رمز عبور خود را فراموش کرده اید؟
or ثبت‌نام سریع از طریق سرویس‌های زیر