imnotaretardlikeu
کاربر سایت
متاسفانه واقعا دیگه خسته شدم از توضیح دادن واضحات، اگرم دارم به این بحث ادامه میدم فقط برای اینه که شاید چند تا خواننده از این بحث چیزی یاد بگیرن.
متاسفانه حرفهایی که داری میزنی تماما اشتباهه و اصلا به این شکلی که میگی نیست، اتفاقا دقیقا بر عکسه و توی این زمینه unified shader architecture مشکلاتی داره که به این سادگیها هم حل نمیشه. البته در مجموع (فقط به خاطر اینکه با این ساختار میشه هر زمانی که لازم بود shader unit ها رو به هر کدوم از پیکسل شیدر یا ورتکس شیدر که نیاز بود اختصاص بدیم) درسته که راندمان بالاتره اما نه بخاطر این چیزهایی که گفتی چون اینها به هیچ عنوان درست نیستن.
اصلا راندمان اینجا مهم نیست. من اگه یه لامبورگینی داشته باشم که حداکثر سرعتش 400 تا باشه و منم توی جاده تهران قزوین زنجان باهاش برونم، شاید یه تیکه از مسیر و بتونم از 50 درصد سرعتش استفاده کنم، شاید یک جا 70 درصد و یه جا هم 25 درصد اما یقینا با این ماشین زودتر میرسم تا یه پیکان که حداکثر سرعتش 100 تا باشه، حالا میخواهد من کل جاده رو با همون 100 تا برونم.
توی عکس اول و دوم یقینا نمیشه از کل مجموع قدرت shader ops پردازنده گرافیکی استفاده کرد (برای همین هم جمع کردن قدرت pixel shader , vertex shader توی ساختار قدیمی و non unified اشتباهه) و توی عکس سوم شاید بشه از درصد خیلی بالایی از قدرت shader ops ماکزیمم پردازنده استفاده کرد اما موضوع اینجاست که اولا من توی اون مقایسه فقط pixel shader ops رو محاسبه کردم و مقایسه کردم، ثانیا ماکزیمم قدرت shader ops پردازنده گرافیکی 360 خیلی کمتر از حتی pixel shader ops پردازنده rsx هستش، خیلی ساده بگم هر حالتی که برای 360 از نظر shader ops قابل دستیابی باشه به راحتی برای rsx هم هست اما اگه بر فرض توی یک صحنه ما 5 میلیارد vertex shader ops داشتیم و 60 میلیارد pixel shader ops اونوقت این حالت خارج از توانایی xenos هستش در صورتیکه به راحتی توسط rsx قابل اجراست.
در ضمن همونجوری که گفتم نیاز به pixel shader ops خیلی بیشتره تا vertex shader ops (برای همینم حتی کارتهای گرافیکی high end هم بیشتر از 8 تا ورتکس شیدر یونیت نداشتن اما بعضیهاشون 48 تا پیکسل شیدر یونیت داشتن) پس در صورتیکه نیاز باشه rsx میتونه 74.8 میلیارد pixel shader ops بر ثانیه رو انجام بده اما xenos حداکثر میتونه 48 میلیارد انجام بده (حتی اگه فرض کنیم اصلا نیازی به vertex shader ops نداشته باشه که اگه داشته باشه این مقدار خیلی کمتره)
همون 3 تا عکس رو یکبار دیگه نگاه کن، فرض کن عکس سوم مال xenos باشه و اون خط هم 48 واحد باشه به نشونه مجموع 48 میلیارد shader ops قدرت محاسباتی. حالا اون دو تا عکس اولی رو هم در نظر بگیر و فرض کن برای rsx باشه، خط پایینی برای pixel shader باشه به اندازه 74.8 واحد (برای 74.8 میلیارد pixel shader ops) و خط بالایی هم 8.8 واحد باشه (برای 8.8 میلیارد vertex shader ops) مشخصه که توی هر حالتی شاید درصد زیادی از اون دو تا خط خالی باشن (راندمان استفاده از مجموع قدرت سایه زنی خیلی بالا نباشه) اما یقینا مجموع اونها در صورتیکه نیاز باشه و بازیساز بخواهد استفاده کنه میتونه خیلی بیشتر از عکس سوم باشه.
البته منم گفتم اگه در مورد این مقاله حرفی یا توضیحی داری که از خودت باشه (نه تکرار همون حرفهای اون مقاله) بگوشرمنده ... من فقط در مورد اون مقاله بحث می کنم ...
متاسفانه نگرفتی وگرنه این کامنت الان اینجا نبوداون مطالبی که گفتی را من خیلی خوب متوجه شدم اما مثل اینکه شما درست نگرفتی ... جالبه که چقدر هم راحت متهم به بی اطلاعی میشم ... وقتی شما نمیگیری تغصیر من چیه
کسی راجع به راندمان صحبت نکرد، موضوع بحث تعداد shader ops در هر ثانیه است که توی مقاله گفته شده 96 میلیارد در صورتیکه انقدر نیست و مقدار صحیحش 48 میلیارده که تازه مقایسه اونهم با 74.8 میلیارد pixel shader ops توی rsx اشتباهه (به همون دلیلی که توضیح دادم)من گفتم سایه زنی یکپارچه بصورت موازی اجرا میشه ... یعنی شما نباید و نمیتونی راندمان یک معماری سایه زنی مجزا را که بصورت سری اجرا میشه را مستقیما با یک معماری سایه زنی یکپارچه که بصورت موازی اجرا میشه مقایسه کنی ... کاری که خیلی ساده داری انجام میدی و اصلا در نظر نمی گیری ...بزار برات توضیح بدم ...
البته فکر کنم منظورت rsx هستش چون RTS یکجور سبک بازیه، بهرحال ...Xenos حدود 48 واحد سایه زنی واحد داره که هم میتونه راسی باشه و هم پیکسلی در مقابل RTS که 24 واحد سایه زنی پیکسلی داره و 8 واحد سایه زنی راسی البته بصورت معماری مجزا
خب حتما فکر کردی که تفاوت این دو معماری فقط در مجزا و واحد بودنشونه ... نخیر اینطور نیست .... یک بازی را در نظر بگیر که دارای هر دو پروسه ی سایه زنی راسی و پیکسلی هست ... در ساختار مجزا اول یک دستوربه واحد سایه زنی راسی ارسال میشه و اون عملیات اجرا میشه و پس از انجام این عملیات نوبت به واحد سایه زنی پیکسلی میرسه و همین پروسه ادامه پیدا میکنه ( البته به نسسبت تعداد عملیات سایه زنی راسی در مقابل پیکسلی ) که یعنی تاخیر پشت تاخیر ... این خودش کلی راندمان و کارایی را میاره پایین .... اما در معماری یکپارچه هر دو سایه زنی راسی و پیکسلی در آن واحد بطور مشترک احرا میشند و هیج تاخیری در اجرای دستور ها وجود نداره ... این یعنی خودش کلی افزایش راندمان و کارایی ...
پس مقایسه کردن رو در رو و مستقیم تعداد واحد های سایه زنی این دو معماری و مقایسه ی کارائیش از روی این اعداد از بزرگترین اشتباهیه که کسی میتونه تو زندگیش انجام بده
متاسفانه حرفهایی که داری میزنی تماما اشتباهه و اصلا به این شکلی که میگی نیست، اتفاقا دقیقا بر عکسه و توی این زمینه unified shader architecture مشکلاتی داره که به این سادگیها هم حل نمیشه. البته در مجموع (فقط به خاطر اینکه با این ساختار میشه هر زمانی که لازم بود shader unit ها رو به هر کدوم از پیکسل شیدر یا ورتکس شیدر که نیاز بود اختصاص بدیم) درسته که راندمان بالاتره اما نه بخاطر این چیزهایی که گفتی چون اینها به هیچ عنوان درست نیستن.
اصلا راندمان اینجا مهم نیست. من اگه یه لامبورگینی داشته باشم که حداکثر سرعتش 400 تا باشه و منم توی جاده تهران قزوین زنجان باهاش برونم، شاید یه تیکه از مسیر و بتونم از 50 درصد سرعتش استفاده کنم، شاید یک جا 70 درصد و یه جا هم 25 درصد اما یقینا با این ماشین زودتر میرسم تا یه پیکان که حداکثر سرعتش 100 تا باشه، حالا میخواهد من کل جاده رو با همون 100 تا برونم.
توی عکس اول و دوم یقینا نمیشه از کل مجموع قدرت shader ops پردازنده گرافیکی استفاده کرد (برای همین هم جمع کردن قدرت pixel shader , vertex shader توی ساختار قدیمی و non unified اشتباهه) و توی عکس سوم شاید بشه از درصد خیلی بالایی از قدرت shader ops ماکزیمم پردازنده استفاده کرد اما موضوع اینجاست که اولا من توی اون مقایسه فقط pixel shader ops رو محاسبه کردم و مقایسه کردم، ثانیا ماکزیمم قدرت shader ops پردازنده گرافیکی 360 خیلی کمتر از حتی pixel shader ops پردازنده rsx هستش، خیلی ساده بگم هر حالتی که برای 360 از نظر shader ops قابل دستیابی باشه به راحتی برای rsx هم هست اما اگه بر فرض توی یک صحنه ما 5 میلیارد vertex shader ops داشتیم و 60 میلیارد pixel shader ops اونوقت این حالت خارج از توانایی xenos هستش در صورتیکه به راحتی توسط rsx قابل اجراست.
بازم میگم توی xenos نسبت دستیابی به قدرت، به ماکزیمم قدرت (48 میلیارد shader ops) بالاتره اما توی rsx درسته اون نسبت توی بعضی حالات کمتره اما در صورتیکه نیاز باشه قدرتی که میشه بهش دست پیدا کرد خیلی بیشتره.حالا این هیچی فرض کن یک بازی 80 درصد پردازش سایه زنی راسی داره 20 درصد پردازش سایه زنی پیکسلی ... خب خودت حساب کن تو این وضعیت کدوم معماری بهتر جواب میده ... حالا در نظر بگیر 100 درصد پردازش مربوط به سایه زنی راسی و سا صددرصد مربوط به سایه زنی پیکسلی باشه ... در این یکی هم مطمعنا Xenos وضعیت بهتری داره ... پس انعطاف پذیری در شرایط پردازشی مختلف و نسبت مختلف سایه زنی های راسی و پیکسلی یکی دیگر از برتری های چشم گیر این معماری هست ...
این اماری که شما ارائه دادی فقط وقتی صحیحه که هیچ تفاوتی در راندمان دو معماری وجود نداشته باشه که اصلا اینطور نیست ...
در ضمن همونجوری که گفتم نیاز به pixel shader ops خیلی بیشتره تا vertex shader ops (برای همینم حتی کارتهای گرافیکی high end هم بیشتر از 8 تا ورتکس شیدر یونیت نداشتن اما بعضیهاشون 48 تا پیکسل شیدر یونیت داشتن) پس در صورتیکه نیاز باشه rsx میتونه 74.8 میلیارد pixel shader ops بر ثانیه رو انجام بده اما xenos حداکثر میتونه 48 میلیارد انجام بده (حتی اگه فرض کنیم اصلا نیازی به vertex shader ops نداشته باشه که اگه داشته باشه این مقدار خیلی کمتره)
همون 3 تا عکس رو یکبار دیگه نگاه کن، فرض کن عکس سوم مال xenos باشه و اون خط هم 48 واحد باشه به نشونه مجموع 48 میلیارد shader ops قدرت محاسباتی. حالا اون دو تا عکس اولی رو هم در نظر بگیر و فرض کن برای rsx باشه، خط پایینی برای pixel shader باشه به اندازه 74.8 واحد (برای 74.8 میلیارد pixel shader ops) و خط بالایی هم 8.8 واحد باشه (برای 8.8 میلیارد vertex shader ops) مشخصه که توی هر حالتی شاید درصد زیادی از اون دو تا خط خالی باشن (راندمان استفاده از مجموع قدرت سایه زنی خیلی بالا نباشه) اما یقینا مجموع اونها در صورتیکه نیاز باشه و بازیساز بخواهد استفاده کنه میتونه خیلی بیشتر از عکس سوم باشه.