بحث و تبادل نظر درمورد سری 700 انویدیا (کپلر بزرگ)

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
Big Kepler​


37795323876324368412.jpg

41615660863634944054.jpg




درود - شرمنده دوستان این چند مدت مشغول کارهایی بودم نتونستم خدمت برسم


GTC 2012 نزدیکه و باز هم شایعات شکل گرفتن - شایعاتی که قدیم هم ایجاد شد و AMD fan ها نه تنها اینجا در ایران بلکه در سایر نقاط دنیا هم با قدرت تمام شروع به مسخره کردن اونها کردن و گفتن (چطور جرات میکنید در مورد این مزخرفات حرف بزنید؟)


خوب مزخرفاتی مثل اینکه 1536 هسته قراره در تراشه ای جای بگیره که از Tahiti هم کوچکتره (اون زمان براورد 320mm2 بود بعد شد 294mm2 و خیلی این رو شوخی قرن دونستن) بعد هم شایعات اغلب میگفت تراشه کمی قویتر از 7950 هست و اصلا در حد تاهیتی xt نیست - عرضه شد و به طور میانگین تا 17% از رقیب سریعتر بود.)


خلاصه این ها همه شایعات بودن و GK104 کوچولوی سری کپلر تمام براورد هارو بهم زد و افسانه ای خلق کرد . اما حقیقتا راستش رو بخواید من اصلا از GK104 یا همون GTX660 واقعی که به نام 680 عرضه شده خوشم نمیومد - این برای Midrange کاران و کسایی که سیستمی در حد مصرف کم و اما کارایی بالا میخوان مناسب بوده و خوب 36% افزایش نسبت به GTX580 و حدود 17% نسبت به حریف بزرگتر - 3GB و 384bit ای خودش تاهیتی با مصرف و دمای تولیدی بسیار کمتر شاهکار مهندسی انودیا برای این رده بود.اما این اصلا برای منی که عادت به تراشه های وحشی و پر سر وصدا پر مصرف دارم راضی کننده نیست




هرچند بارها خدمت دوستان گفتم GK104 جایگاهش اینجا نیست و شاید اگر AMD پرچمدار خودش رو با قدرت خیلی بیشتری ارائه میکرد - انودیا هم مجبور میشد چیزی به نام GK100 رو به عنوان Flag ship سری 600 خودش رونمایی کنه.که متاسفانه این نشد و amd نه تنها این کارو نکرد بلکه قیمت 7970 از 680 هم بالاتر (حدود50$) و هم پر مصرف تر - کند تر - پر صرو صدا تر و .... که این باعث شد انودیا با خیال راحت رده های قیمتی خودش رو توی سر AMD بزنه.


بگذریم . حالا اخبار جدید چی هستن ؟؟ چه خبر از کپلر اصلی ؟؟؟


7Billion transsistor Chip just rumors


6 میلیارد رو فراموش کنید - بیاید فکر کنیم با 7 میلیارد ترانزیستور چه میشه کرد


نظرتون در مورد تراشه ای با 7 میلیارد ترانزیستور چیه؟؟ به نظرتون چنین هیولایی با معماری کپلر چه کارها میتونه بکنه؟؟


خوب انودیا با 3.5 میلیارد ترانزیستور GK104 رو خلق کرد - تراشه ای بسیار کارامد و چندین برابر براورد ها - طوری که حتی هواداران خود انودیا هم فکر همچین چیزیو نمیکردن.اما این 3.5 میلیارد تنها برای رده میانی انودیا بوده .


کوچولو رو فراموش کنید و به Big Kepler بیاندیشید.تراشه ای که طبق شایعات تایید نشده قراره داخل اون از پردازنده های ARM استفاده بشه و هم برای گیمینگ - هم برای Quadro و اعمال GPGPU ,و هم در ابر کامپیوتر های Tesla از اون استفاده بشه.


طبق شایعان در کنفراتس GTC قراره تراشه ای با چنین مشخصاتی رونمایی بشه :


Kepler-7billion.jpg



چیزی که در خبر های مختلف پیش از کنفرانس GTC 2012 عنوان شده اینه که این تراشه بسیار بزرگ خواهد بود و انودیا در طراحی اون ار هیچ تکنولوژی کم کسر نخواهد گذاشت.


تراشه ای که به قول شایعات قدیم توانایی Autonomously processing بالایی به لطف پردازنده arm که در اون وجود داره بهره مند هست و این تراشه درواقع اوج نبوغ مهندسین انودیا خواهد بود.


برخی اطلاعات کلی دیگر :


GeForce GTX 680's GPU core code is GK104. The numerals normally indicate that the GPU is just a 'mid-range' contender
GK110 / GK100 has long been the rumored flagship core code for the Kepler series
195W TDP of the GeForce GTX 680 is yet another telling sign even though it could match and surpass 250W TDP cards from AMD (Radeon HD 7970)
Only 256-bit wide graphics memory interface - again a trait of mid-range GPUs (which luckily for the GTX 680 is somewhat sufficient)
Spare space for extra graphics Molex power connector​


خوب نظر شما در مورد شکل کلی اون چه خواهد بود ؟؟


ایا گسترش یافته GK104 و طبق شایعات با 12 فروند : دی SMX که مجموع هسته های اون رو به عدد 2304 عدد میرسونه؟؟


تصویر GF104 منبع طراحی نسل کپلر GK104 که در زیر هست:


fullGF104.jpg


تصویر GK104 با 8SMX گسترش یافته نسل GF104/114


GeForce_GTX_680_Block_Diagram_FINAL_575px.png


تصویر احتمالی و فیک GK110 با 12SMX


26030677421850113730.jpg


خوب طبق براورد ها در بدترین حالت اضافه کردن 50% هسته های بیشتر یعنی اضافه کردن 505 ترانزیستور بیشتر و این برای تصویر بالا یعنی تنها 5.3 میلیارد ترانزیستور -. اگر قرار به افزایش SCALE این gk104 باشه و طبق شایعات قراره با 7 میلیارد ترانزیستور - یعنی 100% افزایش تعداد ترانزیستور ها .پس میتونیم تراشه ای با 14SMX متصور بشیم.


(هرچند بسیار بسیار بعید هست)


تصویر فیک و احتمالی GK110 با 14SMX :


81757011635897256868.jpg




خوب تا اینجا همه چیز احتمال بود و البته شایعات . اما تجریه نشون داده انودیا در نود های مختلف از یک معماری استفاده نمیکنه.این نکته ای هست که باید توجه داشت.


به چند دلیل احتمال حقیقی شدن تصاویر بالا بسیار بعیده به دلایل زیر:


1: تکنیک smx های موجود در GK104 بسیار مناسب هست و برای بازی بازدهی وحشتناکی داره - اما برای اعمال gpgpu-computing قطعا بازدهی خوبی نداره.


2: احتمال بسیار زیاد GK110 بر اساس نوع گسترش یافته GF100/110 خواهد بود نه GK104 که گسترش یافته GF104/114 هست.


3:کپلر بزرگ یا BigK قراره هم توان GPGPU خوبی داشته باشه هم توان گیمینگ - این وظیفه قطعا از عهده smx های با control unit ضعیف نسبت به نسل فرمی بر نمیاد و انودیا به دنبال SM هایی با Control unit پیشرفته در حد نسل فبلی خواهد بود.


4: احتمال زیاد تعداد هسته ها 2048 عدد خواهد بود - هر sm در فرمی 32 هسته داشت و 4 برابر اون میشه sm هایی با 128 هسته. اگر 16sm در تراشه باشه تعداد هسته ها به 2048 میرسه.


5:یه احتمال دیگه هم گزارش نزدیک به 2500 هسته بودن GK110 رو داده که اگر تعداد هسته ای هر SM رو به 160 عدد برسونیم بر پایه GF100/110 اونوقت به 2560 هسته این کانفیگ هم نزدیک میشیم.




حرف اخر:


GK110 هر چیز باشه قطعا هیولایی خواهد بود که انودیا رو در بازار HPC-Quadro ها سربلند خواهد کرد و فروش خودش رو در اون بخش ها طبق پیش بینی انتظار HPC سازان براورد خواهد کرد.


تا کنفرانس GTC 2012 صبر میکنیم ببنیم BIG K چه از اب در خواهد امد.




------------------------------------


خلاصه ویژگی های احتمالی Big Kepler : (احتمالی و شایعات)


1: در این تراشه قراره از پردازنده های ARM به منظور توان خودکفایی GPU بدون نیاز به CPU برای انجام اعمال مورد خودش نیازش استفاده بشه.0احتمال 995 از نسل Cortex A15 هست چون A9 کلا برای Node 40nm هست.


2: در این تراشه چیزی بین 6 الی 7 میلیارد ترانزیستور قراره استفاده بشه ( 2برابر GK104 در رده میانی انودیا)


3: این تراشه هم برای GPGPU - HPC ها مناسب خواهد بود و هم برای مصارف Gaming


4: توان مصرفی این تراشه جیزی بین 250w-300w هست .


5:این تراشه طبق برنامه ها برای اگوست اماده به کار هست اما زمان عرضه اون دقیق مشخص نیست.
 

hosein me

کاربر سایت
Jan 21, 2010
8,944
نام
حسین
بسیار هم عالی کلا باید کارت های سری 4و 5 را بریزیم تو سطل زباله !!!با وجود سری 6و 7 جهش نیست که پرواز کزده کارهای سری 6و 7>:d
 

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
خوب - بار ها گفتم بحث های مربوط به جوجه ها اصلا رضایت بخش نیست . چه میخواد راجع به 680 باشه چه بخواد خبر های جدید و تصویر رو نمایی شده 690 باشه.





NVIDIA-GTX-690.jpg


GTX690


کارتی که دو تا جوجه کپلر درونشه و من شخصا با اینکه قیافش بدکم نیست (به عللی خوشم نمیاد :D)


غیر از خبر های این کارت و 670 که قراره در ماه may ازشون بهره برداری بشه - من با خبر های کم هیجان اصلا میونه خوبی ندارم.


بنا بر این بیایم خبر های اصلی مربوط به Big K یا همون کپلر بزرگ رو اینجا ادامه بدیم.


nvidia-gpu-technology-conference-recordings-big_0_53.jpg


همونطور که میدونید کنفرانس GTC2012 که در San Jos در تاریخ May 14 – 17 قراره برگزار بشه احتمال بسیار زیاد بعد از عرضه GTX690 که تصویرشو بالا میبینید برگزار میشه.


انودیا میخواد با عرضه زود هنگام 690 یکم خودشو دوباره تو خبر ها بزاره(احتمالا عرضه 690 در 5 ماه may خواهد بود) تا برسه به اصل کاری - بله GK110 که انودیا از همین الان خبر سفارش های ویفر های بزرگ 450Millimiter برای قرار دادن تراشه هایی بزرگ با Yield بالا روی اون ویفر ها داره اماده سازی میشه.


انودیا بسیار بسیار در حال حاظر از TSMC نا امید هست و تولیدات بسیار پایین این شرکت مهم تولید کننده نیمه هادی جواب گوی در خواست بسیار بالای انودیا رو نمیده.همونطور که میدونید با اینکه از مدت ها پیش انویدیا مشغول تولید 680 بوده و با حجم بسیار زیادی اون رو در جهان عرضه کرده اما در روز های اول تمام فروشگاه های اینترنتی و غیر اینترنتی با کمبود اون مواجه شدن و عملا 680 تبدیل به گنج یافت نشدنی شد.(همونطور که همه سایتها پیش بینی کردن و همین علت پایین نیاوردن قیمت 7970 بود-680 برای خرید وجود نداشت)


مشکل تولیدات کم TSMC اونقدر بود که انودیا در حال حاظر با کمپانی عظیم SAMSUNG و احتمالا در اینده UMC برای قرارداد های 28nm و اینده محصولاتش رقم زده واین شرکت نیازمند supplier ها بیشتری هست.


مورد مهم دیگه تراشه هایی بسیار بزرگ هستن که انودیا برای تولید حدا اکثری اونها نیاز به ساپورت زیاد فقط برای اون بخش هست . بله تراشه هایی با 7 میلیارد ترانزیستور که قطعا این تولیدات کم TSMC قادر به ساپورت اون نیست.


تراشه ای با این توصیفات:


Individuals from the GPU architecture and CUDA software groups will dive into the features of the compute architecture for” Kepler “- NVIDIA’s new 7-Billion transistor GPU. From the reorganized processing cores with new instructions and processing capabilities, Thu an Improved Memory System with faster atomic processing and low-overhead ECC, we will explore how the Kepler GPU achieves World Leading Performance and efficiency, and How It Enables wholly new types of parallel To Be Solved problems.


قبلا شرح توصیفات شده اما احتمالا 14-17 می توضیحات بسیار بیشتری از تراشه اصلی و درواقع بزگترین و پر ترانزیستور ترین chip طراحی شده توسط بشر تا به اکنون خواهیم ماند.


خبر ارائه و صحبت های انودیا در مورد GK110 میتونه از هیجان انگیز ترین بحث هایی باشه که تا به العان روش بحث شده . مطمئنم حتی Hater های پر تعداد انودیا هم منتظر اخبار اصلی Big K هستن.
 

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
ایا CEO برند AMD جناب روری رید هم انودیا فن میشود؟؟ خوب اگر انسان ازاده ای باشه چرا که نه ؟؟اگر پیشرفت حریف اونقدر زیاد باشه که از تمام براورد تحلیلگران هم بیشتر خوب چرا که نه. :mrgreen:




خیلی وقت پیش بعد از شروع درگیری های مناقصه American Exa scale SC برای دارپا چندین شرکت و دانشگاه ها و موسسات معتبر امریکایی وارد گود رقابت شدن تا برای طراحی تراشه هایی با توان محاسباتی موثر بالا و مصرف بسیار پایین به نسبت بازدهی با هم رقابت کنن.(دانشگا ها و موسساتی مثل MIT و Sandia National Labs و یا شرکت های طراح تراشه مثل INTEL و NVIDIA از جمله رقبای مهم هستن)


چیزی که مشخص بود انودیا همیشه خودش رو به عنوان World leader off visual computing معرفی کرده و خوب با سرمایه و تجربه عظیم این شرکت قطعا هیچ کدوم شانس زیادی در برابر انودیا نداشتن - انودیا با ارائه Echelon project اولین قدم های ultra high perfomence computing chip رو برداشته و تراشه ای طراحی کرد که بیش از 20 برابر فرمی performenc/watt داشت و مشخصات اون فعلا در حوصله اینجا نمیگنجه و این موضوع خیلی قدیمی هست. بعد اگر علاقه ای وجود داشت شاید بیشتر درمورد طرح های نسل اینده انودیا صحبت میکنم.




اما خوب این بحث ها چه ربطی به GK110 داشت؟؟ همونطور که میدونیم طبق نقشه راه انودیا انویدیا با سرعت وحشتناکی به سمت Performance/Watt بالا حرکت میکنه طوری که dp/watt برای کپلر بین 5-6 برابر پیش بینی میشد و برای ماکسول هم تا 16 برابر نسل فرمی-تسلا .


اما ایا این واقعا امکان پذیره؟؟


خوب بیاید با هم به خبر های (البته بیشتر شایعات) جدید نگاهی کنیم ببنیم که ایا امکان پذیر هست یا نه.


-----------------------------------------------------------------------------------------------


Monstrous Kepler


2304 هسته یا 2506 هسته رو فراموش کنیم. نظر شما در باره 3072 هسته چی هست؟؟؟


طبق شایعات مشخصات جدید اینها هستن:


3072 هسته


1 : این 3072 هسته در 6 کلاستر یعنی 6GPC قرار گرفتن.


2: هر GPC شامل 512 هسته هست .


3 : هر GPC متشکل از 4 عدد SMK هست ( نام حدید SM های GK110 که در GK104 با نام SMX دیدیم)


4 : هر SMK شامل 128 هسته هست که در 4 گروه 32 تایی قرار گرفتن.


5 : 2 تا از هر یک از اون گروه ها توانایی محاسبه dp floating point هارو دارن.


6 : هر SMK دارای یک پردازشگر فیزیک مخصوص به خود هست :eek:


این هم تصویر فرضی و کاملا fake چون اینجا هر sm داری 96 هسته هست.اما خوب 6GPC بودن و هر GPC دارای 4 SM بودن کمی اونو شبیه میکنه.


89007769722189391094.jpg


اینم مشخصات :


3072 ALUs
-> 6x GPCs (à 512 SPs)
--> 4 SMK to each GPC, 128 ALUs/SMK
--> each SMK has
---> 4 groups of 32 ALUs
----> two of which are 64 Bit capable, re-using data-paths from the other ALUs
----> two groups share a quad TMU
----> 4x 32 kiB L1-Cache shared among the ALU blocks, configurable as scratchpad memory in block sizes of 32 kiB.


512 Bit MI
-> 8x 64-Bit memory partitions
-> 4 GiB default memory size for gaming cards, twice for Tesla, Quadro
-> (probably) 2048, rather still 1024 kiB L2-Cache​


فرکانس هسته تراشه روی 850mhz هست و احتمالا TDP کارت چیزی در حد 300W هست .


چنین تراشه ای با این مشخصات در فرکانس 1GHZ احتمالا میتونه تا 20% از GTX690 سریعتر باشه .(خواب نمیبینید با این مشخصه ها یک Single GPU میتونه 2 هسته ای هم نسل خودش رو نابود کنه-)


علتش هم اینه که SMK ها کوچک ترن پس نرخ Core starvation بسیار کمتری نسبت به GK104 داره . بنابر این به طور کلی Core occupation تراشه نسبت به GK104 بسیار بالاست. چنین تراشه ای بشدت EU intensivity اش کاهش پیدا میکنه و حجم EU/CU اون بالانس میشن که نتیجش قدرتی مهیب(به معنای واقعی کلمه مهیب) میشن.شما اگر صاحب برند رقیب amd هم باشی باید برای چنین چیزی سر خم کنی واقعا واجب السجوده :mrgreen:


اگر انودیا بتونه چنین مشخصاتی رو در GK110 قرار بده از فردا روی بازوی rory read مدیر عامل amd و دشمن خونی nvidia هم مثل Jen-Hsun Huang باید مثل تصویر زیر خالکوبی انودیا ببنیم: (بلاخره انسان های ازاده هم تغییر میکنن :mrgreen: )


Jen-Hsun-Huang-Double-Pumps-the-GTX590.jpg



من شخصا ارزوم اینه که اینها واقعی باشه اما راستش قلبا میدونم خیلی بعیده (عللش بسیار زیاد و مفصله و راستش حوصله گفتن ندارم:smile: )


اما خوب از انودیا همه چی بر میاد چه از 3 برابر کردن تعداد هسته ها تنها با افزایش 16% تعداد ترانزیستور.اما اینجا تعداد SM ها بسیار بیشتر شدن و خوب نرخ CU ]ا بسیار زیاد شدن بنا بر این خیلی خیلی این مشخصات بعیده.


حالا صبر میکنیم ببنیم حقیقت پیدا میکنه یا نه
 

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
خب مثل اینکه قضیه کندن یک گور مشتی خوشگل برای rorry read قطعیه - بله رفقا کنفرانس GTC برگزار شد و انودیا حیوون خودش - نه هیولا - نه نه بگیم گودزیلا رو معرفی کرد.


تمام شایعات باز هم مثل همیشه با اندکی خطا درست از اب در اومد


خانم ها و اقایان: GK110


kepler_dieshot.jpg



تراشه ای با 7.1 میلیارد ترانزیستور - برای محاسبه در عمل نه در ورق-برای بازی - و البته برای شادی روح روری رید کبیر :D - 3072 هسته یعنی 2 برابر GK104 - تراشه از SMX ها استفاده میکنه که 16 عدد SMX هست.


خوب تراشه High end اصلی انودیاست پس 512Bit ای هست که effective memmory رو با 4ghz ddr5 عذاب اور میکنه - یعنی عرض باند برابر 320gb/s که خوب شاک هر خدا و gpu دوستیو در میاره.


اینها مهم نیست - تراشه ترسناکه ترسناک- ویژگی هایی داره که هر انسانی رو به وجد میاره:


Dynamic Parallelism -- This capability enables GPU threads to dynamically spawn new threads, allowing the GPU to adapt dynamically to the data. It greatly simplifies parallel programming, enabling GPU acceleration of a broader set of popular algorithms, such as adaptive mesh refinement, fast multipole methods and multigrid methods.
Hyper-Q -- This enables multiple CPU cores to simultaneously use the CUDA architecture cores on a single Kepler GPU. This dramatically increases GPU utilization, slashing CPU idle times and advancing programmability. Hyper-Q is ideal for cluster applications that use MPI.


مشخصات این هیولا :


To begin with, NVIDIA crammed a mind-boggling 7.1 billion transistors into the GK110. It is essentially a 2x upscale of the GK104, while retaining its essential component hierarchy. The number-crunching machinery still consists of streaming multiprocessors (SMX), which pack 192 CUDA cores, each. It's quite plausible that the GK110 silicon packs 16 such SMX units.


NVIDIA disclosed that the Tesla K20 offers a memory bandwidth as high as 320 GB/s. This is a particularly interesting number, which provides hints to the chip's memory interface. Given that today's fastest high-volume GDDR5 memory chips are qualified for 6.00 GHz, NVIDIA would only be achieving 288 GB/s, if the memory bus width were 384-bit. Taking into consideration the fact that GPU vendors conservatively set the clock speeds of GPU and memory on GPU compute accelerators, it sounds plausible that GK110 has a 512-bit wide GDDR5 memory interface, and that NVIDIA is achieving 320 GB/s with a memory clock speed of 1000 MHz (4.00 GHz effective), on the Tesla K20.




خوب این تراشه ابتدا به عنوان تسلا K20 وارد میشه و فعلا خبری از GFORCE اون نیست. ادیتور ها پیشبینی کردن که اگر GTX690 قیمتی 999$ داره - این ابر هیولا یعنی این ابر Single GPU باید بالای 1200$ قیمت بخوره.


بله رفقا درست شنیدید : یک تک هسته ای که بسیار سریعتر از GTX690 هست که اون خودش 20% از 7970 Crossfire سریعتر بوده.


حالا باز این با اینکه یک تراشه هست از دوال خودش به مراتب سریعتره - در طول تاریخ چنین چیزی بعد از 8800gtx علیه 7950gx2 بی سابقه هست.


دوستان و رفقا - از حیوان نسل اینده بترسید :D - انصافا فک من افتاده - شمارو نمیدونم
 
آخرین ویرایش:

XagroX

کاربر سایت
Dec 1, 2008
1,268
نام
عرفان
ولی این انویدیا هر قدر تو این gpu های سر و شاخ دسکتاپ کارش خوبه .. اما تو بازار موبایل عملا ابروریزی میکنه با اون vlp و ulp ش ...
 

ramin cybran

کاربر سایت
Mar 1, 2009
901
نام
رامین
چندی از تکنولوژی های نوین


86400205516613829689.jpg
91451532664968600994.jpg



HYPER Q برای تسلا ها بیشتر در بخش راک ها اهمیت داره اما کلا تکنولوژی هست که به جای یک صف برای درسترسی به کودا ها 32 صف دستوری جدا گانه برای دسترسی پردازنده ها به cuda core ها فرا هم میکنه و بهره وری رو بالا میبره.


اما Dynamic parallisim از همه حیاتی تر و بسیار ترسناکه : جدای از اون قابلیت تشخیص حدی grid resoloution که در تصویر نشون داده شده و ربطی به بحث فعلی ما نداره قابلیت اوتونامسولی Autonomously یا همون خودکفایی تراشه برای انطباق با ترد هاست که احتمال میره به خاطر هسته های ARM یا یک GTE بسیار پیشرفته باشه (هنوز چیزی مشخص نیست)-چون همونطور که میبنید تراشه های گذشته برای انتباق ترد ها با هسته های کودا ها مرتب به پردازنده مراجعه میکنه اما با DP این خود تراشه هست که این انطباق رو فراهم میکنه و دفعات بازگشت به پردازنده برای Adapting کم میکنه.(همین میشه خودکفایی تراشه و هوشمند بودن اون چیزی که احتمال میره به خاطر یک GTE عجیب و غریب یا هسته های ARM باشه )


اما نکته ای که 99% از نظر من قطعیه اینه که خیلی احتمال کمی داره تراشه دارای 16SMX باشه - واضح هست که G110 دارای 15 SMX خواهد بود و هست های اون میشه 2880 تا - یک بخش عظیمی از تراشه معلوم نیست چیه اما احتمالا همون front end عجیب غریب اینده انودیا هست.


هرچی که هست خدا اخر و عاقبت همرو به خیر کنه : دی


ویرایش


رفقا مشخصات دقیق اعلام شد: دی همون 15 smx که عرض کردن شد و باز هم پیش بینی ننگین من درست از اب در اومد: (البته جز مشخصات gpu باقی مشخصات بورد تسلا K20 هست)


If you are wondering what NVIDIA did pack in the 7.1 billion transistors, the answers are as follows:


2880 CUDA Cores
15 SMX Clusters
384-bit Memory Controller
Up to 24GB of GDDR5 memory
2nd Gen ECC
Hardware GPU Silicon Virtualization
Hyper-Q (Slashes CPU idle time by allowing multiple CPU cores to simultaneously utilize a single Kepler GPU, dramatically advancing programmability and efficiency)
Dynamic Parallelism (Simplifies GPU programming by allowing programmers to easily accelerate all parallel nested loops – resulting in a GPU dynamically spawning new threads on its own without going back to the CPU)
50-85% Double Precision Rate to Single Precision
At least 1.5 TFLOPS DP FP64
Target: 250 GB/s bandwidth




نکته قابل توجه بعد از 15 تا SMX بودن تراشه وجود 6 مموری کنترلر بودن تراشه هست که اون رو 384-bit ایی مثل TAHITI یعنی High end اصلی amd کرده - اینجاست که باید بگیم high end vs high end نه mid range vs high end


انودیا فعلا برای شروع 15.000 تا k20 واسه Jaguar, i.e. Titan at Oak Ridge National Laboratories (ORNL) پیش فروش کرده و دیگه به نظرم TSMC باید کل ظرفیت کارخونش رو به انودیا بده نه اولویت اولش رو.


(هیچ میدونستید چیپ های تحویلی تاهیتی از TSMC به AMD از 10.000 تجاوز نمیکنه ؟؟؟؟ اونوقت انودیا فقط برای بخش تسلا اونم ب بسم ال... 15.000 تا برای ابرکامیپوتر های مطرح دنیا گذاشته کنار . این ورای تصوره.)


نکته دیگه اینه که همه سایت ها و بنچمارک های خطی محاسباتی برتری شدید Tahiti رو در روی کاغذ نسبت به gk104 نشون دادن (همین اتفاق برای hd5870 و gtx480 هم وجود داشت و سندش هم موجوده) الان کجای دنیا از تاهیتی دارن برای comuting استفاده می کنن ؟؟ اصلا 1 مشتری هم داشته ؟؟؟ (در عمل و تست های مهندسین شرکت های HPC اگر محصول AMD تا این هد قوی بود مغز اسب که نخوردن از همین الان 15000 تا فقط K20 رزرو کنن )


خوب البته AMD همیشه پروپوگاند های عظیمش که توسط هواداران پر تعدادش در سراسر وب قویا وجود داره اما بدبختی اینه که در عمل 0% هم جلو نمیره و مشتری های محاسباتی یعنی HPC maker ها شرکت های بزرگی هستن که 1000 مهندس دارن که تراشه هارو برسی میکنن - فعلا هنوز ندیده و نشناخته تا q4-2012 حدود 15000 فقط k20 سفارش گرفته .یعنی 100% بازار hpc ها .

ولی این انویدیا هر قدر تو این gpu های سر و شاخ دسکتاپ کارش خوبه .. اما تو بازار موبایل عملا ابروریزی میکنه با اون vlp و ulp ش ...

دوست من مشکل تگرا ها ulp بودنش نیست (اصلا ulp بودن soc یک تبلت لازم و ملزوم شکل گیریشه این چه حرفیه)- مشکل نود تکنولوژی هست که انودیا برای موبایلیتی انتخاب کرده و split shader بودن بخش gpu تگرا soc ها باعث شده از حریفان عقب بمونه(هر چند رو کاغذ - البته در عمل هم مثلا sgx های powervr ایمجینیشن با USSE های خوفشون دهن انودیارو ... : دی ).

در اینده و در نسل وین 100% از ulp kepler core ها استفاده میشه که قطعا effciency فوقولاده ای خواهند داشت.(هرچند همین الان هم عقب نیست و با اینکه توی نود 40nm هست و بخش GPU اون که بسیار کوچکه از adreno 225 کم که نمیاره هیچ (s4 کوالکام نود 28nm هست و تگرا 40 نسل قبل) به خاطر اپتیمایز تگرازون انودیا از تبلت های فوق قدرتمند ipad 3gen ام بازی هارو زیبا تر روی پلتفرم های تگرا 3 دار نشون میده.سندش هم اناند هست که مقایسه کرده .
 
آخرین ویرایش:

s.1

کاربر سایت
Oct 28, 2011
8,162
دست اقا رامین درد نکنه زحمت زیاد می کشن باید بگم که سری 7 یا همون کپلر فوق العاده هست خود انویدیا هم قول های زیادی داده سری 6 جلوش پشه ای بیش نیست

انویدیا یکی از خوش قول ترین شرکت ها هست اگه بزرگش کرده حتما یه چیزی هست
 

کاربرانی که این قسمت را مشاهده می‌کنند

Top
رمز عبور خود را فراموش کرده اید؟
or ثبت‌نام سریع از طریق سرویس‌های زیر