DLSS 4 انویدیا آن چیزی نیست که شما فکر می کنید. بیایید اسطوره ها را از بین ببریم
انتشار: دی 23، 1403
بروزرسانی: 02 تیر 1404

DLSS 4 انویدیا آن چیزی نیست که شما فکر می کنید. بیایید اسطوره ها را از بین ببریم


انویدیا با معرفی RTX 5090 نمایش را در نمایشگاه CES 2025 دزدید و علیرغم بحث های فراوان در مورد قیمت 2000 دلاری این کارت، فناوری های جدیدی را وارد بازار کرد. مهم ترین آنها DLSS 4 است که نسل چند فریم را به پردازنده های گرافیکی انویدیا می آورد و بلافاصله زم، که پردازنده های گرافیکی سری RTX 50 انویدیا به بازار آمد، عملکرد 4 برابری را در بیش از 75 بازی افزایش می دهد.

با این حال، سوء تفاهم زیادی در مورد نحوه عملکرد DLSS 4 دیده ام. بین اظهارنظرهای گمراه کننده مدیر عامل انویدیا و طراحی مجدد اساسی در نحوه عملکرد DLSS، جای تعجب نیست که اطلاعات نادرستی در مورد فناوری جدید، توانایی های آن و محدودیت های آن وجود داشته باشد.

بنابراین، بیایید حداقل تا جایی که می توانم، قبل از اینکه کارت های گرافیکی جدید انویدیا به اینجا بیایند و همه ما آنچه را که DLSS 4 ارائه می کند تجربه کنیم، کار را درست کنیم.

از فن آوری بازی های رایانه شخصی به طور هفتگی استفاده کنید

نه، "آینده را پیش بینی نمی کند"

جنسن مدیر عامل انویدیا در مقابل پس زمینه.
Nvidia

یکی از مسائل اصلی در مورد درک درست نحوه عملکرد DLSS 4 از اظهار نظر جنسن هوانگ، مدیر عامل انویدیا در طی یک پرسش و پاسخ ناشی می شود. جرد والتون در سخت افزار تام از Huang در مورد نحوه عملکرد DLSS 4 در سطح فنی پرسید، و Huang به طور قاطعانه استفاده DLSS 4 از درونیابی فریم را رد کرد. او گفت که DLSS 4 "آینده را پیش بینی می کند"، به جای اینکه "گذشته را درون یابی کند". این یک نقل قول پر سر و صدا است، مطمئنا. حیف که نادرست است

هوانگ در گذشته در مورد DLSS Frame Generation شاعرانه صحبت کرده است، و اگرچه این نوع قاب بندی برای توضیح فناوری مانند DLSS 4 برای مخاطبان اصلی کار می کند، اما منجر به سوء تفاهم هایی در مورد نحوه عملکرد واقعی آن نیز می شود. به دنبال این نقل قول، من در واقع چندین خواننده را به من رساندم که به اشتباه متوجه شدم که DLSS 4 چگونه کار می کند. همانطور که معلوم است من نحوه عملکرد آن را اشتباه نمی فهمم، اما می دانم که چرا سردرگمی زیادی وجود دارد.

تولید چند فریمی DLSS 4 از تکنیکی به نام درون یابی فریم استفاده می کند. این همان تکنیکی است که در DLSS 3 دیدیم، و همان تکنیکی است که در ابزارهای تولید فریم دیگر مانند Lossless Scaling و AMD's FSR 3 خواهید یافت. درون یابی فریم به این صورت عمل می کند: کارت گرافیک شما دو فریم را ارائه می کند و سپس یک الگوریتم برای مح،ه تفاوت بین آن فریم ها وارد می شود. سپس، فریمی را ایجاد می کند تا در بین آن برود، و حدس می زند که فریم بینابینی بر اساس تفاوت بین دو فریم ارائه شده چگونه به نظر می رسد.

نموداری که از طریق DLSS 3 Nvidia حرکت می کند.
Nvidia

و DLSS 4 از درون یابی فریم استفاده می کند. تحقیقات اولیه ای در مورد تکنیک های جدید برای تولید فریم ها - به ویژه تحقیقات اینتل در مورد برون یابی فریم - انجام شده است، اما هنوز روزهای اولیه برای این فناوری است. جزئیاتی وجود دارد که هنوز نمی توانم کاملاً به اشتراک بگذارم، اما اکنون با چندین منبع تأیید کرده ام که DLSS 4 در واقع از درون یابی فریم استفاده می کند. منطقی هم هست این نوع ابزارهای رندر فقط از هیچ جا ظاهر نمی شوند، و تقریباً همیشه یک سلسله طول، از مقالات تحقیقاتی قبل از اینکه هر تکنیک رندر جدیدی به یک محصول قابل فروش مانند DLSS 4 تبدیل شود، وجود دارد.

این چیزی را که DLSS 4 قادر به انجام آن است کم نمی کند. ممکن است از همان تکنیک DLSS 3 برای ایجاد فریم های جدید استفاده کند، اما این نباید شما را از آنچه DLSS 4 واقعاً می تواند انجام دهد منحرف کند.

تأخیر موضوعی نیست که شما فکر می کنید

ویجت تأخیر در Special K.
جیکوب روچ / روندهای دیجیتال

من می دانم که چرا انویدیا نمی خواهد در مورد استفاده DLSS 4 از درون یابی فریم نظر زیادی بدهد. به این دلیل که درون یابی فریم تاخیر را معرفی می کند. شما باید دو فریم را رندر کنید و سپس درون یابی را قبل از اولین فریم در ترتیب نمایش داده شده انجام دهید، بنابراین هنگام استفاده از هر ابزار درون یابی فریم، اساساً با کمی تاخیر بازی می کنید. فرضیه ای که من دیده ام این است که این فریم های اضافی به صورت خطی تاخیر را افزایش می دهند، که اینطور نیست.

The Verge نگر، نشان داد گفت که می خواهد ببیند چگونه فناوری نسل جدید فریم بر تأخیر تأثیر می گذارد، در حالی که TechS، اعلام کرد که «کاربران نگران این هستند که رندر چند فریمی می تواند باعث ،یب شود [latency] مشکل.” این یک ضد طبیعی برای فریم های «جعلی» چند برابری است که DLSS 4 می تواند بیرون بیاورد. اگر ایجاد یک فریم باعث ایجاد مشکل تأخیر شود، مطمئناً ایجاد سه مورد از آنها مشکل تأخیر بزرگتری ایجاد می کند. اما این روش کار نمی کند.

به همین دلیل است که درک اینکه DLSS 4 از درون یابی فریم استفاده می کند بسیار مهم است. ایده بازی با تاخیر بین DLSS 3 که یک فریم اضافی تولید می کند و DLSS 4 که سه فریم اضافی تولید می کند تفاوتی ندارد - این روند همچنان شامل رندر ، دو فریم و مقایسه تفاوت بین آنها است. تأخیر شما بین درج یک، دو یا سه فریم اضافی بین دو فریمی که رندر شده اند، به طور قابل توجهی افزایش نمی یابد. صرف نظر از تعداد فریم هایی که بین آن ها قرار می گیرند، تأخیر اضافه شده توسط فرآیند درون یابی فریم تا حد زیادی ی،ان است.

بگذارید این را توضیح دهم. فرض کنید یک بازی را با سرعت 60 فریم در ث،ه (فریم بر ث،ه) انجام می دهید. ی،ی بین هر فریمی که می بینید 16.6 میلی ث،ه فاصله است. با DLSS 3، نرخ فریم شما دو برابر می شود و به 120 فریم در ث،ه می رسد، اما تاخیر شما به 8.3 میلی ث،ه نصف نمی شود. بازی نرم تر به نظر می رسد، اما هنوز 16.6 میلی ث،ه بین هر فریم رندر شده فاصله وجود دارد. با DLSS 4، می تو،د تا 240 فریم بر ث،ه بروید، که نرخ فریم خود را چهار برابر می کند، اما باز هم، تأخیر به 4.2 میلی ث،ه کاهش نمی یابد. هنوز هم همان 16.6 میلی ث،ه است.

این یک نگاه بسیار تقلیل آمیز به تأخیر رایانه شخصی است – برای اجرای نسل فریم DLSS، به علاوه تأخیر اضافه شده توسط م،تور و ماوس، هزینه های زیادی وجود دارد – اما برای درک این موضوع مفید است که تأخیر هسته هنگام افزودن فریم های بیشتر به فریم به صورت خطی افزایش نمی یابد. فرآیند درون یابی زمان بین هر فریم رندر شده تغییر نمی کند. تاخیری که تجربه می کنید هنوز هم تا حد زیادی نتیجه نرخ فریم پایه شما قبل از تولید فریم DLSS و سرباری است که ابزار دارد.

DLSS 4 در Nvidia RTX 5080 نگاه اول: Super Res + Multi Frame-Gen در Cyberpunk 2077 RT Overdrive!

شما مجبور نیستید فقط حرف من را قبول کنید. Di،al Foundry DLSS 4 را از جمله تأخیر آزمایش کرده است و دقیقاً همان چیزی را که من توضیح دادم پیدا کرده است. به نظر من بیشتر تأخیر اضافی همچنان از بافر ، آن فریم اضافی ناشی می شود، اما افزودن فریم های می، بیشتر با افزایش نسبتاً حداقلی تأخیر همراه است. ریچارد لیدبیتر از Di،al Foundry. مقدار کمی تأخیر اضافی صرفاً از مح،ه فریم های بیشتر بین دو رندر DLSS ناشی می شود، بنابراین عمده افزایش تأخیر با DLSS 4 تفاوت چند، با DLSS 3 ندارد.

مشکل تأخیر DLSS 4 تا حد زیادی مانند DLSS 3 است. اگر با نرخ فریم پایه پایین بازی می کنید، بین پاسخگویی که تجربه می کنید و نرمی که مشاهده می کنید، ارتباط قطع می شود. این قطع ارتباط با DLSS 4 مهم تر خواهد بود، اما این به این م،ی نیست که در نتیجه یک افزایش ناگه، تاخیر وجود دارد. به همین دلیل است که Reflex 2 جدید انویدیا برای DLSS 4 مورد نیاز نیست. درست مانند DLSS 3، توسعه دهندگان فقط باید اولین نسخه Reflex را برای کار DLSS 4 پیاده سازی کنند.

یک مدل کاملا جدید

نمایشی از نحوه عملکرد DLSS 4.
Nvidia

روشن ، نحوه عملکرد DLSS 4 ممکن است شما را به این باور برساند که بیشتر شبیه به هم است، اما اینطور نیست. DLSS 4 یک انحراف بسیار مهم از DLSS 3 است و دلیل آن این است که از یک مدل هوش مصنوعی کاملاً متفاوت استفاده می کند. یا باید بگویم مدل های هوش مصنوعی. همانطور که Nvidia جزئیات داردDLSS 4 در هنگام استفاده از Super Resolution، Ray Reconstruction و Multi-Frame Generation پنج مدل هوش مصنوعی مجزا برای هر فریم رندر شده اجرا می کند که همه آنها باید در چند میلی ث،ه اجرا شوند.

به دلیل آنچه DLSS 4 مست،م آن است، Nvidia شبکه عصبی Convolution قبلی خود یا CNN را کنار گذاشت و اکنون از یک مدل ترانسفورماتور بینایی استفاده می کند. دو تغییر بزرگ در مدل ترانسفورماتور وجود دارد. اول چیزی به نام "توجه به خود". این مدل می تواند اهمیت پی،ل های مختلف را در چندین فریم ردیابی کند. خودارجاعی بودن در این راه باید به مدل جدید اجازه دهد تا بیشتر بر روی مناطق مشکل دار تمرکز کند، مانند جزئیات نازک با وضوح فوق العاده که ممکن است درخشان نشان دهند.

بازسازی اشعه DLSS با مدل جدید ترانسفورماتور | آلن ویک ۲

مدل های ترانسفورماتور نیز مقیاس پذیرتر هستند و به انویدیا اجازه می دهند تا پارامترهای بسیار بیشتری را نسبت به رویکرد قبلی CNN به DLSS اضافه کند. به گفته این شرکت، مدل جدید ترانسفورماتور در واقع پارامترهای دو برابری دارد.

وضوح فوق العاده DLSS با مدل ترانسفورماتور جدید | افق غرب ممنوع

همانطور که در ویدیوهای بالا مشاهده می کنید، انویدیا ادعا می کند که این مدل جدید در مقایسه با رویکرد قبلی CNN، پایداری و حفظ جزئیات بهتری دارد. این پیشرفت ها مختص پردازنده های گرافیکی سری RTX 50 نیز نیستند. تمام کارت های گرافیک RTX می توانند از مدل جدید ترانسفورماتور در بازی های DLSS 4، حداقل برای ویژگی هایی که توسط هر نسل پشتیب، می شود، استفاده کنند.

من چند بار DLSS 4 را در عمل دیده ام، اما آزمایش واقعی این ویژگی زم، خواهد بود که پردازنده های گرافیکی نسل بعدی انویدیا عرضه شوند. سپس، می توانم نحوه عملکرد این ویژگی را در چندین بازی و سناریو ارزیابی کنم تا ببینم چگونه کار می کند. بدون در نظر گرفتن این ویژگی، تغییرات زیادی در این ویژگی وجود دارد، و طبق آنچه Nvidia تاکنون به اشتراک گذاشته است، این تغییرات باعث بهتر شدن DLSS می شود.



منبع: https://www.di،altrends.com/computing/،w-dlss-4-actually-works/