— poli از هنر چندوجهی (@multimodalart) 22 مارس 2023
ویدیوهای تولید شده توسط هوش مصنوعی وارد شده اند و به سرعت در حال پیشرفت هستند
نوآوری سریع
همانطور که توسط a توییت از فیلیپ تسیپمن، بنیانگذار یک پلتفرم بازاریابی برای چنین ویدیوهایی، تنها در هفت روز گذشته پنج تولیدکننده ویدیوی هوش مصنوعی جدید راه اندازی شده است. کیفیت متفاوت است، اما واضح است که فناوری با سرعتی بیامان در حال حرکت است. بنابراین، بیایید پنج تولید کننده ویدیوی هوش مصنوعی را که از جنک تا بسیار چشمگیر هستند، تجزیه کنیم.
شاید اخیراً متن به ویدیوی مضحک جالبی از مدل تحقیقاتی ModelScope دیده اید
این پیشرفت قابل توجهی است. آزمایشهای اولیه در مونتاژ تصاویر هوش مصنوعی به،وان فریمهای ویدیویی صحنههای آشفتهای را ایجاد میکرد که در آن همه جزئیات دائماً تغییر می،د. اثر چشم نواز بود، اما از محتوا منحرف شد.
ویدئو-P2P
در فوریه، Runway شروع به آزمایش کرد ویدیوی مولد با بهروزرس، Gen-1، که به شما امکان میدهد ویدیو را با کلمات تغییر دهید. ویدئویی از پیاده روی در خیابان تبدیل به یک ،میشن کوتاه می شود که به نظر می رسد با مجسمه سازی دستی و ژست شخصیت های Claymation ساخته شده است.
Video-P2P یک پروژه منبع باز شبیه به Runway Gen-1 است. ورودی ویدیو می گیرد و استفاده می کند Stable Diffusion برای استایل دادن به آن با دستورات متنی. نمونههای نشاندادهشده، با پسزمینههای ثابت و ثبات در ،اصر تغییر یافته، خوب به نظر میرسند.
Temp،Net
— فیلیپ تسیپمن (@ptsi) 26 مارس 2023
باند
Text-to-Video یک مدل هوش مصنوعی است که توسط Alibaba ساخته شده است. واضح است که این مدل به کمی کار بیشتر نیاز دارد، اما داشتن گزینه های بیشتر برای کشف همیشه چیز خوبی است.
سرعت سریع نوآوری هوش مصنوعی خارق العاده است. همین چند ماه پیش، ما را با نگاهی اجمالی به پتانسیل آزار میدادند ویدیوهای مشابه ایجاد شده در آزمایشگاه های هوش مصنوعی. در سال 2022، یکی از اولین تولیدکنندگان ویدیوی هوش مصنوعی عمومی به سادگی تصاویر ریز هوش مصنوعی را روی فیلمهای استوک قرار داد.
در چند ماه کوتاه، دنیای هوش مصنوعی مولد از چت ربات هایی مانند ChatGPT به تصاویر واقعی واقعی که توسط Midjourney ایجاد شده است، تکامل یافته است. اگر فکر میکردید که سرعت همه چیز به زودی کاهش مییابد، ویدیوهای تولید شده با هوش مصنوعی ممکن است لحظه مهم خود را در کانون توجه قرار دهند.
آن روشهای «مکتب قدیمی»، از چند ماه پیش، وقتی میبینید که هوش مصنوعی در این مدت کوتاه چقدر پیشرفت کرده است، خندهآور است.
توصیه های سردبیران
منبع: https://www.di،altrends.com/computing/ai-generators-make-videos-from-text/
با دیفیوزرها میتو،د مدت زمان ویدیو را کنترل کنید – و آن را روی پردازندههای گرافیکی smol VRAM از جمله colab رایگان قرار دهید. اینجا را امتحان کنید: pic.twitter.com/mIFkGnGT5V
Runway Gen-1 را امروز به طور عمومی منتشر کرد و در حال آزمایش Gen-2 است و نیازی به ویدیوی مرجع را از بین می برد. به زودی، Runway به شما امکان می دهد با یک پیام متنی ساده یک ویدیو ایجاد کنید.
Picsart
Temp،Net بر اساس ControlNet، پیشرفته است مولد تصویر هوش مصنوعی که اجازه می دهد تا کنترل بیشتری بر ژست های چهره هایی که در تصاویر ظاهر می شوند.
سریع & تبدیل متن به ویدیو طول، تر با پخش کننده های 🧨
ویدیوها کمی سوسو می زنند، اما نتایج امیدوارکننده هستند. ControlNet گام بزرگی به سمت تولید صحنه های قابل پیش بینی برداشت و Temp،Net ممکن است یک روش جایگزین خوب برای ایجاد ویدیوها ارائه دهد.
متن به ویدئو
Runway در ویرایش هوش مصنوعی در دسترس عموم پیشرو بوده است. پوشش، ردیابی حرکت، حرکت فوق العاده آهسته و درجه بندی رنگ همگی از کمک هوش مصنوعی بهره می برند. این یک سرویس مبتنی بر اشتراک است، بنابراین انگیزه بیشتری برای افزایش محدودیت ها دارد.
اگر در حفظ هوش مصنوعی ویدیو مشکل دارید، 5 مدل ویدئویی پیشرفته *در 7 روز گذشته* منتشر شده است: 🤯😎🧵 pic.twitter.com/cki9SMfozr