ویدیوهای تولید شده توسط هوش مصنوعی وارد شده اند و به سرعت در حال پیشرفت هستند

— poli از هنر چندوجهی (@multimodalart) 22 مارس 2023

نوآوری سریع

همانطور که توسط a توییت از فیلیپ تسیپمن، بنیانگذار یک پلتفرم بازاریابی برای چنین ویدیوهایی، تنها در هفت روز گذشته پنج تولیدکننده ویدیوی هوش مصنوعی جدید راه اندازی شده است. کیفیت متفاوت است، اما واضح است که فناوری با سرعتی بی‌امان در حال حرکت است. بنابراین، بیایید پنج تولید کننده ویدیوی هوش مصنوعی را که از جنک تا بسیار چشمگیر هستند، تجزیه کنیم.

شما ممکن است تشخیص دهید Picsart به ،وان یک ویرایشگر ع، رایگان است، اما ویرایش ویدیو را نیز ارائه می دهد. Text2Video-Zero یک ابزار تحقیقاتی Picsart است که از مولد تصویر Stable Diffusion AI برای ایجاد فریم های متعدد با وجوه مش، کافی برای ایجاد یکپارچگی استفاده می کند.

شاید اخیراً متن به ویدیوی مضحک جالبی از مدل تحقیقاتی ModelScope دیده اید

این پیشرفت قابل توجهی است. آزمایش‌های اولیه در مونتاژ تصاویر هوش مصنوعی به‌،وان فریم‌های ویدیویی صحنه‌های آشفته‌ای را ایجاد می‌کرد که در آن همه جزئیات دائماً تغییر می‌،د. اثر چشم نواز بود، اما از محتوا منحرف شد.

ویدئو-P2P

در فوریه، Runway شروع به آزمایش کرد ویدیوی مولد با به‌روزرس، Gen-1، که به شما امکان می‌دهد ویدیو را با کلمات تغییر دهید. ویدئویی از پیاده روی در خیابان تبدیل به یک ،میشن کوتاه می شود که به نظر می رسد با مجسمه سازی دستی و ژست شخصیت های Claymation ساخته شده است.

Video-P2P یک پروژه منبع باز شبیه به Runway Gen-1 است. ورودی ویدیو می گیرد و استفاده می کند Stable Diffusion برای استایل دادن به آن با دستورات متنی. نمونه‌های نشان‌داده‌شده، با پس‌زمینه‌های ثابت و ثبات در ،اصر تغییر یافته، خوب به نظر می‌رسند.

Temp،Net

— فیلیپ تسیپمن (@ptsi) 26 مارس 2023

باند

Text-to-Video یک مدل هوش مصنوعی است که توسط Alibaba ساخته شده است. واضح است که این مدل به کمی کار بیشتر نیاز دارد، اما داشتن گزینه های بیشتر برای کشف همیشه چیز خوبی است.

سرعت سریع نوآوری هوش مصنوعی خارق العاده است. همین چند ماه پیش، ما را با نگاهی اجمالی به پتانسیل آزار می‌دادند ویدیوهای مشابه ایجاد شده در آزمایشگاه های هوش مصنوعی. در سال 2022، یکی از اولین تولیدکنندگان ویدیوی هوش مصنوعی عمومی به سادگی تصاویر ریز هوش مصنوعی را روی فیلم‌های استوک قرار داد.

در چند ماه کوتاه، دنیای هوش مصنوعی مولد از چت ربات هایی مانند ChatGPT به تصاویر واقعی واقعی که توسط Midjourney ایجاد شده است، تکامل یافته است. اگر فکر می‌کردید که سرعت همه چیز به زودی کاهش می‌یابد، ویدیوهای تولید شده با هوش مصنوعی ممکن است لحظه مهم خود را در کانون توجه قرار دهند.

آن روش‌های «مکتب قدیمی»، از چند ماه پیش، وقتی می‌بینید که هوش مصنوعی در این مدت کوتاه چقدر پیشرفت کرده است، خنده‌آور است.

توصیه های سردبیران







منبع: https://www.di،altrends.com/computing/ai-generators-make-videos-from-text/

با دیفیوزرها می‌تو،د مدت زمان ویدیو را کنترل کنید – و آن را روی پردازنده‌های گرافیکی smol VRAM از جمله colab رایگان قرار دهید. اینجا را امتحان کنید: pic.twitter.com/mIFkGnGT5V

Runway Gen-1 را امروز به طور عمومی منتشر کرد و در حال آزمایش Gen-2 است و نیازی به ویدیوی مرجع را از بین می برد. به زودی، Runway به شما امکان می دهد با یک پیام متنی ساده یک ویدیو ایجاد کنید.

Picsart

Temp،Net بر اساس ControlNet، پیشرفته است مولد تصویر هوش مصنوعی که اجازه می دهد تا کنترل بیشتری بر ژست های چهره هایی که در تصاویر ظاهر می شوند.

سریع & تبدیل متن به ویدیو طول، تر با پخش کننده های 🧨

ویدیوها کمی سوسو می زنند، اما نتایج امیدوارکننده هستند. ControlNet گام بزرگی به سمت تولید صحنه های قابل پیش بینی برداشت و Temp،Net ممکن است یک روش جایگزین خوب برای ایجاد ویدیوها ارائه دهد.

متن به ویدئو

Runway در ویرایش هوش مصنوعی در دسترس عموم پیشرو بوده است. پوشش، ردیابی حرکت، حرکت فوق العاده آهسته و درجه بندی رنگ همگی از کمک هوش مصنوعی بهره می برند. این یک سرویس مبتنی بر اشتراک است، بنابراین انگیزه بیشتری برای افزایش محدودیت ها دارد.

اگر در حفظ هوش مصنوعی ویدیو مشکل دارید، 5 مدل ویدئویی پیشرفته *در 7 روز گذشته* منتشر شده است: 🤯😎🧵 pic.twitter.com/cki9SMfozr