Phenaki
Szövegből videókat generáló modell.
KipróbálomA Phenaki egy AI modell, amely képes szövegből több perces videókat generálni. Akár egy mozdulatlan képből és egy promptból is képes videót létrehozni. A javasolt videó kódoló-dekódoló minden jelenlegi keretrendszeren túlteljesít a tér-idő minőség és a videónkénti tokenek száma tekintetében. A szövegből videó tokeneket generálnak, ehhez kétirányú maszkolt transzformátort használnak, amely előre kiszámított szöveg tokeneken alapul. A generált videó tokeneket ezután de-tokenizálják, hogy létrehozzák a tényleges videót.
Kipróbálom
Ha szeretnél megismerni egy véletlenszerű mesterséges intelligencia alkalmazást, próbáld ki a Felfedezés funkciót!