Wydaje się, że OpenAI wyznacza tempo rozwoju Generatywna sztuczna inteligencja. Po uruchomieniu ChatGPT w listopadzie 2022 r. zaobserwowaliśmy wypuszczenie fali alternatywnych chatbotów, takich jak Gemini od Google i Clude Chat od Anthropic.
Firma pod przewodnictwem Sama Altmana wprowadziła w lutym tego roku generator wideo o nazwie Sora. Oczywiście ruch w branży był łatwy do przewidzenia: firmy technologiczne konkurowały w produkcji wideo.
Generator wideo „Made in China”.
Materiał filmowy Sory pokazany przez OpenAI wzbudził zdziwienie wielu osób, w tym profesjonalnych montażystów wideo. Dotychczas Nigdy nie widzieliśmy czegoś takiego. Modelka może nie tylko tworzyć filmy, ale także symulować nasz świat.
Jednak podobnie jak w przypadku chatbotów, mamy podstawy sądzić, że pojawienie się narzędzi o podobnych możliwościach jest tylko kwestią czasu. Adobe tworzy już własny generator wideo, ale nie wszystko rodzi się w USA. Chińskie firmy również niestrudzenie pracują w tym zakresie.
the Technologia Shengshu i Uniwersytet Tsinghua idęDo świata A Generator wideo o nazwie Vidu. Przyglądamy się narzędziu opartemu na sztucznej inteligencji, które konwertuje proste wskaźniki tekstowe na segmenty wideo o długości do 16 sekund (w porównaniu do 60 sekund w przypadku Sory) w maksymalnej rozdzielczości 1080p.
Jak widać na powyższym filmie, azjatycka firma nie waha się pośrednio porównać swoje narzędzie z tym opracowanym przez OpenAI. Innymi słowy, przejęli koncepcję niektórych klipów Sory i pokazali nam, jak będą wyglądać z Vidu.
Są to sceny o pewnym stopniu złożoności dla AI. Na przykład A Ludzkie oko w szczegółach płaskichpojazd jadący przez las, ułożone telewizory, kobieta spacerująca nocą po mieście oświetlonym neonami i wiele innych scen.
Na pierwszy rzut oka Sora sprawia wrażenie narzędzia zdolnego do osiągnięcia lepszych jakościowo wyników. Jednak w tym miejscu powinniśmy zwrócić uwagę na ważną rzecz: żadna z opcji nie jest ogólnodostępna, dlatego nie mogliśmy ich przetestować.
Twórcy Vidu zwracają uwagę, że ich model posiada szereg bardzo godnych uwagi cech. Twierdzą, że może, tak jak Sora Symulacja świata fizycznego. Mówią też, że potrafi tworzyć spójne sceny i potrafi zrozumieć chińskie elementy.
Zdjęcia | otwarte oko | Shengshu I
W Chatace | Ta kuchnia nie jest prawdziwa, a AI nie ma utalentowanego dziecka: tak Meta AI zmienia Facebooka i Instagram
„Irytująco skromny muzykoholik. Rozwiązujący problemy. Czytelnik. Hardcore pisarz. Ewangelista alkoholu”.
More Stories
Banxico tnie prognozę PKB; Widzi słabość – El Financiero
Targ owocowo-warzywny Bodega Aurrerá od dziś do 29 sierpnia 2024 r.: najlepsze oferty
Według analizy El Economista królem internetu szerokopasmowego w Meksyku jest firma Megacable, której nie może konkurować ani Totalplay, ani Izzi