AI Music Generation Arena jest jedną z niewielu stałych części rewolucji AI w ciągu ostatnich dwóch lat. Obie dominowane organizacje, Słońce I i UdziałMuszę mieć Obaj otrzymali dobrze zachowaną reputację I podstawa fanów w niszy.
Jednak ta przytulna rzeczywistość może znacznie się zmienić. Nowa platforma generowania muzyki U.Właśnie spadł i jest bezpłatny, produkując open source i zaskakująco dobre utwory muzyczne.
W języku chińskim „muzyka” i „szczęście” grupa modeli, które faktycznie współpracują, aby zapewnić pełne piosenki.
Modele mają liryczny produkt, sprzęt i styl. Za dużo Te nowe chińskie modele AIOtwarta natura U sprzyja rozwojowi bardzo domowego gospodarstwa – większość ludzi może skorzystać z narzędzia, aby większość ludzi zmniejszyła potrzebę obliczeń.
Oryginalny projekt wymaga co najmniej 24 GB RAM wideo, a oficjalne zalecenie tworzenia pełnych piosenek jest nadal ustawione na 80 GB. Nie jest dostępny dla zwykłych użytkowników domowych i jest skierowany przez ekspertów, biznes i środowisko akademickie.
Dobra wiadomość jest taka, że podjęto wiele prób stworzenia małych pakietów na masę, w tym wykonane prace Słynna platforma PinocioTo pozwala każdemu na szybkie i łatwo uruchamiać projekty AI open source w systemie Windows.
Kompromis
Jakość dźwięku kompromisu z tymi małymi wersjami VRAM jest zdecydowanie zdegradowana, a czasy generowania są lodowate.
Zastosowanie Pinocio wymaga również wyjściowego VRAM przy 12 GB nie jest w ogóle dostępne, ale nie w ogóle. Ale jeden Użytkownik Pris Tshyan Niedawno wprowadziłem wersję pamięci w nowym super, która otworzyła drzwi, aby skakać i miała grę przy użyciu mojego małego systemu GPU RTX 8 GB.
Oto, co zrobiłem:
Pierwsze wrażenie to bardzo skuteczny interfejs użytkownika Gradio. Po lewej stronie ekranu znajduje się szybkie pole, masz pudełko literatury do wprowadzenia twoich słów, a następnie liczbę ścieżek, które chcesz wyprodukować. Możliwe jest również ustawienie ilości pamięci RAM, której chcesz użyć, która jest powiązana z długością piosenki i liczbą wierszy.
Naciśnij przycisk Generuj i poczekaj na tylne i wypróbuj ścieżkę platformy.
Deweloperzy twierdzą, że utworzenie minuty potrwa cztery minuty, z 16 GB VRAM GPU. Niestety wydaje się, że nie zmniejszyło się, ponieważ zajęło moje 8 GB, aby wyprodukować 40 i 50 sekund dwóch ścieżek do 2,5 godziny.
Deweloperzy twierdzą, że utworzenie minuty potrwa cztery minuty, z 16 GB VRAM GPU.
Ale jakie są cudowne utwory. Mogą być małe, a jakość dźwięku może nie być poziomem premium, ale muzyka nie jest niesamowita.
Ostatnim razem, gdy testowałem komputer na komputerze, było to jak brudna konsola zręcznościowa z lat 90. Jest to urządzenie, którego oczekujesz od prawdziwej muzyki, doskonałych szybkich, świetnych głosów i komercyjnej usługi AI.
Możesz słuchać więcej wyników w chmurze dźwiękowej:
Ostateczne myśli
Tak więc ten projekt jest nadal bardzo trudny i gotowy, a potrzebne zasoby obliczeniowe są śmieszne.
Nawet jeśli masz dobry komputer, spędzasz dużo czasu, aż pojawią się ścieżki. Ale – i jest duży „ale” – pomimo wszystkich tych błędów, to jest to Jest niesamowity Pierwsza próba wyprodukowania otwartego produktu w tej dziedzinie.
Jeśli jest to jakość produkowanego obecnie generacji muzyki AI open source, usługi komercyjne, takie jak UIO i Suno, nie są długo, zanim zaczniemy doświadczać prawdziwego ciepła ze strony społeczności DIY.