Trzy sekundy. Tyle Microsoft potrzebuje, żeby z jednego zdjęcia zrobić model 3D gotowy do druku albo do gry. I wrzucił to za darmo na GitHuba.
Cztery miliardy parametrów na otwartej licencji
Model nazywa się TRELLIS 2, ma cztery miliardy parametrów i jest wydany na licencji MIT. Wrzucasz fotkę, a wychodzi obiekt z teksturami, które wyglądają jak żywe pod każdym oświetleniem. Format wyjścia to GLB, czyli bezpośrednio do Blendera, Unreal Engine albo na drukarkę 3D, bez konwersji.
Pod maską siedzi nowa reprezentacja O-Voxel (Omni-Voxel) i kompresor Sparse Compression VAE. Brzmi jak żargon, ale w praktyce daje to obiekty, które inne narzędzia po prostu się wykładają na poziomie geometrii.
Radzi sobie z tym, czego inne modele nie ogarniają
To jest realna różnica względem poprzedniej generacji. TRELLIS 2 ogarnia rzeczy, na których konkurenci się sypią: ubrania, liście, dziwne kształty z wewnętrznymi strukturami, skomplikowaną geometrię. Czyli wszystko, co nie jest gładką sztywną bryłą.
To otwiera konkretne zastosowania. Skanowanie figurek do druku 3D bez fotogrametrii. Przerabianie zdjęć produktów na assety do sklepu w VR. Szybkie prototypy dla gamedevu, gdzie zamiast modelować postać przez tydzień, robisz szkic, generujesz model i tylko go dopracowujesz.
Lokalnie tylko z grubym sprzętem
Jest jeden haczyk. Żeby uruchomić TRELLIS 2 lokalnie, potrzebujesz Linuxa i karty NVIDIA z minimum 24 GB pamięci. To wyklucza większość zwykłych komputerów, bo nawet RTX 4090 ma 24 GB i pracuje na granicy. Nie odpalisz tego na laptopie z RTX 3070.
Ale jest dobra wiadomość. Microsoft udostępnił oficjalne demo na Hugging Face, gdzie każdy może przetestować model w przeglądarce za darmo, bez instalacji i bez własnego GPU. Wrzucasz zdjęcie figurki, postaci z gry, mebla, czegokolwiek, i masz model 3D w kilka sekund.
Dlaczego to ważne
Microsoft wrzucił model klasy produkcyjnej za zero złotych, na licencji, która pozwala go używać komercyjnie. Branża 3D, gdzie do tej pory płaciło się za każdy asset albo godzinami siedziało w Blenderze, dostała narzędzie, które obniża koszt i czas o rząd wielkości.
To kolejny dowód, że otwarte modele dogoniły, a w niektórych zadaniach przegoniły, zamknięte rozwiązania. Jeśli chcesz lepiej rozumieć, jak korzystać z AI w codziennej pracy i co da się dziś realnie zrobić, zajrzyj do kursu Skuteczne Prompty (21 lekcji wideo). Gotowe prompty znajdziesz w Repozytorium Promptów.