Gemma 4: lokalny model AI od Google, który nie wysyła dan...

Twój szef zakazał ChatGPT w pracy? Google wypuścił 2 kwietnia Gemma 4: rodzinę otwartych modeli AI, które działają lokalnie. Na laptopie, na telefonie, nawet na Raspberry Pi. Bez chmury, bez internetu. Dane zostają na Twoim urządzeniu, więc nie ma ryzyka wycieku.

Skąd taki skok jakości?

Gemma 4 to nie słaby zamiennik dużych modeli. Poprzednia wersja na benchmarku z matematyki miała 20%. Nowa osiąga 89%. Na kodowaniu skok z 29% do 80%, przy prawie tym samym rozmiarze modelu.

Znany badacz AI sprawdził architekturę i stwierdził, że budowa modelu prawie się nie zmieniła. Cały postęp pochodzi z lepszych danych treningowych. To potwierdza trend: w AI nie chodzi już o większe modele, tylko o mądrzejszy trening.

Co potrafi Gemma 4?

Google zbudował Gemmę 4 z myślą o zadaniach agentycznych: model planuje wieloetapowo, wywołuje funkcje (tool calling) i samodzielnie podejmuje działania. Obsługuje tekst i obraz na wejściu, a mniejsze warianty rozumieją też audio. Kontekst sięga 128 000 tokenów, co oznacza przetwarzanie naprawdę długich dokumentów.

Najmniejszy wariant (E2B) zajmuje poniżej 1,5 GB pamięci dzięki kwantyzacji do 2-4 bitów. Na Raspberry Pi 5 generuje prawie 8 tokenów na sekundę, a na chipie Qualcomm Dragonwing: 31 tokenów/s. Cała rodzina działa na Androidzie, iOS, Windowsie, Linuxie, macOS i w przeglądarce (WebGPU).

Cztery warianty, od przeglądarki po serwer

Rodzina Gemma 4 to nie jeden model. Google wypuścił cztery warianty: E2B (2,3 mld parametrów), E4B (~4 mld), 26B A4B (architektura MoE) i 31B (dense). Najmniejszy, E2B, waży około 500 MB po kwantyzacji i jest jedynym, który realistycznie działa w przeglądarce. Większe warianty wymagają dedykowanego GPU lub serwera.

Przetestuj w przeglądarce, bez instalacji

Przygotowałem darmowy Prywatny Chat AI, który uruchamia Gemmę 4 E2B bezpośrednio w Twojej przeglądarce przez WebGPU. Możesz zadawać pytania tekstem lub wysłać zdjęcie do analizy. Żadne dane nie opuszczają Twojego urządzenia. Pierwsze uruchomienie pobiera model (~500 MB), kolejne ładują go z cache w kilka sekund. Potrzebujesz Chrome lub Edge na komputerze.

Licencja Apache 2.0 pozwala na użycie komercyjne. Jeśli wolisz testować w chmurze: wejdź na Google AI Studio, wybierz Gemma 4 i zacznij pisać. Od startu projektu deweloperzy pobrali modele Gemma ponad 400 milionów razy.

Więcej o praktycznym wykorzystaniu AI znajdziesz w kursie Skuteczne Prompty (21 lekcji wideo). Gotowe prompty do kopiowania czekają w Repozytorium Promptów.

Skąd taki skok jakości?

Co potrafi Gemma 4?

Cztery warianty, od przeglądarki po serwer

Przetestuj w przeglądarce, bez instalacji

Napisz do mnie