Darmowe narzędzie AI

Zamień mowę na tekst

Nagraj głos lub wgraj plik audio, a AI (Whisper) zamieni mowę na tekst. Polski i angielski. Pliki nie opuszczają Twojego urządzenia.

> made with vibe coding by KrupińskiAI_

Język nagrania
Szybki
Whisper Tiny
Szybsza transkrypcja. Dobry do czystego audio i krótkich nagrań.
Model: ~41 MB
Dokładny
Whisper Base
Lepsza jakość. Radzi sobie z szumem i trudniejszym audio.
Model: ~75 MB
Pro
Whisper Small
Najlepsza jakość. 2x precyzyjniejszy niż Base dla polskiego.
Model: ~249 MB (jednorazowe pobranie)
0:00
Kliknij, aby rozpocząć nagrywanie
Mów wyraźnie, w cichym otoczeniu. Maks. 5 minut.
🔒 Audio nie opuszcza Twojego urządzenia
📁
Przeciągnij plik audio tutaj
lub kliknij, aby wybrać z dysku
Formaty: MP3 · WAV · M4A · OGG · WEBM
Maksymalna długość: 5 minut
Pobieranie modelu AI...
Pierwsze uruchomienie wymaga pobrania modelu. To jednorazowa operacja.

Jak zamienić mowę na tekst?

1

Nagraj lub wgraj

Nagraj głos z mikrofonu lub wgraj plik audio (MP3, WAV, M4A). Wybierz język i tryb.

2

AI transkrybuje

Model Whisper przetwarza audio i zamienia mowę na tekst. Wszystko dzieje się w Twojej przeglądarce.

3

Skopiuj lub pobierz

Edytuj wynik, skopiuj do schowka lub pobierz jako plik TXT. Gotowe.

Najczęściej zadawane pytania

Jak zamienić nagranie audio na tekst online?
Otwórz narzędzie, wybierz język (polski lub angielski), nagraj głos z mikrofonu lub wgraj plik audio. Model AI Whisper automatycznie zamieni mowę na tekst. Skopiuj wynik lub pobierz jako plik TXT. Cały proces odbywa się w Twojej przeglądarce.
Czy transkrypcja rozpoznaje język polski?
Tak. Narzędzie korzysta z modelu Whisper od OpenAI, który obsługuje język polski. Wybierz "Polski" z listy języków przed rozpoczęciem transkrypcji. Dla lepszej jakości rozpoznawania polskiej mowy użyj trybu Dokładny (Whisper Base).
Czy moje nagrania są gdzieś wysyłane?
Nie. Cały proces transkrypcji odbywa się wyłącznie w Twojej przeglądarce. Model AI (Whisper) działa lokalnie na Twoim urządzeniu. Nagrania nie są wysyłane na żaden serwer, nie są zapisywane ani analizowane. Po zamknięciu strony nie pozostaje żaden ślad.
Jaka jest maksymalna długość nagrania?
Narzędzie obsługuje nagrania do 5 minut. Dłuższe pliki audio są automatycznie dzielone na 30-sekundowe fragmenty i przetwarzane po kolei. Ograniczenie wynika z tego, że przetwarzanie odbywa się w przeglądarce, a dłuższe nagrania mogłyby przeciążyć pamięć urządzenia.
Czym różni się tryb Szybki od Dokładnego?
Tryb Szybki używa modelu Whisper Tiny (41 MB), który jest lżejszy i szybszy. Tryb Dokładny to Whisper Base (75 MB) z lepszą jakością. Tryb Pro to Whisper Small (249 MB), który jest 2x precyzyjniejszy niż Base dla języka polskiego. Im większy model, tym dłuższe pierwsze pobieranie, ale model zapisuje się w przeglądarce i kolejne użycia są szybkie.
Jakie formaty audio są obsługiwane?
Narzędzie obsługuje najpopularniejsze formaty audio: MP3, WAV, M4A (nagrania z iPhone), OGG i WEBM. Pliki są automatycznie konwertowane do formatu wymaganego przez model AI. Możesz też nagrać głos bezpośrednio z mikrofonu.
Dlaczego pierwsze uruchomienie trwa dłużej?
Przy pierwszym użyciu przeglądarka pobiera model AI Whisper (41 MB lub 75 MB w zależności od trybu). Model jest zapisywany w pamięci przeglądarki, więc kolejne uruchomienia są znacznie szybsze. To jednorazowa operacja.
Czy transkrypcja działa na telefonie?
Tak, narzędzie działa na telefonach z nowoczesną przeglądarką (Chrome, Safari, Edge). Na telefonach dostępny jest tryb Szybki (model 41 MB). Przetwarzanie może być wolniejsze niż na komputerze. Nagrywanie z mikrofonu wymaga udzielenia zgody na dostęp do mikrofonu.

Naucz się korzystać z AI w codziennej pracy

Kurs "Skuteczne Prompty: Baza i Techniki" - 21 lekcji wideo i gotowe prompty do użycia.

Sprawdź kurs
Skopiowano do schowka
Kurs online

Naucz się wykorzystywać AI w praktyce

21 lekcji wideo i gotowe prompty do skopiowania. Dołącz do 87 000+ osób, które uczą się ze mną AI.

Sprawdź kurs Skuteczne Prompty →