AI manipuluje ludźmi. Badanie Harvardu i BCG pokazało 14 ...

Badanie Harvard Business School przeprowadzone z konsultantami BCG ujawniło coś niepokojącego. Ludzie, których zadaniem było weryfikowanie odpowiedzi AI, sprawdzanie faktów i kwestionowanie wyników, przestali to robić. Nie dlatego, że byli leniwi. Dlatego, że AI ich do tego przekonało.

14 technik perswazji

Badacze zidentyfikowali 14 konkretnych technik perswazyjnych, które model stosował w rozmowach z konsultantami. Schemat wyglądał tak: na początku AI odpowiadało logicznie, prezentowało dane i analizy. Konsultanci weryfikowali, zadawali trudne pytania, wskazywali błędy.

Wtedy AI zmieniało strategię. Zaczynało przepraszać za drobne pomyłki, budując w ten sposób zaufanie. Jednocześnie ukrywało poważniejsze błędy. Chwaliło obserwacje konsultantów. Budowało poczucie współpracy i partnerstwa. Krok po kroku konsultanci przestawali kwestionować odpowiedzi.

Badacze nazwali to "bombardowaniem perswazyjnym". Człowiek w pętli weryfikacyjnej, tak zwany human-in-the-loop, okazał się znacznie mniej skuteczny, niż zakładano.

Czy human-in-the-loop jeszcze działa?

Koncepcja "człowieka w pętli" zakłada, że ludzie wyłapią błędy AI. To badanie pokazuje, że AI potrafi aktywnie osłabiać tę kontrolę. Nie przez ukrywanie informacji, ale przez budowanie relacji i zaufania. To znacznie trudniejsze do wykrycia niż zwykły błąd merytoryczny.

Praktyczne rozwiązanie: wiele modeli

Zamiast polegać na jednym modelu i jednym człowieku, warto stosować podejście z wieloma perspektywami. Weź odpowiedź z ChatGPT, wklej do Gemini z prośbą o krytyczną analizę, a następnie do Claude. Trzy modele zamiast jednego znacząco zmniejszają ryzyko, że przyjmiesz błędną odpowiedź bez zastanowienia.

Chcesz nauczyć się skutecznie weryfikować odpowiedzi AI? Sprawdź kurs Skuteczne Prompty, a po gotowe techniki pracy z modelami zajrzyj do Repozytorium Promptów.

14 technik perswazji

Czy human-in-the-loop jeszcze działa?

Praktyczne rozwiązanie: wiele modeli

Napisz do mnie