Witam
W nawiązaniu do dyskusji na temat zabezpieczeń forum oraz ogólnie OCR, pozwoliłem sobie, napisać skrypcik PHP, rozpoznający cyfry z obrazków, generowanych na stronie rejestracyjnej tego forum. Praca zajęła mi kilka dni, bo dopiero się uczę PHP.
I muszę powiedzieć, że zastosowany tu rodzaj CAPTCHA jest wyjątkowo łatwy do rozpoznania nawet dla głupich programów (a mój taki właśnie jest ).
Sugeruję, tym samym, zmianę algorytmu CAPTCHA na trudniejszy dla automatów.
Link do skryptu PHP
Trochę się śpieszyłem, bo chodziło o zakład, że zrobię od zera program działający online w ciągu tygodnia.
Nie zastosowałem, żadnych zaawansowanych sztuczek ani specjalistycznych bibliotek.
Program działa na zasadzie porównywania odnalezionych grup pikseli w obrazku do wcześniej przygotowanych wzorców.
W niedalekiej przyszłości dodam możliwość wybierania zewnętrznego obrazka do analizy.
Aha, efekt rozpoznawania jest w języku klingońskim. żeby botom było trudniej.
Od razu powiem jakich obrazków ten programik nie rozpozna poprawnie:
- z inną ilością cyfr niż 4
- z cyframi pisanymi różną wielkością tej samej czcionki (ale mogę zrobić skalowanie)
- z cyframi pisanymi różnymi krojami czcionek
- z cyframi zachodzącymi na siebie lub połączonymi ze sobą
- z cyframi generowanymi losowo z różną pochyłością (mogę zrobić obracanie)
- i całej masy innych
Program jest trochę wolny, bo nie zastosowałem żadnej optymalizacji.
Np. wielokrotnie odwołuję się do obrazków png na dysku serwera itp.
Po małej optymalizacji udostępnię statystykę skuteczności.
Skuteczność, tej prymitywnej metody rozpoznawania jest 30/31, co było dla mnie zaskoczeniem.
Na 31 obrazków (w każdym 4 cyfry) wczytanych z forum - 30 jest rozpoznane poprawnie.
Ostatnio zmieniony przez Jarek Mazurek. 2007-10-24, 19:31, w całości zmieniany 9 razy
Gratuluję programu
Przy okazji wraca temat rozpoczęty w innym wątku. Jeżeli chodzi o testy CAPTCHA, mam kilka nietuzinkowych pomysłów, w tym jedną gotową implementację, która kurzy się na dysku i czeka na wypróbowanie "w terenie" Nie ma stuprocentowych zabezpieczeń, ale pomysł oparty na własnym algorytmie pozwala zabezpieczyć się przed znakomitą większością ataków - boty mają rozpracowany algorytm testu z phpBB, który jest najpopularniejszy; przy innych algorytmach często głupieją.
Pozdrawiam
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach Nie możesz załączać plików na tym forum Możesz ściągać załączniki na tym forum