OD 11.02.2011 FORUM PEŁNI WYŁĄCZNIE ROLĘ ARCHIWALNĄ. NIE JEST MOŻLIWA REJESTRACJA ANI DODAWANIE WYPOWIEDZI.
kognitywistyka.net: forum Strona Główna
 FAQ   Szukaj   Użytkownicy   Grupy   Rejestracja   Profil   Zaloguj się, by sprawdzić wiadomości   Zaloguj 

 Ogłoszenie 
OD 11.02.2011 FORUM PEŁNI WYŁĄCZNIE ROLĘ ARCHIWALNĄ. NIE JEST MOŻLIWA REJESTRACJA ANI DODAWANIE WYPOWIEDZI.

Poprzedni temat «» Następny temat
Rozpoznawanie znaków.
Autor Wiadomość
Jarek Mazurek.


Posty: 700
Skąd: Szczecin
Wysłany: 2007-10-14, 22:04   Rozpoznawanie znaków.

Witam
W nawiązaniu do dyskusji na temat zabezpieczeń forum oraz ogólnie OCR, pozwoliłem sobie, napisać skrypcik PHP, rozpoznający cyfry z obrazków, generowanych na stronie rejestracyjnej tego forum. Praca zajęła mi kilka dni, bo dopiero się uczę PHP.
I muszę powiedzieć, że zastosowany tu rodzaj CAPTCHA jest wyjątkowo łatwy do rozpoznania nawet dla głupich programów (a mój taki właśnie jest ::)) ).
Sugeruję, tym samym, zmianę algorytmu CAPTCHA na trudniejszy dla automatów.
Link do skryptu PHP
Trochę się śpieszyłem, bo chodziło o zakład, że zrobię od zera program działający online w ciągu tygodnia.
Nie zastosowałem, żadnych zaawansowanych sztuczek ani specjalistycznych bibliotek.
Program działa na zasadzie porównywania odnalezionych grup pikseli w obrazku do wcześniej przygotowanych wzorców.
W niedalekiej przyszłości dodam możliwość wybierania zewnętrznego obrazka do analizy.

Aha, efekt rozpoznawania jest w języku klingońskim. :D żeby botom było trudniej.
Od razu powiem jakich obrazków ten programik nie rozpozna poprawnie:
- z inną ilością cyfr niż 4
- z cyframi pisanymi różną wielkością tej samej czcionki (ale mogę zrobić skalowanie)
- z cyframi pisanymi różnymi krojami czcionek
- z cyframi zachodzącymi na siebie lub połączonymi ze sobą
- z cyframi generowanymi losowo z różną pochyłością (mogę zrobić obracanie)
- i całej masy innych
Program jest trochę wolny, bo nie zastosowałem żadnej optymalizacji.
Np. wielokrotnie odwołuję się do obrazków png na dysku serwera itp.
Po małej optymalizacji udostępnię statystykę skuteczności.

Skuteczność, tej prymitywnej metody rozpoznawania jest 30/31, co było dla mnie zaskoczeniem.
Na 31 obrazków (w każdym 4 cyfry) wczytanych z forum - 30 jest rozpoznane poprawnie.
Ostatnio zmieniony przez Jarek Mazurek. 2007-10-24, 18:31, w całości zmieniany 9 razy  
 
 
Paweł Piątkowski


Posty: 218
Skąd: Dąbrowa Górnicza
Wysłany: 2007-10-15, 10:47   

Gratuluję programu :)
Przy okazji wraca temat rozpoczęty w innym wątku. Jeżeli chodzi o testy CAPTCHA, mam kilka nietuzinkowych pomysłów, w tym jedną gotową implementację, która kurzy się na dysku i czeka na wypróbowanie "w terenie" :) Nie ma stuprocentowych zabezpieczeń, ale pomysł oparty na własnym algorytmie pozwala zabezpieczyć się przed znakomitą większością ataków - boty mają rozpracowany algorytm testu z phpBB, który jest najpopularniejszy; przy innych algorytmach często głupieją.
Pozdrawiam
 
 
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych
Wersja do druku

Skocz do:  

Support forum phpbb by phpBB Assistant
Powered by phpBB modified by Przemo © 2003 phpBB Group
Theme xandgreen created by spleen modified v0.3 by warna

CogNews.net




Patronat Medialny kognitywistyka.net

patronat medialny

patronat medialny


Dni Mózgu 4

patronat medialny


Ways to protolanguage