Prepoznavanje lica

5 min

Izazova radi (i treniranja nespavanja), zadao sam sebi zadatak: prepoznati osobe u realnom vremenu na snimku koji dolazi uživo sa kamere, samo na osnovu običnih, svakodnevnih fotografija (da ne kažem… selfija). Bonus poeni se dobijaju za dodatnu klasifikaciju; na pr.: detekciju pola.

Da krenemo.

Vitamin C++

Pretragom se brzo pronalazi biblioteka OpenCV koja rešava većinu traženih problema. Reč je o zrelom kodu, koji se naveliko koristi, od mobilnih uređaja do specijalizovanih sistema. Jedina nezgodacija je to što je biblioteka pisana u C++, pa zahteva da se instalira lokalno. Srećom, nudi wrappere za Python i Javu.

Korisnici OSX koji koriste brew (ima li nekog ko ne?) imaju mogućnost da lako instaliraju OpenCV. Međutim, moramo da ga rekompajliramo lokalno, kako bi napravili i JNI wrappere. To je izvodljivo editovanjem brew formule. Ali… nije dovoljno.

Naime, OpenCV dolazi sa dodatnim modulima, poznatim kao opencv_contrib moduli. Jedan od dodatnih modula je i “face” modul, koji služi za prepoznavanje lica. Uobičajena OpenCV konfiguracija dodatnih modula generiše wrapper samo za Python, ali ne i za Javu. Zato nije moguće koristiti brew , već se OpenCV instalacija (kompajliranje, kreiranje native biblioteka i Java jar-a) mora odraditi ručno.

Eh, stari dobri ©make… ceo postupak je ovde.

Detekcija lica

Detekcija lica (face detection) je proces pronalaženja jednog ili više ljudskih lica na slici. Uz OpenCV dolazi i primer koji radi upravo navedeno.

Suština koda je upotreba klase CascadeClassifier. Očekivano, potrebno je prvo istrenirati ovaj klasifajer. OpenCV dolazi s nekoliko već istreniranih modela koji se mogu podeliti u dve grupe: LBP i HAAR. Reč je, prosto, o različitim algoritmima za analizu slike i detekciju oblika. Za LBP postoji svega nekoliko (od koga je jedan detekcija mačjih lica!), dok za HAAR dolazi više od dvadeset istreniranih modela: nekoliko koji prepoznaju lice, modeli za prepoznavanja očiju i nosa, sve do prepoznavanja ruskih saobraćajnih tablica. Kod je vrlo jednostavan:

faceCascade = new CascadeClassifier();
faceCascade.load("haarcascade_frontalface_alt2.xml");
Imgproc.cvtColor(frame, frame, Imgproc.COLOR_BGR2GRAY);
Imgproc.equalizeHist(frame, frame);
faceCascade.detectMultiScale(
	frame,
	detectedFacesRectangulars,
	1.1, 1,
	Objdetect.CASCADE_DO_CANNY_PRUNING,
	new Size(minSize, minSize), frame.size());

Izabrao sam HAAR model za koji sam ustanovio da radi bolje (po osećaju). Ulazna slika sa kamere (frame) se konvertuje u crno-belu sliku i još dodatno prilagođava radi tačnije detekcije. Rezultat detekcije je lista pravouganika (detectedFacesRectangulars) koji oivičuju detektovana lica.

Zahvaljući postojećem primeru, sve se ovo brzo iskodira.

Rezultat: detekcija lica radi vrlo dobro u realnom vremenu i u raznim svetlosnim uslovima (dan, noć). Ponekad postoji problem sa pozadinom koja nije uniformna, pa se kao lice prepozna nešto što to nije.

Prepoznavanje lica

Prepoznavanje lica (face recognition) je proces identifikacije detektovanog lica na slici, tj. određivanje kome ono pripada. U okviru dodatnih OpenCV modula postoji FaceRecognizer interfejs i tri njegove implementacije, algoritma za poređenje treniranog modela i detektovanog lica.

Prvo o algoritmima:

Očigledno je da je za prepoznavanje potrebno istrenirati model. U tu svrhu sam uzeo desetak svojih frontalnih fotografija, namerno snimljenih u različitim uslovima i tokom dužeg vremenskog razdoblja. Želeo sam da simuliram realne uslove koje svako od nas ima na svom telefonu. Sam trening modela je jednostavan. Za svakog pojedinca sam izabrao desetak fotografija, propustio ih kroz detektor lica, nađena lica zatim “isekao” sa originalne fotke i pohranio u faceRecognizer.

Jednom istreniran, prepoznavanje detektovanoh lica (face) se svodi na:

Imgproc.cvtColor(face, face, Imgproc.COLOR_BGR2GRAY);
Imgproc.resize(face, face, TRAIN_FACE_IMAGE_SIZE);

int[] label = {0};
double[] confidence = {0};
faceRecognizer.predict(face, label, confidence);

Rezultat detekcije je labela kojom se identifikuje osoba i tačnost prepoznavanja (nisam uspeo da shvatim kako tačnost radi).

Rezultat: za razliku od detekcije lice, prepoznavanje ne radi baš tako dobro. Najveći problem su tkzv. “false positives” kada algoritam pogrešno identifikuje lica; na pr. moje lice prepozna kao lice nekog drugog. Bolje bi bilo da uopšte ne identifikuje korisnika nego da daje netačne rezultate. Naravno, set fotki uzetih za trening modela verovatno nije baš najbolji i mogao bi sadržati više fotografija; to bi možda pomoglo. Pokazalo se da algoritam radi tačnije danju, tj. na dnevnom svetlu.

Detekcija pola

Svi vole bonus poene:) Za razliku od prethodna dva slučaja, ovde se najviše programiralo. Ideja je da se na osnovu pripremljenih fotografija muškaraca i žena napravi tkzv. “weighted” slika, koja sumira sve postojeće - kao da se, laički rečeno, pravi srednja vrednost svih fotki. Detektovano lice sa kamere se poredi sa ove dve “usrednjene” slike i bira se kojoj više odgovara. Za ulazni set je korišćen AT&T baza lica (postoji još baza lica, naravno).

Sam kod nije nešto interesantan; više predstavlja istraživanje kako OpenCV radi.

Rezultat: algoritam nije preteran precizan, zavisi od osvetljenja; iako je ulazni dataset dobar. Primetio sa češće greši sa muškim licima (ili je to slučaj samo sa mnom).

La La primer

Dalja unapređenja

Sors je dosutpan.

🧧
Nisam definisan svojim stavovima. Stavove usvajamo, menjamo, nadograđujemo, ali oni ne čine nas same. Manje je važno da li se slažemo, koliko da se razumemo.