Szolgáltató adatai Help Sales ÁSZF Panaszkezelés DSA

About...

Napi betevő adag elírás, elütés és helyesírási hiba egy helyen! Amúgy meg #információbiztonság #webcserkészet néha #élettudomány

bardóczi ákos @post.r

blogavatar

minőségi kontent-egyveleg

RSS

cimketenger

ITsec (38),Facebook (18),privacy (17),egyéb (12),social media (11),itsec (11),social web (10),biztonság (9),mobil (8),Google (6),OSINT (6),jog (6),szellemi tulajdon (6),tudomány (6),magánszféra (6),szájbarágó (5),email (5),webcserkészet (5),molbiol (5),felzárkóztató (5),Nobel-díj (4),big data (4),Gmail (4),kultúra (4),terrorizmus (4),online marketing (4),kriminalisztika (4),plágium (4),webkettő (4),genetika (3),molekuláris biológia (3),pszichológia (3),azelsosprint (3),Android (3),biztonságpolitika (3),nyelvtechnológia (3),magatartástudomány (3),Apple (3),sajtó (3),2015 (3),orvosi-fiziológiai (3),élettudomány (3),gépi tanulás (3),jelszó (3),üzenetküldés (3),CRISPR (3),Onedrive (3),2-FA (3),popszakma (3),konferencia (3),levelezés (3),kriptográfia (3),reklám (3),biztonságtudatosság (3),hype (3),torrent (3),open source intelligence (3),neuropszichológia (2),Whatsapp (2),deep web (2),FUD (2),kulturális evolúció (2),nyílt forrású információszerzés (2),TOR (2),hitelesítés (2),titkosítás (2),Pécs (2),bűnügy (2),tweak (2),facebook (2),SPF (2),DKIM (2),bűnüldözés (2),DDoS (2),bejutas (2),videó (2),Reblog Sprint (2),természetes nyelvfeldolgozás (2),villámokosság (2),Hacktivity (2),Yoshinori Ohsumi (2),reblog (2),cyberbullying (2),arcfelismerés (2),ransomware (2),fiziológia (2),Netacademia (2),webkamera (2),szabad információáramlás (2),P2P (2),Balabit (2),cas9 (2),beszélgetés rögzítése (2),pszeudo-poszt (2),molekuláris genetika (2),bulvár (2),gépház (2),tartalomszolgáltatás (2),jövő (2),bolyai-díj 2015 (2),könyv (2),Tinder (2),öröklődő betegség (2),HR (2),sudo (2),Yandex (2),bug (2),nyelvtudomány (2),meetup (2),Twitter (2),tanulás (2),biológia (2),netkultúra (2),malware (2),IDC (2),social engineering (2),szociálpszichológia (2),kutatás (2),hírszerzés (2),iOS (2),vírus (2),farmakológia (2),pedofília (2),epic fail (2),génterápia (2)

Gépi arcfelismerés: arc nélkül


Avagy rövidhír délutánra.

gépi tanulás neurális hálózatok Max Plack Institute Faceless Recognition System privacy arcfelismerés mintaillesztés

Korábban már többször utaltam rá itt a blogon, hogy a Facebook még akkor is be tud azonosítani egy felhasználót, ha csak valamilyen testrésze látszódik, az arca egyáltalán nem, ráadásul – amire nem emlékeztem pontosan – majdnem 90%-os pontossággal. A keresési lehetőség persze nem lesz elérhető a Facebook mezei felhasználói és az alkalmazásfejlesztők számára sem, jól mutatja, hogy éppenséggel lehet szemérmeskedni a mai világban, csak éppenséggel teljesen értelmetlen.

A Sophos szakmai blogja éppen most számolt be róla, hogy többek közt a Max Plack Intézet kutatói tovább finomították azokat a gépi tanuláson, főleg neurális hálózatokon alapuló módszereket, amik mindezt egyre nagyobb pontossággal lehetővé teszik például térfigyelő kamerák által készített képek alapján is.

Amit a cikkben nem írnak, de érdemes tudni, hogy különböző egyéneknek már a mozgása is eléggé egyedi ahhoz, hogy maholnap megfelelő számítási kapacitás, és persze kellően nagy adattárház rendelkezésre állása esetén videófelvétel alapján is azonosítható legyen bárki például a járása alapján, ha nagyon azonosítani akarják.

A cikk szerint nem csak a kép alapján történő azonosításnál nem csak olyan dolgok lehetnek árulkodóak, mint egy bizonyos mintát tartalmazó póló, a napszemüveg alakja, hanem olyan, képből kinyerhető adatok is, mint az adott személyről készült fotók fényviszonyainak jellemzői. Ma már az is mindegy, hogy egy fotót mennyiszer vasaltak ki Photoshoppal, ugyanis egyrészt vagy ugyanaz a személy vagy nagyon hasonló módon effektezi a képeit vagy az effekt ellenére felismertethető eléggé erős géppel.

A Facebook egy évvel ezelőtti cikke az arcot nem igénylő személyfelismerésről a New Scientist-en erre az MPI igencsak erősre sikerült Faceless Recognition System cikke a műértők számára erre érhető el.

Kép: Sophos

1 Tovább

Big data, pornóipar és a trollok


FindFace pattern recognition mintázatfelismerés big data gépi tanulás arcfelismerés neurális hálózat privacy cyberbullying Yegor TsvetkovMindig is azon a véleményen voltam, hogy többek közt azért rémesen szánalmas dolog siratni a magánszférát a kifogásolható adatkezelési gyakorlatot követő kormányzati szervek, na meg webes óriások miatt, mert nagyságrendekkel nagyobb annak a valószínűsége, hogy a felhasználót a saját hülyesége és az ezzel rendszerint együtt járó exhibicionizmusa kever majd bajba.

Alighanem emlékszünk még azokra a kémfilmekre, amikben a képernyőn pörögnek a pofák, majd egyszer csak hopp, megmondja a gép, hogy melyik terrorista van rajta. Ugyanis a hatékony arcfelismerés egy óriási fotóadatbázisban egyetlen átlagos fotó alapján 15 évvel ezelőtt is megoldhatatlan feladatnak tűnt a számításigénye miatt, holott már évtizedekkel korábban is rendelkezésre álltak azok az algoritmusok, amivel ez megoldható. Nem csak az egyre izmosabb és izmosabb szerverek, hanem a cloud computing, magyarosabb nevén felhő alapú számítástechnika  aztán elhozta azt, ami korábban csak a filmekben létezett. Az első olyan szolgáltatás, ami kép alapján hatékonyan tud keresni és széles körben alkalmazták is, a Google Képkereső volt, az utópia hirtelen valósággá vált.

FindFace pattern recognition mintázatfelismerés big data gépi tanulás arcfelismerés neurális hálózat privacy cyberbullying Yegor Tsvetkov

A Google persze nem hozta nyilvánosságra, hogy milyen gépi tanuláson alapuló mintázatillesztő módszereket gyúrtak az algoritmusukba, azóta számos más mintázatfelismerő szolgáltatás vált elérhetővé kimondottan képek keresésére. Megjegyzem, mindegy, hogy például DNS-szekvenciákat, plágiumgyanus szövegeket, egy hatalmas hangadatbázisból beszédhangot vagy éppen képeket kell gépileg összehasonlítani azaz illeszteni, sokszor ugyanaz az algoritmus használható teljesen eltérő területeken, ami mégis befolyásolja, hogy melyik megoldás terjedt el a képek, azon belül is a képeken lévő arcok felismerésére alapvetően két tényezőtől függött
-    nyilván az alapján, hogy melyik a leghatékonyabb, nem csak pontosság, hanem elfogadható számításigény szempontjából
-    a nyílt forráskódú megoldások közt melyiknek a konkrét, leprogramozott megvalósítása terjedt el – hiszen ezzel kapcsolatban gyűlhetett össze a legtöbb tapasztalat, ez volt a legjobban dokumentálva és így tovább

Képfelismerésről korábban már a combinós posztban, azt megelőzően pedig a legelőnyösebb és legelőnytelenebb szelfiket osztályozni képes posztban már írtam.

FindFace pattern recognition mintázatfelismerés big data gépi tanulás arcfelismerés neurális hálózat privacy cyberbullying Yegor Tsvetkov

Még márciusban Maxim Perlin létrehozta a saját arcfelismerő szolgáltatását, a FindFacet ami egy teljesen átlagos, mobillal készült fotón lévő arc alapján dermesztő pontossággal képes megtalálni az archoz tartozó személyt a neten. Nos, azért nem a teljes neten, hanem az orosz facebook-ként is emlegetett VKontakte szolgáltatásban, ott viszont önmagában a profilképek alapján!

Néhány héttel ezelőtt Yegor Tsvetkov orosz fotós elindította a saját projektjét Your Face Is Big Data néven aminek a lényege az volt, hogy a metrón véletlenszerűen lefotózott személyeket azonosított a VK segítségével. A cikk angol magyarázata itt érhető el.

FindFace pattern recognition mintázatfelismerés big data gépi tanulás arcfelismerés neurális hálózat privacy cyberbullying Yegor Tsvetkov

Amire sem a FindFace szolgáltatás fejlesztője, sem pedig a fotós nem gondolt, hogy nem sokkal ezt követően egy 2chan kezdeményezésre trollok hada szállt rá a szolgáltatásra, majd halomra kezdte posztolni a különböző azonosított pornószínésznők személyes adatait. Ugyan próbálták a dolgot egyfajta morális mázzal leönteni, a net pszichológiáját kicsit is ismerők számára könnyen belátható, hogy a valós indíték a nettó nőgyűlölet volt.

FindFace pattern recognition mintázatfelismerés big data gépi tanulás arcfelismerés neurális hálózat privacy cyberbullying Yegor Tsvetkov

A tanulságot letudhatnánk röviden annyival, hogy ezt a kockázatot be kell vállalni, ha a pornóiparban helyezkedik el valaki, hiba lenne elbagatellizálni azt a kockázatot, ami annak köszönhető, hogy mindenki számára elérhetővé vált egy ennyire hatékony technológia.

A laikus felhasználók számára a Kaspersky Lab állított össze egy posztot a szolgáltatás pontos működésével kapcsolatban, ami azért nagyon fontos, mert a news outlet oldalakon megjelent cikkekkel ellentétben a Kaspersky blogja tisztázza, hogy mi jelent védelmet és mi nem, mikor kell egy felhasználónak tartania tőle és mikor nem, míg a Globalvoices inkább magát a jelenséget járja körül.

FindFace pattern recognition mintázatfelismerés big data gépi tanulás arcfelismerés neurális hálózat privacy cyberbullying Yegor Tsvetkov

1-2 évvel ezelőtt már jelent meg cikk azzal kapcsolatban, hogy a Facebook egyre nagyobb hatékonysággal képes felismeri egy felhasználót akár olyan fotón is, amin nem látszódik a felhasználó arca, csak más testrésze. Ez persze nem jelenti azt, hogy a Facebook a nagyközönség számára elérhetővé is tenne egy olyan funkciót, ami ilyenre lehetőséget ad, jól mutatja, hogy a nagyon-nagyon sok adat alapján úgymond nagyon okossá tud válni egy gép.

Nem titok, hogy a FindFace szolgáltatás lelkét egy hatékony neurális hálózaton keresztül tanuló algoritmus adja, nem világos, hogy mindezt hogyan turbósították, ahogyan az sem, hogy a VKontakte hogyan engedélyezhetett egyetlen külső szolgáltatásnak annyi API lekérdezést, ami a FindFacet ki tudja szolgálni.

FindFace pattern recognition mintázatfelismerés big data gépi tanulás arcfelismerés neurális hálózat privacy cyberbullying Yegor TsvetkovAkit behatóbban érdekel, hogy a big data módszereket hogyan valósítják meg és alkalmazzák, legyen szó akár üzleti folyamatok optimalizálásáról, akár okoskütyükről, annak jó hír, hogy végre lesz Budapesten egy olyan konferencia, ahol olyanok adnak elő, akik nem csak beszélnek róla, hanem ténylegesen értenek is hozzá.

Senkit ne ijesszen el az, ha olyan fogalmakkal találkozik, amikről nincs pontos képe, az előadásokat figyelmesen hallgatva - rémes szóviccel élve - a kevésbé hozzáértők számára össze fog állni a kép. Akik már foglalkoztak big datával, ötletet meríthetnek és bővíthetik az szakmai tájékozottságukat.

Az idei program a Big Data Universe Conference oldalán tekinthető meg.  

Képek: Yegor Tsvetkov, Kaspersky Lab

3 Tovább

A világ legjobb és legrosszabb szelfijei - a ConvNet algoritmus szerint


Hasonló volt már korábban is, ezúttal ún. konvolúciós neurális hálót alkalmatzott egy kutató olyan algoritmus fejlesztéséhez, ami egy szelfiről eldönti, hogy mennyire előnyös, így azzal kapcsolatban tud szabályszerűségeket megállapíani. Különböző típusú neurális hálókat a gépi tanulásban már régóta használnak, a gépi tanuláson alapuló módszerek lényege pedig, hogy az algoritmus kap egy, lehetőség szerint minél nagyobb tanuló halmazt vagy halmazokat, aminek elemeit adott tulajdonság szerint válogattuk össze. A gépi tanulás folyamatában a kezdeti, tipikusan folyamatosan bővülő tanulóhalmaz alapján, a gépi tanuló algoritmus, jelen esetben egy neurális háló, folyamatosan szabályszerűségeket észlel és tárol, ami a kapott elemekre általában igazak. Egy idő után már képes lesz megállapítani egy korábban még sosem látott halmaz elemeiről, hogy azokra érvényesül-e valamilyen tulajdonság vagy sem - döbbenetes pontossággal. Egy fotóról eldönteni emberi szemmel, hogy előnyös vagy sem, nem olyan nehéz, viszont egy gép ízlését kialakítani már korántsem olyan egyerű.  

A Stanford egyik kutatójának, Andrej Karpathynak a blogján nemrég megjelent bejegyzés szerint azért nem is lehetetlen. A gépnek először hatékonyan meg kellett tanítani, hogy mi szelfi egyáltalán és mi nem, majd letöltött ötmillió olyan képet, aminek a tagjei közt ott volt a #selfie kifejezés. Ezt követően letöltött szintén jóadag olyan szelfit más forrásból, amikhez viszont már hozzákapcsolta azokat a metaadatokat is, hogy egy szelfit mennyien lájkoltak vagy kommenteltek, mivel ez nyilván összefüggésben van azzal, hogy mennyire tetszett egy-egy kép másoknak, ezek kívül különböző, statisztikai alapú súlyozási módszereket is használt. Miután a neurális háló tanítása megtörtént, kapott egy ötvenezer elemből álló teszt halmazt, azaz amiről el kellett döntenie az algoritmusnak elemenként, hogy egy-egy szelfi előnyös vagy sem. A posztba egyébként bekerültek a legelőnytelenebbnek ítélt szelfit is. Az algoritmuson keresztül levont általános szabályszerűségek azzal kapcsolatban, hogy mitől lesz jó egy szelfi:   

- hölgynek kell lenni  

- az arc a teljes kép egyharmadát tegye ki, lehetőleg középen vagy a kép felső részében  

- mindenképp látszódjon a homlok  

- viszont látszódjon a hosszú haj is  

- az arckép jó, ha valamilyen effekttel túltelített  

- a legjobb szelfikhez valamilyen keret is tartozott az algoritmus szerint  

Mindezek igencsak egybevágnak azzal, amire intuitív módon is azt mondanánk, hogy szép. A kutatás persze kitér az előnytelen szelfi ismérveire is. Nem kapcsolódik a gépi tanuláshoz, viszont fontos megjegyezni, hogy az olyan effekt, ami az arcot telítetté teszi, a felszínét egységesnek mutatja, azaz az azon előforduló szabálytalanságokat elfedi, tudattalanul mindig is elnyerte mások tetszését. A jelenség evolúciós pszichológiai alapját az adja, hogy a szabályos, szimmetrikus, durva eltérésektől mentes arc az evolúció során egyet jelentett azzal, hogy az egyed egészséges, ellenálló a környezeti hatásoknak, ideértve a kórokozókat, azaz olyanra jellemző, aki alapján emberelődeink tudattalanul helyesen dönthettek úgy, hogy az adott asszonnyal vagy férfival érdemes családot alapítani. Ami egy alaposan vizsgált evolúciós hipotézis értelmében szép, preferált, preferált a közösségi szolgáltatásokban is, egy erről mit sem tudó gépi tanuló algoritmus számára szintén az, csak éppenséggel teljesen más úton lehet arra a következtetésre jutni, hogy valami szép.

képek forrása, erre van még bőven: http://runt-of-the-web.com/selfies-gone-wrong

2 Tovább