About...

Napi betevő adag elírás, elütés és helyesírási hiba egy helyen! Amúgy meg #információbiztonság #webcserkészet néha #élettudomány

bardóczi ákos @post.r

blogavatar

minőségi kontent-egyveleg

RSS

cimketenger

ITsec (37),privacy (17),Facebook (17),social media (11),itsec (11),egyéb (10),social web (9),biztonság (8),mobil (8),OSINT (6),jog (6),magánszféra (6),tudomány (6),szellemi tulajdon (6),Google (5),molbiol (5),felzárkóztató (5),webcserkészet (5),szájbarágó (5),plágium (4),Nobel-díj (4),kriminalisztika (4),terrorizmus (4),kultúra (4),big data (4),email (4),genetika (3),pszichológia (3),molekuláris biológia (3),biztonságpolitika (3),CRISPR (3),Android (3),online marketing (3),sajtó (3),élettudomány (3),gépi tanulás (3),Onedrive (3),üzenetküldés (3),jelszó (3),2015 (3),orvosi-fiziológiai (3),Apple (3),Gmail (3),reklám (3),konferencia (3),webkettő (3),biztonságtudatosság (3),kriptográfia (3),levelezés (3),magatartástudomány (3),azelsosprint (3),popszakma (3),hype (3),open source intelligence (3),torrent (3),nyelvtechnológia (3),bejutas (2),tweak (2),villámokosság (2),cas9 (2),Yoshinori Ohsumi (2),Hacktivity (2),génterápia (2),fiziológia (2),természetes nyelvfeldolgozás (2),Reblog Sprint (2),bűnügy (2),Pécs (2),nyílt forrású információszerzés (2),webkamera (2),deep web (2),P2P (2),Netacademia (2),arcfelismerés (2),DDoS (2),Balabit (2),bűnüldözés (2),TOR (2),kulturális evolúció (2),ransomware (2),hitelesítés (2),SPF (2),Whatsapp (2),neuropszichológia (2),szabad információáramlás (2),FUD (2),DKIM (2),2-FA (2),bolyai-díj 2015 (2),molekuláris genetika (2),jövő (2),sudo (2),IDC (2),cyberbullying (2),social engineering (2),malware (2),tartalomszolgáltatás (2),meetup (2),facebook (2),reblog (2),videó (2),titkosítás (2),kutatás (2),epic fail (2),pedofília (2),netkultúra (2),nyelvtudomány (2),vírus (2),hírszerzés (2),iOS (2),farmakológia (2),szociálpszichológia (2),tanulás (2),biológia (2),gépház (2),bulvár (2),bug (2),Tinder (2),öröklődő betegség (2),Yandex (2),könyv (2),beszélgetés rögzítése (2),pszeudo-poszt (2),Twitter (2)

Teljesen automatizált lett a FB hírfolyama, az eredmény bejósolható volt


curated content social media FacebookMég májusban nem kis botrány kerekedett belőle, amikor kiderült, hogy szó sincs arról, hogy a Facebook teljesen automatizáltan jelenítené meg, átkattintások, lájkok, megosztások és egyéb interakciók alapján, hogy a felhasználó falán milyen cikkajánlók jelenjenek meg a nagy lapok tartalmai közül. Konkrétan egy ex-Facebook-alkalmazott először a Gizmodo-nak talált ki azzal kapcsolatban, hogy egy részletes guidelinet kell követnie egy jókora szerkesztőségnek, amivel befolyásolják, hogy milyen forrásból, milyen típusú hírek kerüljenek előtérbe, azzal kapcsolatban pedig a Facebook nem állt elő polkorrekt magyarázattal, hogy miért is. Ugyan erre bármit is mondani kommunikációs hiba lett volna, hiszen enélkül is rájuk verték, hogy az USA-beli liberális tartalmakat preferálják a szerkesztők.

Nehezen hihető, de állítólag nemrég a Facebook a teljes kurátorként dolgozó csapatot menesztette és azt állítják, hogy már valóban csak algoritmusok döntenek arról, hogy mi legyen előtérben a nagy lapok által posztok tartalmak közül, csak különösen indokolt esetbe nyúlnak bele ebbe kézzel. Az eredmény teljesen bejósolható volt: az oldalak elkezdték önteni a veszélyes baromságot, kevésbé rossz esetben álhíreket mindenhonnan, elsősorban a szolgáltatást USA-ban használó felhasználók falára. Másrészt mindez meglátszott azoknak a felhasználók falán is, ahol látszik a Trending box, ami egyenlőre csak amerikai angol nyelven érhető el, bizonyos államokban illetve ha a felhasználó megjelölte a beállítások közt, hogy tud az adott nyelven. A képet az Arsról friss cikkéből csentem:

curated content social media Facebook

Probléma-e ez? Ha azt nézzük, hogy több friss tudományos kutatás szerint az emberek döntő többségét témafüggően ugyan, de sokszor nem is érdekli a hírek valóságtartalma, még ha érdekelné is őket, nyilván nem mennének minden hír forrásának utána, mondhatni tragikus a helyzet. Ez az egyik magyarázat arra, hogy alapvetően az ostobaság sokkal gyorsabban terjed a neten, amivel összefügg, hogy a nagy átlag jobban harap a gyorsan fogyasztható, érzelmekre, attitűdökre, egyéni értékrendre ható, társadalmi konvenciókat súroló vagy sértő  tartalmakra.

Mindez egyébként nem csak a közösségi médiában figyelhető meg. A legnépszerűbbnek számító Google Kereső többek közt annak megfelelően rangsorolja a találatokat, hogy korábbi keresések során, azonos vagy hasonló jelentésű kulcsszavakra keresve a felhasználók mely webhelyekre kattintottak rá, hiszen ebből is következtet arra, hogy mit találtak hasznosnak. Ennek megfelelően az információszerzésnek vannak olyan területei, amire tökéletesen alkalmatlan a Google keresője, tipikusan ilyen az, amikor valaki egy számára ismeretlen gyógyszerre keres rá. A top 10 találatban szinte biztos, hogy olyan leírásokkal fog találkozni, hogy valakinek a gyógyszertől felrobbant a szive, agya, tüdeje, megőrült, detoxba került és így tovább, mivel az sokkal érdekesebb, mivel ezek egyszerűen érdekesebbek, hiába lenne az angol nyelvű Wikipedia egy egészen használható forrás a laikus felhasználóknak is, az pedig szégyen, hogy egy-egy készítményre keresve mennyire sokadik találatként jön elő a gyógyszer ChEMBLMedlineplus,  PubCHEMIUPHAR, DrugBank, UNII, KEGG, ChEBI vagy éppen Drugs.com adatlapja, holott a legrelevánsabbak nyilván ezek lennének, az más kérdés, hogy nem a leghasznosabbak, mivel az átlag netező fix, hogy nem értené meg. Ebből is látszik, hogy a keresés külön művészet, de most nem ez a poszt témája.

Itt-ott már slágertéma volt, hogy maholnap nem lesz szükség újságírókra és szerkesztőkre azért, mert annyira kifinomult algoritmusok léteznek ma már, hogy azok is képesek lesznek elvégezni a feladatukat. Való igaz, hogy alkottak már olyan algoritmust, ami olyan pontos cikket szerkesztett, amit nem tudtak megkülönböztetni az ember által írt cikktől, ebből azért ennyire messzemenő következtetéseket levonni nem szabadna.

Szerkesztőkre, kurátorokra egyszerűen szükség van és ezt sokan így érzik helyesnek. Tudom, tudom, már-már rögeszmém a téma, de a net hőskorában az volt a szép, hogy mindenkinek a szava nagyjából egyenértékű volt, akár fórumozásról, akár korai blogbejegyzésekről volt szó, a kommentekből pedig a szerző tanulhatott az olvasóitól. Ez a rendszer nagyon szépen működött addig, amíg körülbelül a népesség legiskolázottabb 10-20%-a fért hozzá az internethez, remek kérdés, hogy mikor és mekkora netpenetráció elérésekor jutott el a net egy olyan átbukási ponthoz, amikor a liberális tudásmegosztásból hirtelen anarchia és ordítozás lett, amire különböző szolgáltatók különböző módon válaszoltak. A mindenki által szabadon szerkeszthető hírportálok, mint amilyen volt például a Virtus vagy az Exergum, nem tudták kezelni a jelenséget és megszűntek, a nagy hírportálokhoz becsatornázott blogszolgáltatásokban keletkező posztokat pedig harceddzett szerkesztők lapátolják olyan felületre – magyarul az anyaoldal nyitólapjára - ahonnan történik is átkattintás, különben ma már minden szolgáltatót elöntene a szar. Mi több, ahol heterogén környezetből kell mindig a legfrissebb híreket kiválogatniuk szerkesztőknek, AI-val alaposan megtámogatott szoftverrendszerek segítik a feladatot, az emberi beavatkozás nélkül, ámde hatékonyan működő híraggregátorok, mint amilyen a felhasználó ízlését tanuló Flipboard eleve kézileg előzetesen szűrt forrásokból dolgoznak, azaz annak az ajánlójába aligha kerül be egy 10 perce létrehozott blogról Droid Pisti épületes bölcsessége.

Miért feltételeznénk, hogy a Facebook máshogy működik, ha hírportálok FB-oldaláról van szó? A szerkesztők saját ízlése szükségszerűen mellélőhet azzal kapcsolatban, hogy mi érdekes a felhasználók számára, viszont még mindig összehasonlíthatatlanul kedvezőbb állapot, mintha okos algoritmusok vennék át a gyeplőt, aztán jobb esetben csak a környezetünknek tetsző, ilyen módon némileg egyhangú tartalmakat kapnánk folyamatosan [mivel a FB mindennek kapcsolatban feltételezi, hogy a felhasználó ismerősei hasonlítanak hozzá, így például érdeklődés szempontjából is]. A rosszabb eset pedig az lenne, ha a tömegesen lájkolt, megosztott, kommentelt silány minőségű vagy akár uszító tartalomtól nem lehetne látni a normális tartalmakat vagy csak ésszerűtlen idő- és energiaráfordítással lehetne megtalálni azokat.

Szinte kizárt, hogy a Facebook teljesen és végleg kiiktatta az emberi tényezőt, pláne azért nem, mert emiatt ideig-óráig hőbörgött pár hülye egybites aggyal, a mostani lépés pedig érthetetlen, ugyan ötletelésnek van helye.

Még egyszer: a változtatás csak a nagy, angol nyelvű lapok tartalmait érinti és nem a teljes hírfolyamot, viszont rendkívül tanulságos még így is, ha figyelembe vesszük, hogy mekkora befolyása van annak a tömegre, amit lát.

0 Tovább

A Facebook, mint értelmes napi információforrás 


Facebook social media Facebook-oldal beállítás tweak

Nemrég ismét vezető hír volt, hogy a Facebook ismét meghúzott néhány csavart a motorháztető alatt, ami miatt ismét változik az az algoritmus, ami a besaccolt érdeklődési körünk és aktivitásunk alapján eldönti, hogy milyen tartalmakat jelenítsen meg a falon.

Ez pedig nagyon nem mindegy. A nemrég megszűnt cink.hu olvasói jórészt a Facebookról kattintottak át az oldal cikkeire, azonban amikor a Facebook olyan módon változtatott, hogy valami miatt kevésbé jelenítette meg a Cink oldalán megjelenő posztokat, ez kapásból azt eredményezte, hogy nem tudta a Cink.hu növelni a saját látogatottságukat. Megint más óriáscégek, amik felfoghatatlan összegeket fizettek azért, hogy az oldalukon megjelenő szponzorált posztok a lájkerek előtt megjelenjenek, hatalmasat zakóztak egy hasonló, tisztázatlan módosítás miatt.

Hozzáteszem, sokkal gyakrabban finomít a FB ezen, mint amennyi alkalommal bejelentik, ami eléggé világos, hogy a Facebook az eredeti képes és videós tartalmakat szeretné előtérbe húzni. De mi a helyzet akkor, ha a Facebook helyett mi magunk döntenénk el, hogy mi kerüljön elénk mindenképpen?

Ha egy ismerősünket a Close friends listába soroljuk, automatikusan beállítódik, hogy szinte minden tartalma jelenjen meg előttünk is. Valamivel később bevezetett beállítási lehetőség, hogy felhasználók és oldalak esetén egyaránt dönthetünk arról, hogy az adott ismerős, követett felhasználó vagy oldal tartalmait alapértelmezés szerint jelenítse meg a Facebook vagy mindenképp, azonnal, ez lenne a „See first” beállítás. Igen ám, az viszont korlátozott, hogy összesen mennyi felhasználónál adható meg ez a beállítás, talán maximum 40 felhasználónál állíthatjuk be, hogy azonnal jelenjenek meg nálunk az ő tartalmai is.

Az oldalakkal van egy kis „baj”, már főleg annak, aki ebből él: pusztán azzal, hogy a felhasználó lájkolt egy oldalt, még messze nem jelenti azt, hogy az oldal tartalmai meg is jelennének nála, holott ez lenne a lényeg. Mindenkit megkímélnék az olyan online marketinges bullshitektől, mint például, hogy az ideális jelenléthez hetente mennyiszer, milyen napszakban, mit érdemes posztolni. Ugyanaz a szánalmas szituáció, mint a SEO esetén, ahol a SEO/SEM-szakik megpróbálnak okosabbak lenni a Google-nél. Próbálkozni lehet, viszont a Facebook a ténylegesen értéket teremtő oldalak tartalmait alapértelmezés szerint is meg fogja jeleníteni, a szennyet illetve kevésbé karbantartott oldalak posztjait pedig nagyon helyesen elrejteni.

Na de mi a helyzet akkor, ha egy oldal összes posztját szeretnénk látni a falunkon, alapból, például szakmai érdeklődés miatt? Nos, a See first-öt nekem nem engedte beállítani valami miatt oldalaknál, megoldás viszont természetesen van. Amikor lájkolunk egy oldalt, a belső videós illetve live tartalmak lesznek azok, amik mindenképp megjelennek az oldaltól, míg a többi tartalom vagy vagy pedig nem, függően attól, hogy mennyire tartja számunkra relevánsnak a Facebook. Az adott oldalon a lájk gombra kattintva ha az értesítésekre kattintunk, azt láthatjuk, hogy csak a videós tartalmak jelennek meg. Ha kattintunk az „All off” lehetőségre, majd az „All on” beállítást választjuk, látható, hogy a Facebook vette az adást, az oldal minden tartalma meg fog jelenni a falunkon. Attól nem kell tartani, hogy az értesítések menü áttekinthetetlen lesz, hiszen ha egy oldal posztol mondjuk 10-szer egy nap, az esti belépéskor csak egy értesítés lesz azzal kapcsolatban, hogy az adott oldal 10 posztot tett ki, míg ha éppen be vagyunk jelentkezve, külön-külön megjelennek az értesítések.

Facebook social media Facebook-oldal beállítás tweakFacebook social media Facebook-oldal beállítás tweak

Hasznos lehet még, ha belépést követően az oldallécben az ismerős[lista] nevére kattintunk, ekkor az összes poszt megjelenik, amit aznap helyeztek el az ismerőseink, minden aprósággal együtt. Míg ha oldalak tartalmairől tájékozódni megyünk fel, ugyancsak az oldallécben kiválasztjuk a Pages Feed menüpontot, ami az összes posztot megjeleníti, amit az általunk kedvelt és fullos megjelenítésre beállított oldalon elhelyeztek.

Ahány felhasználó, annyi féle, van, aki mindenkit felvesz ismerősnek udvariasságból, aztán legfeljebb némítja, ha már túl sok marhaságot posztol, megint más felhasználók pedig csak azokat veszik fel ismerősnek, akinek a tartalmai kimondottan érdekesek számukra. Az viszont világos, hogy a Close friends elődefiniált csoportot sem érdemes 100-asnál nagyobbra venni, különben követhetetlen lesz, hogy milyen tartalmakat posztoltak az ismerőseink, feltéve persze, ha FB-függő zombiként nem lógunk folyamatosan azon a szaron egész nap. Hasonlóan, hiába van nagyon sok, kimondottan értelmes tartalmat terítő oldal a Facebookon, gondosan ki kell válogatni, hogy mik azok, amiknek az összes bejegyzése érdekel, különben ugyancsak követhetetlen lesz az egész.

A Facebook igenis használható értelmesen is, információszerzésre, de ehhez a tudatos beállítás elengedhetetlen, ha nem akarunk lemaradni semmi fontosról, ugyanakkor este belépve ne az egy nap alatt összegyűlt, végeláthatatlan streamet kelljen pásztázni annak reményében, hogy az érdekes tartalmak közt megtaláljuk a legérdekesebbeket.

Aki nem egy kavics alatt töltötte az elmúlt néhány évet, annak nem új, hogy alapértelmezés szerint a falon azoknak az ismerősöknek a posztjai jelennek meg minél előkelőbb helyen, minél több lájk és komment érkezett a poszthoz. Azóta persze ezen sokan finomítottak, az alapelv még mindig ez. Viszont hiba lenne azt hinni, hogy az jelenti az értéket, amire minél többen reflektálnak valamilyen módon. Nem, az adott kört kimondottan érdeklő témáról szóló poszt mellett legalább akkorát lehet menni’ egy egyszerűen befogadható, ámde bugyuta képi poszttal, hűtőmágnes-bölcsességgel, életvezetési tuti tippet sugalló grafikával és hasonlókkal amik a LinkedIN-en is úgy terjednek újabban, mint a lepra. Az érzelmekre ható posztok ütnek a legjobbak, bejósolható, hogy ami valamilyen módon kapcsolódik a politikához vagy kimondottan politikai tartalmú poszt, az alatt várható igencsak nagy aktivitás.

Slágertéma, hogy a Facebook túl kemények akar beleszólni abba, hogy mi kerüljön elénk, fontos tudni, hogy van más lehetőségünk is, mint rejtélyes algoritmusokra bízni annak eldöntését, hogy mi érdekel.  

Kép: VICE

0 Tovább

Nyelvtechnológiával az adathalászat ellen


OpenDNS NLP természetes nyelvfeldolgozás mintázatillesztés adathalászat email scam nyelvtudomány nyelvtechnológiaAmikor kérdezik tőlem, hogy a nyelvtudomány, konkrétabb nyelvtechnológia milyen módon hasznosítható az informatikai biztonság és az igazságügyi informatika területén, az első, ami eszembe jut, hogy milyen módon nem, ugyanakkor nem vagyok egyszerű helyzetben, mivel rendszerint nem ugrik be röviden és informatikusok számára is érthetően summázható, de komoly felhasználási módszer.

OpenDNS NLP természetes nyelvfeldolgozás mintázatillesztés adathalászat email scam nyelvtudomány nyelvtechnológiaEgyszerűek persze vannak: tudtad, hogy egy bizonyos szövegben az írásjelek aránya, a mondatszerkesztés stílusa, többek szerint pedig a leggyakrabban és a legkevésbé gyakran használt 20-20 szó majdhogynem annyira egyedi, mint az ujjlenyomatunk? A nyelvtudomány pedig ötvözve a ma rendelkezésre álló informatikai eszközökkel, egy re elképesztőbb eredményeket érhet el, példaként írom, hogy bő két évvel ezelőtt a Venturebeat írt róla, hogy a bitcoin máig ismeretlen megalkotóját elvben lebuktathatja az általa használt nyelvezet. Ahogy egyre jobb és jobb, mesterséges intelligenciára támaszkodó szemantikai szótárak készülnek, nagyon közel állunk ahhoz, hogy egy plágiumot akkor is ki lehessen szúrni, ha azt valaki az eredeti, webről származó doksit más nyelvből fordította és még át is fogalmazta a szöveget! Az erre alkalmas algoritmusok ugyan nem számítanak kimondottan újnak, a IT-számítási kapacitás most érkezik oda, hogy ezek már a gyakorlatban is bevethetők legyenek ésszerű időráfordítás mellett, anélkül, hogy szuperszámítógépeket kellene bérelni méregdrágán és le kellene tölteni hozzá a fél internetet.  

OpenDNS NLP természetes nyelvfeldolgozás mintázatillesztés adathalászat email scam nyelvtudomány nyelvtechnológiaA mostani poszt apropója egy cikk, ami valahogy csak tegnap jutott el hozzám. Az adathalász emailek és oldalak, amik egy-egy szolgáltatás nevében, annak arculati elemeit felhasználva kérik a felhasználót, hogy adja meg a felhasználói nevét és jelszavát, egyre kifinomultabbak és egyre nagyobb károkat okoznak szerte a világon. Többek szerint a világ legnagyobb bankrablását a Carbanak adathalász kampányon keresztül hajtották végre, ahol a felhasználók emailt kaptak különböző bankok nevében és például arra kérték őket, hogy biztonsági okokból lépjenek be és ellenőrizzék a beállításaikat. Ezt követően egy emailben linkelt adathalász oldalra csalták át őket, a felhasználók többségének pedig nem tűnt fel, hogy a böngésző címsorában lévő cím nem pontosan az a cím, amit akkor szoktak látni, amikor belépnek a megszokott ebanking felületre.

Az adathalász kampányt követően az OpenDNS egyik kutatója, Jeremiah O’Connor elkérte az esetről részletes reportot készítő Kasperskytől szinte az összes elérhető adatot. Mindezt azzal a feltevéssel, hogy szofisztikált adathalász kampány ide vagy oda, valamilyen rendszer vagy közös jellemző csak-csak fellelhető az adathalász levelekben. És talált is több ilyen szabályszerűséget, alapvetően a természetes nyelvfeldolgozás eszközeit bevetve.

O’Connor először egy alapos korpuszt épített a scammer levelek szövegezése alapján, ami kiindulási pont egy nyelv vagy nyelvjárás tanulmányozásakor. Az első dolog, aminek megállapításához nyelvtechnológiára sincs szükség, az adathalász levelek azon közös tulajdonsága, hogy egy adott szolgáltató nevéhez hasonló domainre csalják át az áldozatot, ilyen lehet például a microsoft-update-info[.]com, gmailboxes[.]com és hasonlók. Az egyik dolog, ami O’ Connornak feltűnt, hogy az adathalász domainek nevének formátuma rendszerint úgy épül fel, hogy azok tartalmazzák a megcélzott valódi szolgáltatás nevét ehhez van hozzácsapva valamilyen általános kifejezést, ami elaltatja a felhasználó éberségét, ilyen kifejezés lehet például az "update" egy Windows-frissítésre felszólító, valójában az áldozat gépére malware-t telepítő email esetén. Egy jól ismert név és egy általános kifejezés permutációja persze sokféle lehet, de nem végtelen, a felismert szabály alapján egészen pofás kis szótárat épített fel az OpenDNS kutatója, amit valahogy így kell elképzelni egy kamu Java-frissítésre kihegyezett oldal lehetséges neveit. 

OpenDNS NLP természetes nyelvfeldolgozás mintázatillesztés adathalászat email scam nyelvtudomány nyelvtechnológia

Ezen kívül gyakori még a domainek torzítása hasonló karakterekkel, így például minden további nélkül lehetne regisztrálni az www.0tpbank.hu domain nevet egy adathalász oldal számára. A kutató viszonylag gyorsan tipizálta az adathalász levelekre jellemző nyelvezetet, természetesen nem szorítkozott a domain-nevek elemzésére. A végül elkészült NLPRank-technológia a leveleket egészében értékeli, azaz a gyanus domainekre mutató hivatkozások mellett azt is vizsgálja, hogy egy-egy levél milyen autonóm alhálózatból, ha úgy tetszik, az internet melyik "városából" érkezett. Ha a levél hosszú fejlécében lévő IP-címből az derül ki, hogy olyan AS felől érkezett, amelyik korábban már ontotta az adathalász emaileket, ezt súlyzottan figyelembe vette az algoritmus.

Ezen kívül az adott domainhez tartozó, a domain tulajdonosának adatait tartalmazó WHOIS-rekordban szereplő adatokat vetette össze olyan WHOIS-rekordokkal, amikkel korábban már találkoztak egy biztosan adathalász emailként azonosított domain kapcsán.

Hogy világosabb legyen, hiába regisztrál be egy spambáró mondjuk 100 domaint, a WHOIS-rekord adatai, amik persze maszkoltak, egyezőek vagy nagyon hasonlóak lesznek, ez pedig sok esetben alkalmas arra, hogy ha egy talicska domain ugyanahhoz a szervezethez vagy személyhez tartozik, természetesen akkor is, ha a valódi nevét és elérhetőségeit a WHOIS-rekord nem tartalmazza. A képet az OpenDNS blogjából csentem át, ebben az esetben adathalász oldalak domain-neveinek tömege volt ugyanahhoz a kamu kínai szervezethez beregisztrálva:

OpenDNS NLP természetes nyelvfeldolgozás mintázatillesztés adathalászat email scam nyelvtudomány nyelvtechnológia

Ugyancsak az algoritmus lelkét adja, a domainek hasonlóságának, jelen esetben csaló voltának megsaccolásához kidolgozott módszer. Tekintsük a domain-nevet egy egyszerű sztringnek, azaz szövegnek. Ahogy írtam, az adathalász oldalak címe sokszor csak néhány betűnyi eltérést mutat a legitim szolgáltatás címéhez képest. Mégis, hogyan automatizálható a gyanus domain-nevek szűrése, azaz mikor mondható, hogy alapos rá a gyanú, hogy adathalász oldalról van szó a domain-név alapján? A scammer domain nevek általános sajátosságát figyelembe véve egy domain akkor gyanus, az a leggyakoribb, ha egy jól ismerthez képest két karakterben különbözik. Így például a googlemail.com és a nullásokkal írt g00glemail.com domain név közti különbség éppen két karakternyi, ami pedig nagyon fontos, hogy a szóban forgó lecserélt karakterek egymás közvetlen közelében vannak. Ezen kívül az okos algoritmus, hála a jól felépített szótárnak, azzal is tisztában van, hogy a o-betű nullával való helyettesítése, az l-betű egyes számjeggyel való helyettesítése és hasonlók az adathalász levelekre jellemző sajátosságok.

 

Ami miatt fontos a felhasználók biztonsága érdekében, hogy automatizáltan felismerhetőek legyenek a gyanus domain nevek, egy igencsak gyakorlati dolog: az OpenDNS névfeloldó szervereire a 60 millió felhasználótól naponta átlagosan 60 milliárdnyi DNS-kérés érkezett már 2015-ben, ha pedig az OpenDNS a névfeloldás szintjén felismeri a veszélyes domain-neveket, időben tudja figyelmeztetni a felhasználót, ha már rákattintott, de akár feketelistára is teheti az adott domain nevet.

OpenDNS NLP természetes nyelvfeldolgozás mintázatillesztés adathalászat email scam nyelvtudomány nyelvtechnológiaA kimondottan apró eltéréseket és azok közti távolságot is figyelembe vevő algoritmusok ismerősek lehetnek a bioinformatika területéről, ahol egy-egy, kóros szövetből származó DNS vagy RNS részletének szekvenciáját kell meghatározni, az eltérés pedig egy-egy "betűnyi", azaz nukleotidnyi, egyszeresen vagy többszörösen, egymástól bizonyos távolságban. Ezek az ún. SNP-k nagyon sok esetben semmilyen életfunkcióban nem okoznak változást, megint más esetben súlyos betegségeket alakít ki egy-egy nukleotidnyi eltérés.

A néhol erős egyszerűsítések miatt elnézést kérek! Ahogy korábban is emlegettem, egy olyan korba csöppentünk, ahol minden korábbinál nagyobb szerepet kap az, hogy a kutató, fejlesztő rendelkezzen multidiszciplináris ismeretekkel és ezeket be is vesse, ha kell. Ezért vallom, hogy az egyetemeken, mi több, ahol lehetséges, már középiskolában meg kellene mutatni a tanulóknak, hogy mivel foglalkozik egy-egy cégnél a matematikus, a fizikus, a vegyész, a biológus, a nyelvész, a közgazdász vagy éppen az informatikus. Ugyanis sajnos ha ez elmarad és az egyik szakma képviselőit tömegesen neveli ki úgy a felsőoktatás, hogy még csak egy szemléletes képük sincs arról, hogy más szakmák képviselői mivel foglalkoznak, az nem csak azzal jár, hogy komolyabb helyeken bunkónak nézik őket. A súlyosabb hatás, hogy még csak az esély sem adatik meg nekik, hogy felkeltse az érdeklődésüket valami számukra egészen új dolog [ahogy az én érdeklődésemet felkeltette a nyelvtudomány olyan 24 éves koromban] illetve nem lesznek képesek olyan komplex problémák megoldására, amik az emlegetett multidiszciplináris tudást és holisztikus szemléletet igényelne.

Képek: wordstodeeds.com, komando.com, OpenDNS blog

0 Tovább

Bepillantás az iPhone antenna lelki világába


Egy régi, ámde hasznos rejtett trükkel megállapítható, hogy az iPhone-unk mennyi alkalommal váltott cellát a bekapcsolása óta, egyáltalán, mennyi torony látja éppen a mobilunkat, mi több, a térerőt megjeleníthetjük számszerűsítve is. Ezen kívül még számos adat lekérdezhető a különböző mobiltornyokról a műértők számára.

Úgy fest, hogy a lehetőséggel még egy magyar nyelvű oldal sem foglalkozott: egyszerűen a tárcsázásnál be kell ütni a *3001#12345#* kódot, majd megnyomni a hívásindítás gombot. Ezt követően egy menüt kapunk több almenüvel, a telefont ténylegesen kiszolgáló torony paramétereit pedig a GSM Cell Environment menüből érhetjük el. Ezen kívül a megszokott, térerőt jelző gombok helyén egy negatív szám jelenik meg, ami minél közelebb esik a 0-hoz, annál erősebb térerőt jelöl.

Sőt, ha a diagnosztikai menüben lenyomja tartjuk a kikapcsológombot, közben pedig lenyomjuk egy másodpercre a home gombot, a diagnosztikai alkalmazásból kilépést követően is számadattal jeleníti meg a mobil a térerőt.  

iOS Apple iPhone térerő

 

iOS Apple iPhone térerő

iOS Apple iPhone térerő

0 Tovább

Gépi arcfelismerés: arc nélkül


Avagy rövidhír délutánra.

gépi tanulás neurális hálózatok Max Plack Institute Faceless Recognition System privacy arcfelismerés mintaillesztés

Korábban már többször utaltam rá itt a blogon, hogy a Facebook még akkor is be tud azonosítani egy felhasználót, ha csak valamilyen testrésze látszódik, az arca egyáltalán nem, ráadásul – amire nem emlékeztem pontosan – majdnem 90%-os pontossággal. A keresési lehetőség persze nem lesz elérhető a Facebook mezei felhasználói és az alkalmazásfejlesztők számára sem, jól mutatja, hogy éppenséggel lehet szemérmeskedni a mai világban, csak éppenséggel teljesen értelmetlen.

A Sophos szakmai blogja éppen most számolt be róla, hogy többek közt a Max Plack Intézet kutatói tovább finomították azokat a gépi tanuláson, főleg neurális hálózatokon alapuló módszereket, amik mindezt egyre nagyobb pontossággal lehetővé teszik például térfigyelő kamerák által készített képek alapján is.

Amit a cikkben nem írnak, de érdemes tudni, hogy különböző egyéneknek már a mozgása is eléggé egyedi ahhoz, hogy maholnap megfelelő számítási kapacitás, és persze kellően nagy adattárház rendelkezésre állása esetén videófelvétel alapján is azonosítható legyen bárki például a járása alapján, ha nagyon azonosítani akarják.

A cikk szerint nem csak a kép alapján történő azonosításnál nem csak olyan dolgok lehetnek árulkodóak, mint egy bizonyos mintát tartalmazó póló, a napszemüveg alakja, hanem olyan, képből kinyerhető adatok is, mint az adott személyről készült fotók fényviszonyainak jellemzői. Ma már az is mindegy, hogy egy fotót mennyiszer vasaltak ki Photoshoppal, ugyanis egyrészt vagy ugyanaz a személy vagy nagyon hasonló módon effektezi a képeit vagy az effekt ellenére felismertethető eléggé erős géppel.

A Facebook egy évvel ezelőtti cikke az arcot nem igénylő személyfelismerésről a New Scientist-en erre az MPI igencsak erősre sikerült Faceless Recognition System cikke a műértők számára erre érhető el.

Kép: Sophos

1 Tovább