Bejelentkezés
Felhasználónév:

Jelszó:

Szavazás
Eseménynaptár

Gyakran hibáznak a keresőmotorok

2012. március 19. 08:44
Lényegében minden keresőmotor néhány nagyobb weboldaltól indul el, azután megpróbálnak új honlapokat találni, főként a létező weboldalak kapcsolódásai révén. Egy viszonylag új honlapról a Google sem fog tudni.

Emellett számos weboldalt hoznak létre a tartalommenedzsment-rendszerek is, méghozzá különböző változatokban, igazodva ahhoz, amikor éppen egy adott felhasználó látogatja meg az oldalt. Ezek a dinamikusan létrejövő oldalak számos, a felhasználók által módosítható web 2.0-ás elemet is tartalmaznak. Vagyis például a Facebookon keletkező bejegyzések követéséhez a keresőmotoroknak gyakorlatilag szinkronban kellene üzemelniük a világ valamennyi számítógépével.
 
Voltaképpen a személyes népszerűség mérésének kézenfekvő módja lehet, hogy valaki begépeli a saját nevét egy keresőbe: a kapott találatok száma sok mindenről árulkodhat. A BBC újságírója azonban inkább egy közismert embert választott, próbaképpen Tim Harford - közgazdász, a The Financial Times újságírója, a Világbank tanácsadója, a BBC More or Less című műsorának vezetője, akinek magyarul A leleplezett gazdaság címmel jelent meg kötete - nevét írta a Google-be, és 835 000 találatot könyvelhetett el. Illetve 325 000-et. Vagy 285 000-et. Az eltérő eredményekért elég volt pár métert megtennie a szomszédos számítógépekig a BBC szerkesztőségi irodájában.
 
Hogy mi az oka ennek a hatalmas eltérésnek? Viszonylag egyszerű a magyarázat: a keresőmotor pontossága - a kiadott eredmények száma - alapvetően attól függ, hogy milyen számítógépről indítják a keresést, és azon milyen Google-verzió fut. A Google-nak egy időben több tükörszerveren is üzemel egy-egy példánya, és a találatok száma azon is múlik, hogy ezek közül éppen melyik a legkevésbé leterhelt.
 
Két gyakori keresztnév: 68 millió találat
 
Az eredmények ráadásul perszonalizáltak: igazodnak a korábban indított keresésekhez és a keresést indító személy földrajzi elhelyezkedéséhez is.
 
A BBC cikkét jegyző Ruth Alexander még egy meghökkentő adattal szolgált: amikor a saját nevére keresett rá, 68 millió (!) találatot könyvelhetett el. Pedig nem írt könyveket, filmekben sem játszott főszerepet, és nagyon sokan valószínűleg sohasem hallottak róla. Annak, hogy mégis ilyen webes "hatalmassággá", a keresőmotorok kedvencévé vált, meglehetősen prózai oka van: neve két népszerű keresztnévből tevődik össze.
 
A keresők adta eredmények tehát félrevezetőek lehetnek, és a találatok száma mit sem jelent, ha valaki nem gépeli be az aposztrof (') jeleket a keresett név vagy kifejezés elejére és végére, vagy ha túlzottan tág értelmű fogalmakat használ. Vagyis: ostoba kérdésre csak ostoba válasz születhet.
 
Ahány találat, annyi oldal?
 
Ráadásul egy Google-bajnokhoz méltó módon, mérnöki pontossággal megfogalmazott keresőkérdés esetén sem szabad vakon elfogadni a találatok számát. Azt hihetnénk ugyanis, hogy amikor 68 millió találatot jelez a Google számlálója, akkor elvileg 68 millió olyan oldal létezik, amelyeken megtalálható a beírt kifejezés. De szó sincs róla.
 
Egy tanulmány készítői három keresőmotor eredményeit vetették össze, mégpedig olyan kérdések alapján, amelyek 1000-nél kevesebb találatot eredményeztek. Megállapították, hogy még a legjobban teljesítő keresőmotor is hajlamos arra, hogy csak úgy összecsapja a számításokat, és a három közül egyik sem szolgált egzakt információval arról, hogy valójában hány dokumentum szerepel a találatok között - megelégedtek az egyszerű becsléssel.
 
A kutatók azt tapasztalták, hogy a számok akkor még elég pontosak voltak, amikor egyetlen szó alapján kellett keresni, de valahányszor hozzáadtak egy új szót a kereséshez, annál pontatlanabbá váltak a mennyiségi adatok.
 
"Nyolcvan százaléknyi időt használva fel a becslések megbízhatóan alakultak, csupán 10 százalék volt a hibák aránya - meséli Ahmet Uyar, a törökországi Mersin Egyetem számítástechnikai részlegének vezetője. - Viszont ha kétszavas kérdéseket tettünk fel, a találatok pontossága majdnem a felére csökkent."
 
 
A cikk teljes terjedelmében a mediainfo.hu oldalon olvasható
 

Innomedia.hu
Hozzászólások