Potentialul Motoarelor de Cautare
Potentialul motoarelor de cautare
Sub simplitatea rezultatele cautarilor pe internet se ascunde un potential enorm, cel care controleaza motorul de cautare major controland practic internetul. Diferenta intre a fi pe pozitia 10 (prima pagina) si 11 (a doua pagina) la o cautare relevanta pentru un domeniu se poate masura in milioane de dolari, foarte multe firme investind masiv intr-o buna imagine si expunere pe web prin folosirea instrumentelor puse la dispozitie de Google precum AdWords si AdSense. Acestea sunt publicitate contextuala
in functie de cuvintele cheie folosite si intervin odata cu aparitia rezultatelor si sunt legate direct de aceastea, in acest fel publicitatea fiind intrinsec legata de motorul de cautare. Platesti sa fii in rezultate, vezi rezultatele platite la cautare sau la accesarea siteurilor.
Traficul oricarui website este direct afectat de pozitia acestuia in motorul de cautare cel mai des accesat. O mare parte din vizitatorii unei publicatii media ajung prin intermediul motoarelor de cautare, acestia optimizandu – si paginile pentru o mai buna expunere. Vizitatorii au ajuns sa tipareasca in Google numele site-ului pe care doresc sa ajunga, in loc sa il acceseze direct. Multe firme care se bazau exclusiv pe internet au dat faliment cand Google si-a restructurat algoritmii si a schimbat pozitia
rezultatelor. Mai mult, Google inregistreaza cautarile efectuate si o multitudine de date despre utilizatori, prin referinte incrucisate cu alte website-uri precum youtube.com sau gmail.com al caror posesor este, cunoscand in acest mod tendintele si necesitatile inaintea tuturor, facand profilul fiecarui vizitator si avand o imagine exacta a internetului.
Este suficient sa ne uitam la statisticile puse la dispozitie prin instrumente precum Google Analytics sau chiar statisticile YouTube, pentru a realiza ca sunt suficiente informatii pentru a face profilul complet al unui utilizator de internet, incluzand datele personale, pozele sale, ce a cautat in ultimile luni, ce preferinte si preocupari are, ce filme a vazut, ce
site-uri a vizitat, ce comentarii a postat, ce prieteni are si poate chiar si ce corespondenta a avut. Sa nu uitam ca majoritatea site-urilor isi inglobeaza in paginile sale scripturile "Analytics", acestea executandu-se pe serverele Google, codul HTML fiind intors de acestia.
Este greu de spus cum va arata viitorul, insa odata cu cresterea rapida a informatiei si crearea continua de continut de catre vizitatori, prin intermediul blogurilor, comentariilor, paginilor personale etc filtrarea acestor date va fi tot mai dificilasi probabil se va apela tot mai des la factorul uman.
In afara de acestea este posibil sa ne intalnim cu o specializare a motoarelor de cautare, astfel incat vizitatorii probabil vor migra catre motoarele de cautare locale sau subnivele de cautare pe anumite domenii. De exemplu ca utilizator, in loc sa caut pe Google cazare intr-o anumita statiune, unde se vor intoarce haotic prea multe rezultate nerelevante, s-ar putea sa prefer sa caut pe un portal de turism acelasi lucru, unde pot ordona dupa data sau relevanta. Sau s-ar putea sa vreau sa caut rezultate numai in paginile ziarelor romanesti, ignorand blogurile sau alte pagini neinteresante sau realizate de amatori.
Incepand cu anul 2008, in urma lansarii motorului de cautare Cuil care pretindea ca are cele mai multe pagini indexate, Google si-a revizuit algoritmul si a negociat o parte din relevanta pentru un volum mai mare de pagini indexate. Asa cum s-a vazut, tentativa de a indexa toate paginile din
internet are un cost destul de mare, fermele de servere ajungand la sute de mii de calculatoare.
In incercarea Google de a-si mentine monopolul, sau in cea a Microsoft de a-l dobandi, cele doua companii vor cumpara fara ezitare firme mici care au ceva de oferit sau vin cu o imbunatatire sau o inovatie. Chiar si o cota de piata locala de 1% ar fi suficient pentru a trezi interesul acestora, problema este ca cei 1% sunt extrem de greu de realizat mai ales daca nu ai ceva de oferit, si in special relevanta-unitatea de masura a calitatii unui motor de cautare. Informatie de filtrat va exista mereu, si mai mult decat atat, aceasta se acumuleaza continuu, generand noi probleme si necesitand noi solutii.
Istoric
Elemente de teoria informatiei si data mining se regasesc inca din anii '50 dar adevarata preocupare pentru motoarele de cautare a inceput odata cu aparitia web-ului la inceputul anilor '90. Primele programe de regasire a informatiei isi indeplineau partial rolul, avand in vedere ca seturile de date la vremea respectiva erau incomparabil mai mici fata de cele de astazi. Acestea au fost urmate curand de motoare de cautare semantice, dedicate web-ului, unele disparute astazi, cum ar fi Magellan, Excite, Infoseek, Inktomi, AltaVista sau Yahoo.
In anul 2000, doi studenti ai facultatii de matematica ai universitatii americane Stanford, avand o abordare exacta si comprehensiva, pun bazele motorului de cautare Google. Acesta s-a dovedit imediat superior celor existente pe piata, in principal datorita relevantei si performantelor sale in termeni de viteza. De atunci acesta si-a continuat evolutia ascendenta ajungand astazi compania care practic domina internetul.
Este de mentionat evolutia la vremea respectiva a celorlalti doi mari jucatori pe piata actuala a motoarelor de cautare. In anul 2003, Yahoo realizeaza diferenta enorma de relevanta fata de motorul Google si inlocuieste motorul propriu cu cel al Google pe portalul sau (care la vremea respectiva era cea mai accesata pagina din lume) toate cautarile bazandu-se pe algoritmii acestuia din urma. Realizand ca pot domina foarte usor piata singuri, datorita produsului lor practic fara concurenta, in 2004 cei de la Google nu mai accepta aranjamentul cu Yahoo iar acestia revin la motorul propriu pe care continua sa il dezvolte si in prezent.
In tot acest timp Microsoft pierde teren si nu realizeaza importanta si potentialul din spatele motoarelor de cautare. Chiar daca portalul MSN avea motorul propriu inca din 1998, divizia de "Text mining & Search" a Microsoft este relativ mica si nu atentioneaza asupra cresterii vertiginoase a Google. Fiind deja in urma Yahoo ca cota de piata, ei ajung in acest moment pe locul trei, cu o cifra in jurul a 7% din cautarile de pe internet. Trezirea brusca in 2005 ii face sa accelereze lucrurile intern, incercand un rebrand al motorului propriu de cautare sub denumirea de Live Search. Relevanta acestuia este la fel de slaba ca inainte, succesul in termeni de cota de piata fiind practic nul.
In acest moment Microsoft intra in panica si incepe sa cumpere orice firma de pe piata care ofera algoritmi de cautare, pentru sume considerabile. In 2009 incearca iarasi o ofensiva si lanseaza Bing, avand un succes partial datorita relevantei un pic crescute insa inca departe de cea a Google, nici macar ca cea a Yahoo.
Lucrurile se complica si mai mult, Steve Balmer preia conducerea dupa plecare lui Bill Gates si decide sa cumpere Yahoo pentru a "castiga" internetul prin forta bruta. Suma oferita la inceputul crizei este de 45 de miliarde de dolari, la scurt timp dupa aceea actiunile se prabusesc, CEO Yahoo isi da demisia iar noua ofertaeste considerabil mai mica, in jurul sumei de 17 miliarde de dolari.
Printre termenii contractului se regasesc specificatii exacte cu privire la motorul de cautare, sursele acestuia urmand sa fie puse la dispozitia Microsoft. In timpul scurs de dupa anularea aranjamentului cu Google, Yahoo si-a perfectionat algoritmii si invatand de la motorul de cautare pe care l-au folosit timp de un an, au reusit sa-si creasca relevanta proprie, ajungand aproximativ la 60% din cea a Google. In acest fel, prin preluarea algoritmilor Yahoo, Microsoft spera sa castige teren in incercarea de a ajunge din urma Google. Cota de piata este in acest moment aproximativ 70% Google, 18% Yahoo, 12% Bing, in multe tari precum si in Romania Google avand peste 95%.
Exista aici un capitol intreg referitor la dezvoltarea regionala a motoarelor de cautare. In timp ce Google ofera domeniul "google.ro" si cautari bazate pe semantica limbii romane de cativa ani, Yahoo va implementa acest sistem abia catre sfarsitul anului 2010, iar Microsoft nu a anuntat incao asemnea initiativa. Datorita alfabetului particular si grafiei, Google nu a putut penetra rapid in tari precum Rusia sau China, care au apucat sa-si dezvolte propriile motoare de cautare, Yandex respectiv Baidu.
Tentativele de a intra pe piata celor doua tari sunt foarte agresive in prezent, ducand de exemplu la numeroase conflicte cu guvernul chinez sau la limitari legale impuse de guvernul de la Moscova.
Bazandu-se pe relevanta lor superioara, este posibil ca pe viitor, odata intrati pe piata sa o si castige.
Au mai fost de asemenea incercari fara succes ale Germaniei si Frantei de a crea un motor de cautare european, cunoscut sub numele de Quaero (initial proiectul Theseus) dar de aceste proiecte incepute prin 2005-2006 nu s-a mai auzit nimic, fiind cel mai probabil esecuri. Circula zvonuri si despre un motor de cautare global pregatit de guvernul rus, avand in spate resurse financiare puternice, rusii neimpacandu-se cu dominatia globala a Google.
Google si Microsoft au creat de asemenea motoare de cautare locale, fara plata, care pot fi descarcate de pe internet si folosite, avand si o interfata de programare. (Aceste tooluri nu includ bineinteles algoritmii de cautare folositi in motorul de web, datorita protectiei impotriva piratarii si
ingineriei inverse(reverse engineering). Sunt create insa pentru a descuraja aparitia altor motoare de cautare, care ar putea face ulterior concurenta.
Istoric romanesc
Anticipand evolutia pietei, Google a pus la dispozitia utilizatorilor un set de instrumente prin care aparent oricine isi poate crea un motor de cautare. De fapt este un fel de agregator al "engine"-ului Google pentru a afisa seturi de rezultate, fara a putea controla publicitatea dar permitandu-se
redenumirea acestuia. Au aparut in acest fel un numar de pseudo-motoare de cautare, care practic ofera cautarea Google sub un alt nume. Acestea nu pot indexa seturi particulare de date atat timp cat ele nu sun indexate deja de motorul Google. In acest fel, sub pretextul unui instrument util si usor de folosit, se descurajeaza crearea unor algoritmi particulari care ar putea ameninta vreodata pozitia Google pe piata.
Exista deja cateva asemenea website-uri romanesti care ofera asemena cautari dar care nu sunt luate in considerare de vizitatori. In afara acestora, au mai fost cateva tentative dar foarte departe de a oferi relevanta ridicata sau o abordare profesionista, cele mai multe discutii de pe forumul de mai sus fiind relevante.
In afara de acestea, oricine poate restrange cautarea Google la un singur website prin asa numitul Google Site Search, astfel incat rezultatele sunt limitate la paginile din site. In acest fel se face inutila utilizarea altor motoare da cautare pentru un website, avand in vedere ca Site-Search-ul furnizeaza rezultate relevante.
In anul 2006, Adrian Sirbu patronul MediaPro, ii cere lui Orlando Nicoara, directorul diviziei de internet, crearea unui motor de cautare romanesc. Proiectul demareaza si dupa doi ani, beneficiind de resurse destul de consistente, 6-7 programatori alocati, largime de banda, servere, logistica etc, se lanseaza Okidoki.
Lansarea si primirea acestuia pe piata au fost un esec, in primul rand relevanta acestuia fiind extrem de mica iar in al doilea rand vizitatorii romani nefiind dispusi sa renunte la motorul favorit, Google. O a doua tentativa de lansare, jumatate de an mai tarziu, a avut acelasi deznodamant.
In plus, siteurile trustului precum "stirileprotv.ro" sau "protv.ro" etc. sunt vizibil favorizate de okidoki.ro, fapt pe care creatorii Google l-au evitat de la bun inceput, ramanand fideli neutralitatii.
Intre timp Okidoki este prezent pe toate site-urile Mediapro cu toate ca aceeasi cautare se putea realiza si cu Google Site Search. Acesta este si motivul pentru care nu s-au extins la alte website-uri in afara trustului, insa
probabil vor face si asta mai devreme sau mai tarziu.
Proiectul continua si nu cu mult timp in urma s-a realizat un contract cu Romtelecom pentru personalizarea paginii de eroare DNS cu ajutorul Okidoki, perceputa insa negativ de catre utilizatori. In prezent probabil ca Okidoki este foarte putin folosit de publicul larg, relevanta lui fiind la nivelul motoarelor de cautare ale caror surse se gasesc pe internet, insa personalizarea acestuia pe limba romana, prezenta pe siteurile Mediapro si resursele trustului din spate ii pot asigura un oarecare viitor.
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Potentialul Motoarelor de Cautare (ID: 150140)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
