Aportul Surselor Deschise In Intelligence

Aportul surselor deschise în Intelligence

Cuprins

Locul și rolul surselor deschise în totalitatea surselor de intelligence

Istoria apariției domeniului și starea actuală.

Categorii ale surselor deschise

Corelarea cu alte surse de intelligence

Domeniul aplicativ al OSINT

Ciclu de intelligence al surselor deschise

Metode de colectare a informației din Internet

Factori care influențează asupra procesului de utilizare a surselor deschise în intelligence

Tipuri de produse OSINT

Deep Web – domeniul necunoscut al surselor deschise

Deep Web prin prisma funcției strategice ale OSINT. Web-ul de suprăfață vs. Deep Web (3.2)

Ce ascunde Deep Web și cum poate fi exploatat (3.1)

Contradicții în existența Deep Web-ului pentru comunitatea de intelligence

Locul și rolul surselor deschise în totalitatea surselor de intelligence.

Istoria apariției domeniului și starea actuală.

Dezvoltarea tehnologiilor hardware/software în domeniul calculatoarelor și perfecționarea sistemelor de telecomunicații a permis crearea unei baze tehnice pentru răspîndirea informațiilor pe o scară globală. Volumul informațiilor apărute au determinat schimbări fundamentale în procesul luării decizilor de către conducerea politico-militară a statelor lumii și în activitatea serviciilor de informații, care joacă un rol cheie în furnizarea de informații către decidenți.

În fața serviciilor de informații s-au deschis perspective unice: pe de o parte – dezvoltarea rețelei Internet la nivel mondial, disponibilitatea și operativitatea livrării informațiilor, publicate deschis sau comercializate, răspîndirea rețelelor de radiodifuzare digitală, disponibilitatea informațiilor geospațiale; pe de altă parte – posibilitatea de a forma sisteme instituționale protejate, destinate operațiunilor de obținere, prelucrare, stocare și răspîndire a informațiilor exploratorie, atât în cadrul unui serviciul, cît și în cadrul schimbul interdepartamental.

Primul proiect, care de fapt a și lansat conceptul de intelligence și care, de la început, a vizat integrarea surselor deschise cu intelligence-ul, este un proiect al lui Sherman Kent. Acesta este plasat în timp în jurul anului 1935, când Kent a fost practic cooptat de la una din universitățile americane unde preda, pentru a pune la punct o agenție națională de informații. În cadrul acestui proiect, Sherman Kent a dezvoltat un proces care a inițiat consecințe, evoluții sociale, politice și nu numai, care conceptual au început să fie un fel de reper al evoluțiilor actuale pe sursele deschise. Prima idee care este prezentă la Sherman Kent este că intelligence-ul trebuie regândit drept domeniu academic pentru dobândirea avantajului strategic. Dacă luăm, de exemplu, lucrarea lui care a apărut public în 1949, vom vedea că paradigma sa este „Knowledge is Power”. Pe scurt, această carte a fost de fapt o comandă făcută de liderii americani, pîna la 1945, înainte de finalizarea celui de-al doilea război mondial, în care au fost solicitate condițiile pe care trebuie să le îndeplinească orientarea societății americane pentru a deveni un actor global. Al doilea punct cheie promovat de Kent a fost problema integrării valorilor democratice cu noul domeniu academic, securizarea libertății civice în cadrul democrației. Al treilea punct a fost diferențierea dimensiunilor: tehnologică și socială (scanarea specifică a informației). Următorul punct a introdus ideea gândirii strategice și a distincției dintre gândirea strategică și proiecțiile provenite din paradigmele primare filomatematice ale filosofiei naturale gen „non-range planning”, „forecasting” și așa mai departe. Și ultimul punct susținut de Kent a fost antrenarea opiniei publice în procesul de analiză a surse deschise, adică înlocuirea propagandei cu dezbaterea.

În aceeași perioadă, tot în Statele Unite, Wanewar Bush a condus Centrul Integrat de Cercetare din timpul celui de-al doilea război mondial. Wanewar Bush este omul care, poate, ne-a influențat cel mai mult conceptul de mass-media și de sursă deschisă. În primul rând, el a pornit de la o concepție conform căreia procesul de intelligence propriu serviciilor de informații nu diferă conceptual cu absolut nimic de procesul studiului problemelor deschise din mediul concurențial din cercetare. Wanewar Bush a lansat în 1952 conceptul de Memex. El a imaginat și a descris într-o lucrare publică un birou virtual necesar cunoașterii prin rețelele sociale care să fie dedicat cunoașterii integrate, intelligence. Pentru că la vremea respectivă nu avea posibilitatea de a transmite documente între aceste birouri virtuale, el a definit un proiect care formează baza tehnologică de realizare a precedentului, Proiect Memex. Aici e bine de spus că Wanewar Bush, deținând o poziție în cadrul administrației americane, a putut coopta în proiectul său un cercetător britanic numit Stanley Clark, cel care în 1972 a lansat un satelit de telecomunicații. Clark a oferit baza tehnologică de realizare a primei rețele efective de tip Internet, Darpa, inclusă în proiectul Memex.

În anii '70, un cercetător european de origine iugoslavă a reușit să implementeze primul sistem național de intelligence pe surse deschise într-o țară europeană (în Suedia), denumit Swedish Intelligence Network BISNES (Business Intelligence & Security Network of Sweden). Stevan Dedijer a identificat atunci o paradigmă de integrare a spațiului euro-atlantic, în care intelligence-ul să devină integrat domeniului academic.

Într-un articol din 1984, Dedijer folosește o formulare mai jurnalistică, afirmând că Europa, fie face „business intelligence”, fie nu va exista. În același timp, cercetătorul a lansat conceptul de „analytic intelligence”, care viza legătura cu modelele matematice, necesare transdisciplinării „intelligence”-ului, ca domeniu academic. De asemenea, și în abordările lui Wanewar Bush, partea de modelare matematică este centrală procesului de intelligence. Statele care n-au fost în stare sau n-au putut să vadă în acest mod lucrurile, au rămas în urmă.

De la începutul anilor '90 ai secolului trecut, în comunitatea de informații din SUA se naște o nouă disciplină de informații – OSINT , sau " Intelligence bazat pe surse deschise de informații". Anterior, informația accesibilă în mod public a fost doar un tip de informații utilizat de servicii de intelligence.

În anii ’90, David Steel, care a fost ofițer de informații în Marina Americană, a pornit un proiect împreună cu studenți din câteva universități, proiectul „open-source intelligence”. El identifică o paradigmă pe care o numește „smart nation” („națiune isteață”) și care are în vedere dobândirea avantajului competitiv prin identitate, valori, potențial de inovare socială și integrarea intelligence. El a lansat și prima rețea globală „open-source intelligence”, orientarea actuală a grupului cu care lucrează este către identificarea titlurilor de tip rețea drept modele adaptative ale procesului intelligence concurențial, bineînțeles, și în business-intelligence, și în intelligence de tip clasic.

Prima menționare despre necesitatea dezvoltării unui sistem de informații bazat pe surse deschise poate fi considerată audierea Senatului Statelor Unite în anul 1992, cînd a fost propusă crearea unei direcții abilitate în domeniul surselor deschise de informații. Realizarea practică a acestui proiect se începe în anul 1994, cînd a fost fondată COSPO.

În 1995 instituția respectivă emite documentul de bază – "Planul Strategic al comunității de intelligence din SUA în privința utilizării surselor deschise de informații", care a pus bazele conceptuale ale domeniului OSINT, inclusiv și politica de obținere a informațiilor, transferul lor în rețelele închise și utilizarea comună a informațiilor deținute de către membrii comunității de intelligence. De asemenea, instituția a creat o rețea virtuală neclasificată a comunității pentru prelucrarea informațiilor parvenite din surse deschise (Intelink-U).

În 1996, o comisie specială a Congresului pentru evaluarea rolului și capacităților comunității de intelligence (Comisia Aspin – Brown) a criticat Agenția Centrală de Informații pentru lucru insuficient de intens cu surse deschise. În 2004, Comisia Prezidențială "9/11" a propus ca să fie creat un organ independent de intelligence în domeniul OSINT și, astfel, în 2005 a fost fondat Centru de analiză a informațiilor din surse deschise – DNI OSC, care era în subordinea directorului comunității de intelligence (DNI).

În 2004, în Legea privind reforma intelligence-ului și prevenirea terorismului a apărut conceptul normativ de open-source intelligence (utilizat anterior numai în publicații științifice, concluziile comisiilor, la audierile din Congres și Senat) .

Astfel, perioada anilor 1994-2004 poate fi considerată drept una de formare conceptuală a OSINT, de acumulare a experienței de lucru inter- și intra-departamentale, de creare a primelor prototipuri de programe, mijloace tehnice și resurse informaționale.

După anii 2004-2005, Statele Unite ale Americii încep dezvoltarea sistemică de ansamblu a disciplinei noi de intelligence, care include un șir de direcții: elaborarea documentației normative și metodice, crearea structurilor organizatorice, organelor interdepartamentale responsabile de asigurarea cooperării între serviciile implicate în OSINT, organizarea cercetării științifice, planificarea politicii bugetare, dezvoltarea software și hardware, recrutarea și formarea specialiștilor.

Structura documentației normative și conceptuale în vigoare a comunității de intelligence din SUA în domeniul OSINT.

Legislația

Public Law 108-458 (IRTPA)

Președinte SUA

EO 12333

Ministerul Apărării

ICD 301 ICD 501

Director al comunității de intelligence

DoDD 5240.I-R DoD Instruction 3115.12

DoDD 5240.06 DoD Instruction 8550.01

DoDD 5105.21

JP 2-0

Documentul principal care formează baza normativă a OSINT este directiva ICD 301- „Planul național al activității de intelligence pe baza surselor deschise de informații”, care determină următoarele sarcini strategice ale OSINT:

principiul „primului pas” – OSINT trebuie să fie un prim pas pentru toate disciplinele de intelligence și să preceadă activității de informații cu ajutorul surselor umane și tehnice;

pilonul sunt grupuri de experți special pregătiți în domeniul OSINT, studierea metodelor de dobîndire a informațiilor deschise și implementarea tehnologiilor OSINT în toate procesele activității de intelligence;

cuprindere globală a surselor de informații;

arhitectura unică a mijloacelor, formelor și metodelor OSINT;

utilizarea principiului „skunkworks” – implementarea metodelor inovaționale, înalt intelectuale de dobîndire a informației pentru soluționarea unor probleme aparte, în condiția existenței unui nivel minim de restricții și tărăgănări birocratice.

Directiva stabilește politica de gestionare a procesului OSINT în comunitatea de intelligence, delimitează responsabilitatea funcționarilor, determină structura organizatorică necesară și modul de interacțiune a organizațiilor și departamentelor comunității de intelligence a SUA.

În baza directivei ICD 301 componentele comunității de intelligence au elaborat ordinile proprii în domeniul surselor deschise.

De asemenea, au fost dezvoltate și puse în aplicare instrucțiunile la nivel executiv, care stabilesc tehnici și metode de activitate în domeniul OSINT pentru unitățile armatei.

Structura organizatorică OSINT a comunității de intelligence a SUA.

În conformitate cu Legea privind reforma intelligence-ului și prevenirea terorismului din 2004, managementul general și coordonarea activităților OSINT sunt atribuite directorului comunității de intelligence. Măsurile practice desfășoară consilierul directorului adjunct al comunității de intelligence pe surse deschise (ADDNI/OS). El conduce, de asemenea, și Centrul de analiză a informațiilor din surse deschise. Centralizarea conducerii la nivel de cooperare interdepartamentală se rea fost dezvoltate și puse în aplicare instrucțiunile la nivel executiv, care stabilesc tehnici și metode de activitate în domeniul OSINT pentru unitățile armatei.

Structura organizatorică OSINT a comunității de intelligence a SUA.

În conformitate cu Legea privind reforma intelligence-ului și prevenirea terorismului din 2004, managementul general și coordonarea activităților OSINT sunt atribuite directorului comunității de intelligence. Măsurile practice desfășoară consilierul directorului adjunct al comunității de intelligence pe surse deschise (ADDNI/OS). El conduce, de asemenea, și Centrul de analiză a informațiilor din surse deschise. Centralizarea conducerii la nivel de cooperare interdepartamentală se realizează prin persoanele responsabile de tehnologii informaționale (ADDNI/CIO), numiți în fiecare departament. Organ executiv care asigură implementarea conceptului OSINT în comunitatea americană de intelligence este Centrul de analiză a informațiilor din surse deschise (DNI OSC).

Activitatea departamentelor comunității de informații este coordonată de către Comitetul național pe surse deschise (NOSC), care include reprezentanți din: conducerea Centrului de analiză a informațiilor din surse deschise, aparatul ministrului adjunct al apărării pe activitatea de intelligence, Departamentul de Securitate Internă, ​​CIA, NSA, FBI, Agenția Națională de Informații Geospațiale, Biroul de Informații și Cercetare al Departamentului de Stat, Agenția de informații al Ministerului Apărării (MA), precum și din alte organizații și agenții.

Componenta comunicațională a OSINT în cadrul MA al SUA asigură rețele de transmitere a datelor cu diferite categorii de clasificare: JWICS (strict secret) permite interacțiunea în cadrul comunității de intelligence; SIPRNET (secret) asigură activitatea departamentelor MA al SUA și membrilor comunității de intelligence conectate la rețea; NIPRNET (restricționat) permite schimbul de informații de serviciu în cadrul MA al SUA și altor instituții de intelligence conectate la rețea, precum și asigură accesul la Internet.

Intranet rețea Intelink-U este rețea de bază pentru răspîndirea informațiilor OSINT, care asigură accesul interdepartamental la resurse informaționale nesecrete ale comunității de intelligence, utilizînd sistemul de transmitere a datelor DNI-U.

Intranet rețea Intelink-S asigură accesul interdepartamental la resurse informaționale secrete ale comunității de intelligence, utilizînd sistemul de transmitere a datelor SIPRNET.

Intranet rețea Intelink-TS permite posibilitatea accesării interdepartamentale a resurselor informaționale strict secrete ale comunității de intelligence, utilizînd sistemul de transmitere a datelor JWICS.

De asemenea, au fost create proceduri speciale de replicare/transfer a site-urilor și bazelor de date OSINT în rețele cu nivele mai înalte de clasificare (spre exemplu, de la neclasificate la secrete). Astfel, replica (copia) sistemului Intellipedia (analog secret al enciclopediei publice online Wikipedia) este disponibilă în rețeaua neclasificată DNI-U și în cea strict secretă, JWICS. Produse de intelligence întocmite în baza materialelor OSINT sunt disponibile în "Biblioteca Națională de Intelligence".

Începând cu anul 2008, în Centrul de analiză a informațiilor din surse deschise funcționează sistemul OSCAR-MS, destinat domeniului OSINT. Sistemul este disponibil în rețea SIPRNET și asigură automatizarea și unificarea cererilor utilizatorilor în privința surselor OSINT, interacțiunea utilizatorilor din diferite departamente, prevede funcția de căutare și întocmire a cererilor în limbaj natural, etc.

Un rol cheie în totalitatea resurselor neclasificate ale OSINT este atribuit portalului opensource.gov, deservit de Centrul de analiză a informațiilor din surse deschise și accesibil prin rețea Internet (numai pentru personalul instituțiilor guvernamentale competente). Executanților de nivel tactic le sunt recomandate pentru căutarea informațiilor următoarele domenii: publicații științifice; organizații guvernamentale și non-guvernamentale; servicii de informații comerciale și necomerciale; biblioteci și rețele de schimb între biblioteci; informații publicate de către persoane fizice; literatura gri. Cu acest scop au fost dezvoltate tehnici simple și accesibile destinate căutării, prelucrării și evaluării informațiilor.

Departamentele incluse în comunitatea de intelligence, în mod activ, efectuează cercetări care vizează :

– crearea unor sisteme de traducere multilingvă;

– identificarea, printre informații publicate în WEB, a tendințelor ascunse de dezvoltare a situației, relațiilor dintre evenimente, fenomene și obiecte investigate;

– utilizarea metodelor populare în Internet de organizare a lucrului în echipă, de acumulare a cunoștințelor, de organizare a rețelelor sociale și de analiza a datelor disparate în totalitatea informațiilor (texte, video, audio).

Înființarea Open Source Center a ranforsat în mod considerabil cadrul instituțional de stat al SUA specializat în intelligence din surse deschise și a contribuit, prin dezvoltarea unor formule de cooperare cu reprezentanți ai mediilor academic și privat, calitatea instruirii specialiștilor OSINT, devenind principalul reper/ model al reglementării segmentului similar din Uniunea Europeană.

În octombrie 2007, Comitetul Director al Agenției Europene pentru Apărare (EDA) a aprobat propunerea de lansare, în 2008, a unor cursuri-pilot la nivel avansat de perfecționare în domeniul OSINT.

Modulele de pregătire vizează cu precădere acoperirea problemelor de ordin teoretic și practic în cadrul procesului OSINT, a aspectelor conexe segmentului analizei de intelligence din surse deschise, popularizarea noilor instrumente OSINT și creșterea nivelului de pregătire a specialiștilor în open-source intelligence.

Cursurile se adresează tuturor statelor membre ale UE, sunt parte a strategiei EDA de asigurare a predării noțiunilor și cunoștințelor de bază pentru analiștii de intelligence și au la bază trei piloni: transferul de cunoaștere referitor la o anumită arie geografică (Africa, Asia Centrală, Orientul Mijlociu), aprofundarea abilităților specifice colectării datelor din surse deschise și dezvoltarea capacităților de evaluare și integrare a informațiilor extrase alături de cunoașterea disponibilă în acel moment.

Evoluția tehnologiei informației și a comunicațiilor a facilitat extinderea Internetului și utilizarea aplicațiilor Web 2.0, a căror implementare presupune popularizarea, prin intermediul training-urilor, a formatului de tip wiki și a cunoștințelor de management al colaborării intra și inter-instituționale.

Anunțurile de angajare a persoanelor după specialități "analist OSINT", "manager pe surse deschise", "ofițer de analiză a surselor deschise" etc., publicate de organizații de stat și companii private, care lucrează în domeniu OSINT conform comenzilor de stat, atestă necesitatea stabilă de specialiști respectivi.

Astfel, Open Source Intelligence continuă să dețină o poziție-cheie printre alte domenii de informații. Trecînd etapa de formare, OSINT devine un mecanism puternic în sistemul de susținere a procesului de luare a deciziilor la nivel de stat. Politica centralizată în acest domeniu permite comunității de intelligence din SUA de a crește în mod constant potențialul posibilităților de extragere a informațiilor secrete din surse deschise.

Categorii ale surselor deschise.

În prezent, este acceptată teoria potrivit căreia Open Source Data (emisiuni radio/TV, tipărituri, semnale neprelucrate, fotografii, casete, imagini făcute de sateliți, scrisori personale) și Open Source Information (date corelate și procesate pentru a realiza o informare de interes general, articole din mass-media, cărți, comunicate), ca elemente complementare ale unui proces menit să contribuie la fundamentarea Open Source Intelligence (OSINT), furnizează între 80 și 95% din totalul datelor folosite de comunitatea de informații la nivel mondial.

Prin acest proces complex se urmărește, în principal, asigurarea de cunoștințe istorice și cultural-strategice, informații operaționale referitoare la infrastructură și evoluții în plan social, informații geospațiale comerciale vitale din punct de vedere tactic, care nu pot fi obținute prin alte mijloace.

Literatura de specialitate acordă spații ample de analiză a domeniului Open Source Intelligence și evidențiază, într-o manieră aproape exhaustivă, că acesta presupune identificarea și validarea surselor, colectarea, coroborarea, procesarea, analiza și exploatarea informațiilor în scopul elaborării și diseminării de produse cu relevanță în planul securității naționale, care corespund cerințelor specifice de intelligence.

Identificarea sursei este o parte a cerințelor pentru planificare și evaluare a procesului de colectare de informații publice. Există două tipuri de surse folosite pentru colectarea informațiilor – surse confidențiale și deschise:

– Surse confidențiale pot fi persoane fizice, grupuri sau sisteme care protejează informațiile și datele relevante de la declasificarea publică. Cerințe informaționale care necesită utilizarea de surse confidențiale nu sunt legate de OSINT.

– Surse deschise constă din persoane fizice sau grupuri de persoane, care furnizează informații fără a cere păstrarea confidențialității ei și respectarea drepturilor de autor. Astfel de informații și datele conexe nu sunt protejate de utilizarea lor în domeniul public. Sursa deschisă de informații poate fi disponibilă în mod public, însă nu toate informații puse la dispoziția publicului sunt surse deschise. Surse deschise se referă la domeniul informațiilor publice și nu au restricții de acces pentru persoane fizice.

În acest context, sunt specificate și principalele categorii de surse care contribuie la derularea procesului OSINT, fie ele clasice (publicații periodice, materiale documentare, posturi de radio și televiziune cu transmisie în eter, date oficiale exprimate prin rapoarte guvernamentale, date și informații din medii profesionale și academice, date geospațiale, literatură gri etc.) sau moderne (produse media digitale, interactive, distribuite prin rețele informatice sau totalitatea textelor, sunetelor, imaginilor și elementelor grafice prelucrate pe computer și reunite în baze de date, „social media“ de comunicare, de colaborare, de recomandare etc.).

Sursele deschise includ:

mass-media tradițională – agenții de presă, publicații (zilnice, săptămânale, lunare, trimestriale etc.), posturi de radio și de televiziune;

Acestea reprezintă principalul furnizor de date în procesul de obținere a informațiilor din surse deschise. În funcție de profilul publicației, mass-media pot fi: de informare generală, specializate (tehnice, economice, militare, politice, culturale etc.), de divertisment și de opinie. De asemenea, din punct de vedere al ariei de difuzare, presa poate fi centrală, locală ori regională.

biblioteci și centre de cercetări științifice– documente tipărite și baze digitale de date pe diferite tematici;

Internetul și new-media , respectiv comunitățile online și conținutul generat de utilizatorii Internetului, în speță rețele de socializare, lumi virtuale, portaluri foto-video, enciclopedii wiki, bloguri, podcast-uri, online radio, extensii online ale mass-media tradițională, grupurile specializate de informare și analiză, bibliotecile online;

De cele mai multe ori se vorbește despre new-media (emerging media sau web 2.0) în antiteză cu media clasice (presă în format print, televiziune, radio etc.), deși, în realitate, new-media presupune juxtapunerea formelor clasice de mass-media cu tehnologiile de interacțiune și comunicare specifice World Wide Web. Conținutul media astfel rezultat capătă forme noi, paradigma comunicării dintre emițător și receptor reconceptualizându-se sub forma unui proces continuu de feedback și feedforward.

Sintetizând, Dennis Murphy, în „Fighting Back: New Media and Military Operations”, consideră new-media ca fiind „orice mijloc care permite unui spectru larg de utilizatori (de la indivizi la entități statale) să creeze și să disemineze informații în timp real sau aproape real, care au capacitatea să influențeze o audiență largă (regională sau mondială) folosind tehnologii de comunicații standardizate și având ca platformă unificatoare Internetul”.

literatura „gri” (date care nu sunt disponibile prin intermediul canalelor ordinare), respectiv informațiile neclasificate care au distribuire sau acces public limitat și asupra cărora alte companii și organizații nu au drept de proprietate.

Furnizori de literatură gri pot fi institutele de cercetare, „think tank”-urile, corporațiile, guvernele, partidele politice și mediile academice (documente oficiale, producătoare de cursuri, date tehnice, lucrări științifice, studii pe teme economice, culturale, politico-militare etc.). Informațiile din această categorie sunt colectate prin utilizarea unor tehnici avansate de căutare în domeniul ascuns al Internetului (Deep Web).

Importanța literaturii gri a fost recunoscută de autoritățile americane care, în 1993, au inițiat un plan (pus în practică în 1995) privind achiziționarea, procesarea și diseminarea de materiale din această categorie, de către un grup de lucru alcătuit din toate structurile care dețineau atribuții în aria informațiilor obținute din surse deschise.

Din perspectiva lui Mason H. Soule și R. Paul Ryan, literatura gri poate oferi informații care nu pot fi găsite în surse publicate, mai concise, detaliate, fiind, de multe ori, mai repede de obținut decât materialele publicate, mai ales pe măsură ce accesul la Internet se extinde .

informațiile din mediile academice (conferințe, simpozioane, prelegeri, prezentări lucrări academice și ale experților în diverse domenii; articole și cercetări științifice în format tipărit și electronic pe teme de economie, geografie, relații internaționale, securitatea regională, știință și tehnologie; produse software de instruire automatizată)

datele oficiale – rapoarte guvernamentale, bugete, statistici demografice, audieri, dezbateri legislative, conferințe de presă, discursuri, baze de date, informații plasate în domeniul public și rapoarte tipărite privind o gamă largă de aspecte (economie, ecologie, geografie, ajutor umanitar, securitate, știință și tehnologie), dar și informațiile din medii profesionale și academice se încadrează în această categorie;

datele individuale sau de grup – date scrise de mână, tipărite, pictate, listate etc. (graffiti, foi volante, broșuri, postere, fotografii, tatuaje, site-uri web etc.).

În contextul delimitării semnificațiilor principalelor concepte din domeniul surselor deschise, necesită a fi abordate și alți termeni importanți – informația personală (privată) și cea publică:

 Informații personale (private) includ informații generale, fapte, declarați, și alte materiale legate de o anumită persoană, grup sau organizație.

Cerințele unui serviciu de informații, care necesită utilizarea de astfel de informații nu se referă la domeniul OSINT. Mai mult ca atît, această categorie de informații are două sub-categorii:

– informația neclasificată controlată, din diverse motive necesită utilizarea controalelor și măsurilor de protecție (informații sensibile, dar neclasificate sau numai pentru uz de serviciu).

– informația clasificată trebuie să fie protejată de exploatarea ei neautorizată. Astfel, la elaborarea și difuzarea a astfel de documente este necesar să fie indicată parafa de secretizare.

Informații publice includ date, fapte, instrucțiuni și alte materiale publicate sau difuzate pentru vizualizare/utilizare publică. Astfel de informații sunt disponibile la cererea publicului, la ședințe publice și pot fi vizionate și ascultate legal de către un observator ocazional sau martor întîmplător.

Notă. Cantitatea informației clasificate poate fi limitată și izolată din context, dacă aceasta se consideră a fi date secrete. Atunci când se lucrează cu un număr mare de informații clasificate este necesară confirmarea veridicității acestor informații în surse deschise. Confirmarea veridicității informațiilor prin OSINT se folosește pentru a confirma fiabilitatea sursei confidențiale, precum și cînd sursele confidențiale nu sunt disponibile. Acest proces confirmă necesitatea proceselor OSINT pentru a asigura un sprijin continuu tuturor tipurilor de intelligence.

Corelarea cu alte surse de intelligence.

Cerințele unui serviciu de informații se pot extinde dincolo de domeniul de aplicare a OSINT, ceea ce duce la o lipsă de date. Pentru abordarea acesteor lacune în OSINT este necesar să fie utilizate metode adecvate.

OSINT este, de obicei, realizat prin monitorizarea, analiza și cercetarea informațiilor alese de pe Internet. Materiale compilate pe baza informațiilor din surse deschise sprijină toate metodele activității de informații prin acumularea cunoștințelor, analiza și diseminare lor. Similar cu alte metode de intelligence, orientarea activității unităților OSINT depinde de cerințele comandanților din domeniul.

Caracterul neclasificat, volumul extrem de generos de informații, calitatea și complexitatea produselor rezultate, precum și posibilitățile de interacțiune ale lucrătorilor indică sursele deschise drept cel mai prietenos mediu de lucru în intelligence, în principal din perspectiva varietății surselor și domeniilor pentru prelevarea de date necesare în plan decizional.

intelligence provenit din surse umane (HUMINT);

intelligence provenit din exploatarea imaginilor fotografice, radar, electro–optice, în infraroșu, termice sau multispectrale (IMINT);

intelligence provenit din comunicații (SIGINT);

intelligence care oferă date despre caracteristicile tehnico-tactice și de funcționare a aparaturii și mijloacelor tehnice ale adversarului (MASINT);

intelligence provenit din surse deschise, accesibile publicului larg – internet, televiziune, cărți, reviste (OSINT).

În altă ordine de idei, informațiile obținute din surse deschise (Open Source Intelligence – OSINT) reprezintă un element esențial pentru operațiunile specifice din multiple sfere de activitate, dar mai ales în cele privind armata sau serviciile de informații ale secolului al XXI-lea.

Utilitatea OSINT

Integrarea intelligence-ului în surse deschise (OSINT) sprijină și promovează:

Operațiunile terestre unificate, misiuni și obiective conexe;

Alte discipline de intelligence;

Alte funcții, în special, de lucru cu site-uri web, de verificare și analiză a sursei.

Aceste exemple reprezintă o listă parțială.

Sprijinirea procesului de analiză a țintei (adversarului), de luptă contra insurgenței și dispozitivelor explozive improvizate

Informații din surse deschise sunt utilizate la întocmirea listei de obiective (forțe ale adversarului) și informații de fond, la pregătirea briefingului și cerințelor conducerii. 

În cazul sprijinirii operațiunilor de contra-insurgență, informații din surse deschise reprezintă un aspect important pentru înțelegerea situației operative, determinarea opiniei publice și sprijinului acordat rebelilor. Informații care se află la dispoziția publicului sunt un instrument important pentru a determina eficacitatea informării și influenței printre populația locală. Monitorizarea mass-media sprijină, de asemenea, operațiuni similare.

În conformitate cu cerințele prioritare ale intelligence-ului, monitorizarea ar trebui să fie efectuată la fiecare nivel al organului de intelligence. Rețele majore de știri trebuie să fie analizate și verificate permanent, însă la nivel operativ-tactic, în primul rînd, trebuie să fie supuse analizei și verificării ziarele și stațiile radio locale. 

Sprijinirea altor metode de intelligence

Informații din surse deschise, procesate și analizate, pot fi de asemenea folosite pentru a sprijini alte metode de intelligence.

HUMINT

Intelligence în surse deschise (OSINT) sprijină operațiuni efectuate de agenți prin furnizarea șefului sau ofițerului HUMINT, precum și departamentelor comunității de intelligence, a unui material prelucrat din surse deschise. Lista parțială a unor astfel de materiale este prezentată mai jos:

Hărți;

Schițe;

Cataloage de telefoane;

Business cataloage;

Ziare;

Materiale video și audio (de ex.: casete și CD-uri).

Intelligence geospațial și de radioelectronică

OSINT-ul este utilizat nemijlocit pentru a sprijini intelligence-ul radio-electronic (SIGINT) și geospațial (GEOINT).

Pentru SIGINT, utilizarea posibilităților OSINT poate oferi următoarele informații:

Identificarea canalelor TV locale, componentelor și sistemelor lor auxiliare;

Site-uri web folosite pentru a influența populația locală.

În cadrul GEOINT, utilizarea posibilităților OSINT poate sprijini intelligence-ul vizual (IMINT) prin oferirea imaginilor din „Google Earth” și altor fotografii comerciale.

Intelligence tehnic și contra-intelligence

Utilizarea informațiilor disponibile în mod public este un aspect important al intelligence-ului tehnic (TECHINT). Deși intenții, posibilități și vulnerabilități ai adversarilor, precum și potențialele amenințări sunt pasibile clasificării, rezultatele progresului tehnologic, în forma de rețea Internet și programa „Google Earth”, contribuie la obținerea informațiilor despre țările și organizațiile cele mai ascunse. 

La sprijinirea operațiunilor de contrainformații, informațiile disponibile în mod public pot fi utilizate pentru obținerea de date care corespund cerințelor prioritare ale intelligence-ului și altor cerințe permanente ale contra-intelligence-ului (CI). 

Astfel se constată necesitatea ca toți angajații serviciilor speciale să fie instruiți, în conformitate cu obiectivele unității, privind bazele activității de intelligence în surse deschise.

La etapa inițială a procesului de asigurare informativă a operațiunilor tactice personalul OSINT oferă informații de bază privind analiza misiunii și planul de acțiune.

Rolul OSINT în desfășurarea activităților operativ-tactice definesc caracteristicile:

– Asigurarea elementelor de bază. O mare parte a materialelor informative necesare privind zonele desfășurării operațiunilor este extrasă din surse deschise, prin colectarea de informații din mass-media, care descriu evenimente internaționale și reacția comunităților cu diferite viziuni asupra problemei. Acumularea de informații din surse deschise este funcția principală a unității OSINT.

– Respectarea cerințelor. Accesibilitatea, profunzimea și volumul informațiilor disponibile în mod public permite serviciilor de informații de a găsi informații necesare fără implicarea mijloacelor umane și tehnice speciale de intelligence.

– Simplificarea proceselor de colectare a informațiilor. Cercetarea folosind surse deschise sprijină măsuri de supraveghere, recunoaștere și, în același timp, corespunde cerințelor activității de informații. OSINT oferă informații (de ex.: biografie, cultura populației, informații geospațiale și date tehnice), eliminând astfel nevoia atragerii metodelor tehnice și umane suplimentare de intelligence.

– Creșterea productivității. Fiind parte a procesului de intelligence, OSINT permite personalului de conducere realizarea unei analize profunde a informațiilor disponibile în mod public, în scopul luării deciziilor corespunzătoare.

Funcțiile intelligence-ului în cadrul operațiunilor operativ-tactice – sunt un set de sarcini și sisteme care contribuie la o înțelegere rapidă a mediului de luptă, inamicului, terenului, condițiilor meteorologice și factorului uman. Acestea includ analiza de informații din toate sursele în scopul efectuării unei prognoze de evoluție a situației. Astfel, OSINT sprijină fiecare dintre sarcinile și scopurile prestabilite.

Informații disponibile în mod public sunt utilizate pentru:

– conștientizarea potențialelor amenințări și situației operative;

– obținerea informații privind natura amenințărilor, teren, condiții meteorologice și factor uman;

– acumularea și analiza datelor, în scopul furnizării informațiilor necesare cu privire la localizarea operațiuni;

– furnizarea, la timp, a notelor informative scurte privind probleme de interes;

– furnizarea informațiilor de bază în pregătirea notei generale cu privire la locul desfășurării operațiunilor, potențialele amenințări și intențiile inamicului;

– construirea unei baze de date de intelligence, concepute pentru o pregătire efectivă a operațiunilor militare și procesul de luare a deciziilor.

– prognozarea evoluției situației. prognoză – este procesul de analiză a informațiilor disponibile și întocmirea estimărilor de evoluție a situației, scenariilor posibile, înainte și în timpul desfășurării operațiunilor.

Concluzii

Astfel, dintre avantajele pe care le aduce utilizarea surselor deschise, putem enumera:

• asigură date într-un volum și de o calitate ce nu pot fi obținute din surse secrete și facilitează accesul la anumite tipuri de expertiză care nu sunt totdeauna accesibile în lipsă de resurse (temporale, materiale, financiare etc.);

• conduc implicit la creșterea posibilităților de manifestare a imaginației, a creativității și a anticipațiilor rezolutive;

• creează posibilitatea cadrelor didactice/instructorilor să-și diversifice strategiile educaționale, oferindu-le totodată o bază de date de esență psiho-socio-educațională de natură să optimizeze procesul de predare și evaluare;

• oferă condiții optime pentru a facilita achiziția de cunoștințe sau exprimarea ideilor în diverse moduri și elementele minim necesare înțelegerii contextuale în etapa de analiză a informațiilor primare;

• oferă posibilitatea accesării băncilor de date, în funcție de domeniile de interes, pentru completarea suportului de curs, a instrucțiunilor, regulamentelor și chiar stabilirea de contacte pentru clarificări sau ulterioare colaborări cu parteneri interni sau externi;

• oferă posibilitatea accesării informației în ritmuri proprii de asimilare, precum și variante alternative de interpretări ale unor noțiuni, activități, procese de specialitate dintr-o perspectivă neclasificată a informației;

• permit explorarea și punerea în valoare, în condiții spațio-temporale optime, a tuturor oportunităților și posibilităților de utilizare a unui arsenal cât mai larg de resurse din texte scrise (manuale, cursuri, suporturi didactice clasice), mesaje audiovizuale, imagini, grafice și tehnici interactive video, animație, transmisii TV prin cablu, simulări, instruire asistată de calculator, CD-rom-uri;

• permit, în funcție de tipul și suportul informației, dezvoltarea vocabularului de specialitate, a abilităților tehnice, informatice, analitice și lingvistice ale utilizatorilor;

• pun la dispoziție resurse de comunicare și informare, constituindu-se într-un potențial ridicat de predare și instruire etc.

Dintre dezavantajele pe care le aduce implementarea infrastructurii necesare utilizării surselor deschise de informare și chiar utilizarea acestora, enumerăm:

• costuri majore pentru înființare și, ulterior, de adaptare permanentă la standardele aflate în continuă evoluție;

• costuri ulterioare substanțiale în raport cu calitatea, cantitatea și veridicitatea informației de accesat;

• modernizarea căilor de accesare și transfer ale informației impune instruirea de specialitate periodică a utilizatorilor, atât în țară, cât și în străinătate;

• utilizarea din surse de informare variabile și fără stabilirea unor obiective bine determinate creează dificultăți de gestionare a timpului necesar, favorizează un grad ridicat de redundanță informațională și chiar poate conduce la deformarea percepției asupra lumii reale;

• folosirea pe perioade de timp nedeterminate poate genera o stare pronunțată de izolare a beneficiarului cu implicații socio-psihologice dificil de evaluat;

• utilizarea surselor de informare deschise în domenii sensibile precum securitatea națională, fără o pregătire temeinică de specialitate, poate supune utilizatorul la manipulare informațională prin intoxicare, convingeri și dezinformare, aspecte care generează consecințe greu de evaluat și de eliminat ulterior;

• folosirea surselor deschise fără o instruire adecvată prealabilă induce o supraîncărcare informațională greu de gestionat de către utilizatori.

Domeniul aplicativ al OSINT.

Ciclu de intelligence al surselor deschise.

Similar ciclului intelligence, fluxul OSINT este un proces complex care începe cu cererea unei informații, ce poate veni din partea unui director dintr-o organizație de intelligence, a președintelui, a unui ministru etc. Urmează planificarea modului în care se vor derula activitățile, astfel încât să se răspundă acestei cereri de informații.

Intelligence-ul din perspectiva procesului reprezintă ansamblul operațiilor de culegere, filtrare, analiză a datelor și informațiilor și de diseminare a produselor de intelligence cu valoare acționabilă pentru a satisface necesitățile unui consumator specific, care are funcție decizională în domeniul securității naționale.

Un specialist OSINF strânge datele relevante folosind instrumente specifice, ulterior fiind extrase metadate importante, ce sunt indexate și procesate. Analistul realizează următorul pas prin cercetarea informațiilor obținute din baza de date, filtrarea surselor, respectiv identificarea celor relevante de cele nerelevante, a celor valabile de cele perimate, interpretarea și evaluarea lor pentru ca să rezulte un produs informațional menit a răspunde solicitării inițiale.

În fine, materialul obținut, care poate conține grafice, tabele etc. ori poate fi însoțit de imagini video, este diseminat beneficiarului, în condiții securizate și într-un format accesibil. De menționat că, în unele situații, aceeași persoană poate efectua atât colectarea și procesarea datelor, cât și analiza lor.

Mai jos, sunt prezentate grafic (Fig. 1) și explicate cele cinci etape ale fluxului exploatării surselor deschise: planificare – direcționare; colectare; procesare; analiză; diseminare – evaluare.

Fig. 1 – Fluxul OSINT

Planificarea și direcționarea reprezintă etapa în care se desfășoară managementul întregului efort al producerii de intelligence din surse deschise, sunt formulate cerințele beneficiarilor și sunt stabilite direcțiile în care se vor efectua colectarea și analiza.

Colectarea înseamnă obținerea de date și informații pertinente pentru beneficiar.

Procesarea se referă la conversia datelor și informațiilor colectate în forma dorită pentru analiză, prin traducere, translatarea speech-to-text etc.

Analiza este conversia datelor brute în produse de intelligence finite, presupunând integrarea și evaluarea acestora și transformarea lor în produse de intelligence.

Diseminarea și evaluarea (feed-back) constituie distribuirea produsului de intelligence finalizat către beneficiar și, eventual, primirea unei aprecieri pe marginea acestuia.

O discuție aparte privind exploatarea surselor deschise și realizarea, în baza acestora, a produselor de intelligence se referă la nivelul de clasificare și acces. Pentru a face diferența dintre informațiile secrete și deschise, pe de o parte, și produsele clasificate și neclasificate, pe de alta, trebuie să se facă distincția dintre informația ca atare și modul în care a fost obținută, respectiv interpretată și analizată (Tabelul 1) .

Astfel, în cazul în care sursa de informații este secretă și mijloace de colectare a informației sunt clandestine, atunci și produsul de intelligence este clasificat (însă acest caz ne este legat de domeniul OSINT). Dacă sura informației este confidențială iar mijloace de culegere sunt deschise (vizitarea conferințelor, ședințelor cu participarea persoanelor interesate) , atunci produsul final de intelligence poate fi clasificat sau neclasificat controlat (restricționat). Iar cînd sursa și mijloace de colectare a informației sunt deschise, produsul poate fi neclasificat, restricționat sau chiar clasificat (în dependența de informațiile obținute și impactul lor).

Cele trei niveluri ale formării unui specialist OSINT – inițierea, specializarea, perfecționarea – vizează atingerea unor obiective specifice pliate pe principalele etape ale procesului OSINT, respectiv:

Planificarea;

Rolul training-urilor OSINT în acest caz este ameliorarea capacității unui lucrător de a-și planifica activitatea în funcție de criterii precum:

reperele semnalate de solicitantul produsului informativ în asignarea unei sarcini;

resursele de care dispune și sursele la care are acces;

termenul de transmitere a documentului informativ.

A ști unde să caute o informație, cu care analiștii specializați în problematica respectivă să discute, cum să stabilească succesiunea fazelor întocmirii textului în funcție de relevanța diverselor aspecte ale subiectului supus analizei – iată cîteva elemente ale activității unui lucrător care, prin intermediul training-urilor și work shop-urilor, sunt teoretizate și transpuse în proceduri de lucru cu grade diferite de standardizare.

Colectarea datelor și convertirea lor în informații;

Lucrătorii specializați în colectarea de informații din surse deschise trebuie să aibă competențe de gestionare a știrilor și articolelor din Internet, presă scrisă sau agenții de știri, materiale audio-video din posturi TV, radio, precum și alte tipuri de materiale, ca de exemplu documentare, rapoarte, analize, statistici, provenite inclusiv din baze de date open source.

Modificarea rapidă a tabloului de surse deschise – în special dezvoltarea “new media” – și transferul celei mai mari părți a conținutului surselor clasice în spațiul virtual, alături de tendințele de evoluție a caracteristicilor informațiilor furnizate, au crescut semnificativ complexitatea competențelor de căutare și procesare a acestora.

“New media” nu au o definiție general acceptată, fiind percepute diferit de diversele categorii de utilizatori, însă nucleul conceptual al noțiunii indică orice produs media digital care este interactiv și distribuit prin rețele informatice, sau totalitatea textelor, sunetelor, imaginilor și elementelor grafice prelucrate pe computer și reunite în baze de date.

Cantitatea enormă de informație – numărul imens de website-uri corporatiste/ personale, bloguri, forumuri publice, rețelele sociale care deja contabilizează sute de milioane de conturi – creșterea exponențială a conținutului generat de utilizatori și diversitatea limbilor/ pachetelor în care este livrată informația reprezintă provocări care se traduc, din perspectiva nevoii de a le gestiona, în obiective distincte ale instruirii, precum:

însușirea de cunoștințe aprofundate și specializate de navigare și exploatare a Internet-ului;

dezvoltarea aptitudinilor de identificare a celor mai bune surse de informare;

dobândirea de competențe privind validarea surselor;

metode și tehnici de căutare a datelor;

dobândirea de competențe privind validarea și organizarea datelor;

dezvoltarea tehnicilor de procesare.

La pregătirea pentru desfășurarea activității în domeniul OSINT, o atenție deosebită trebuie acordată următoarelor domenii: (vezi Tabelul 1)

– Discursuri in public (forumuri, conferințe);

– Documente publice;

– Televiziune și radio;

– Internet resurse (site-uri).

Discursuri în public (forumuri, conferințe)

Obținerea de informații în timpul discursurilor publice necesită coordonare precisă și sincronizarea activității de intelligence în surse deschise cu planul de colectare a datelor. Aceste activități ar trebui să urmeze Cadrul legislativ care interzice colectarea neautorizată a informațiilor. 

La colectarea informațiilor în timpul discursurilor publice, utilizarea tacticilor, tehnicilor și metodelor, precum și procedura stabilită se descriu detaliat în planul de lucru a unității. De asemenea, se menționează fonduri necesare pentru achiziționarea tehnicii digitale și de înregistrare a sunetului, programelor software și componentelor hardware pentru stocarea și reproducerea datelor video.

Angajații din domeniul OSINT se ocupă de activitatea de intelligence vizitînd forumuri publice, cum ar fi: conferințe, prelegeri, mitinguri publice și demonstrații, ateliere de lucru și dezbateri. Vizitarea unor astfel de evenimente permite să construiască relații cu specialiști și organizații non-militare. De la angajații serviciului de informații se cer cunoștințe aprofundate a culturii și legislației locale, în scopul asigurării legitimității (legalității) activităților de culegere a informațiilor pentru a respecta obiceiurile locale sau legile (de exemplu: regula „Chatham House Rule” în SUA – confidențialitatea sursei de informații). Desfășurînd acțiuni de colectare a informațiilor publice, se recomandă coordonarea activităților cu serviciul juridic. Trebuie menționat că conștientizarea situației și înțelegerea culturii locale se realizează prin stabilirea de contacte cu vizitatorii forumurilor, identificarea persoanelor de interes la asemenea evenimente și detectarea oricăror schimbări în discursul vorbitorului.

De obicei, angajații OSINT vizitează discursuri publice și forumuri legate de operațiuni de stabilizare a situației, cu un nivel de risc minimal.

Notă . Regula „Chatham House Rule” prevede : " Dacă o întâlnire  sau o parte a acesteia se desfășoară în conformitate cu prevederile acestei reguli, atunci participanții evenimentului pot liber să folosească informațiile obținute ,însă nu pot utiliza informațiile cu caracter personal (de identificare), apartenența (conexiunea) vorbitorului și a altor participanți.

Respectarea regulii „Chatham House Rule” trebuie să fie convenită înainte de începerea evenimentului . Aplicarea acestei reguli schimbă caracteristica sursei de la deschis (public) la confidențial, precum și poate necesita limitări în colectarea de informații pentru a se conforma cu restricțiile activității de informații.

 Documente publice

Fiecare unitate colectează documente în spațiile lor de responsabilitate. Documentele colectate sunt analizate cu atenție și diseminate în întreaga comunitate de intelligence. Înainte de a efectua orice acțiuni de intelligence în domeniul surselor deschise este necesar:

Coordonarea procesului de colectare a documentelor, prelucrare și analiză a informațiilor;

Determinarea ordinii de implementare, întreținere, reabilitare și transmitere a echipamentelor multimedia și mijloacelor de comunicație pentru prelucrarea de tipar, analogă și digitală;

Determinarea serviciilor de informare academice și comerciale, care deja sunt disponibile pentru colectarea, prelucrarea și analiza informațiilor din surse deschise.

Procedurile operaționale standard ale unități, tactici, metode și tehnici de acțiune trebuie să descrie mecanismul de solicitare, gestionare și distribuție a surselor financiare pentru:

servicii de colectare și prelucrare a documentelor;

achiziționarea cărților, dicționarelor, imaginilor, hărților, ziarelor, revistelor, înregistrărilor audio și video, echipamentelor de calculator, camerelor digitale și aparatelor de scanare;

abonamente la ziare, reviste și alte materiale.

La achiziționarea documentelor publice oficiale, angajații în domeniul OSINT trebuie să fie bine informați despre situație și să folosească metode legale, adecvate pentru această situație. Aceste metode includ, dar nu se limitează la:

fotografierea și copierea documentelor prezentate la forumuri publice, în special, în primării, biblioteci și muzee;

căutarea printre documente aruncate în locuri publice (străzi, piețe și toalete);

fotografierea documentelor în locuri publice (bannere, graffiti și postere);

achiziționarea documentelor de la negustori ambulanți, precum și în chioșcuri de ziare, librării și edituri;

achiziționarea documentelor prin intermediul unor terțe persoane (distribuitor angro sau membru al clubului de carte);

obținerea documentelor la cererea de la autori, conferințe, târguri, publicitate poștală directă.

Televiziune și radio

Adunarea, prelucrarea informațiilor, precum și anunțarea despre evenimente internaționale/regionale de către o unitate de conducere, permite unităților operative de a primi și procesa informații din surse locale de tele-/radiodifuziune care îl interesează pe beneficiar. Înainte de desfășurarea activități de intelligence în surse de tele-/radiodifuziune, este necesar:

Coordonarea procesului de colectare și prelucrare a informațiilor, precum și de raportare;

Stabilirea procedurilor de implementare, întreținere, reparație și transmitere a sistemelor de comunicații și a dispozitivelor digitale radio și de televiziune, utilizate pentru stocarea și prelucrarea conținutului;

Detectarea surselor de pe Internet pentru colectarea și procesarea informațiilor din emisiuni TV/radio concrete.

Procedurile operaționale standard ale unități, tactici, metode și tehnici de acțiune trebuie să descrie mecanismul de solicitare, gestionare și distribuție a surselor financiare pentru achiziționare de antene și tehnica de calculator, servicii de traducere automată sau software, precum și abonamentelor la furnizorii regionali și internaționali de tele-/radiodifuziune prin satelit.

Unitatea responsabilă de colectarea de informații din rețele de difuzare regionale și internaționale își desfășoară activitatea în conformitate cu cerințele OSINT. Deseori angajații în domeniul OSINT utilizează surse familiare care cuprind emisii regionale și internaționale. Pentru a obține informații de la surse de difuziune publică sunt utilizate patru metode:

Căutare spectrală . Căutare în întregul spectru de frecvențe pentru a detecta, determina și identifica locația tuturor posturilor emițătoare de semnal, care pot confirma faptele de bază. Căutarea oferă o imagine de ansamblu a numărului și tipurilor de surse, precum și locația lor în spectrul;

Căutare de game de frecvențe. Căutarea unui segment anumit în spectrul de frecvențe pentru a confirma informațiile generale despre sursa;

Căutare de frecvențe. Căutare frecvențelor radio sau de televiziune;

Căutare de programe. Căutare programelor radio sau de televiziune. Programa variază în funcție de tipul, caracteristica conținutului și formatul media. Intelligence prin difuzarea de emisii se lansează și se extinde la primirea rezultatelor inițiale.

Notă . Pentru a obține rezultate eficiente, angajații în domeniul OSINT trebuie să folosească aceste metode în combinație. Alegerea metodelor depinde de misiune, dimensiunea și capacitățile unității.

Internet resurse (site-uri)

Informații colectate de pe Internet, prelucrate și puse la dispoziție în mod corespunzător susțin adoptarea deciziilor. Înainte de desfășurarea activități de intelligence în Internet, este necesar:

Coordonarea și organizarea procesului de colectare, prelucrare și analiză a informațiilor de pe Internet, la toate nivelurile unității;

Stabilirea procedurilor de implementare, întreținere, reabilitare și transmitere a calculatoarelor și sistemele conexe pentru comunicații și depozitare de date;

Aprobarea de către conducerea unității a unei liste de web site-uri autohtone și străine pentru uz de serviciu, precum și web site-uri străine accesibile numai pentru personal autorizat (număr limitat), care desfășoară activități de intelligence în surse deschise;

Determinarea serviciilor de informare academice și comerciale, care sunt disponibile pentru colectarea, prelucrarea și analiza informațiilor.

Procedurile operaționale standard ale unități, tactici, metode și tehnici de acțiune trebuie să descrie mecanismul de activitate a unității care desfășoară operațiuni de cercetări științifice în Internet. În conformitate cu atribuțiile sale, unitatea trimite cereri, distribuie și gestionează fonduri pentru achiziționarea de documente digitalizate, informații geospațiale, programe software și componente hardware, precum și orice abonamente la baze de date academice și comerciale on-line, ziare, reviste și referințe.  

Există patru pași consecutivi pentru a obține informații din resurse de Internet:

Alcătuirea unui plan de căutare;

Căutarea propriu-zisă;

Îmbunătățirea tehnicilor de căutare;

Salvarea (înscrierea) rezultatelor de căutare.

Analiza domeniului mass-media, din punct de vedere al apartenenței acesteia, necesită cunoștințe personalului serviciilor speciale cu privire la modul cum acționează, influențează și reprezintă interesele diferite elemente de informații. Studierea minuțioasă a diferențelor în modul de utilizare a mass-media în condiții diferite, poate oferi o perspectivă asupra strategiei interne și externe a Guvernului. În literatura de specialitate există următoare clasificare a mass-media:

– controlul guvernului asupra mass-media;

– controlul centralizat asupra mass-media;

– controlul dominant exercitat de către guvernul și liderii politici asupra mass-media;

– controlul conținutului mass-media prin mecanism de cenzură folosit de guvern;

– controlul mass-media nu este unul total;

– controlul mass-media este semi-centralizat;

– controlul mass-media prin mecanism de auto-cenzură, care presupune punerea presiunii de către guvern asupra conducerii mass-media și jurnaliștilor, înainte de diseminarea informațiilor;

– mass-media independente;

– controlul descentralizat asupra mass-media;

– Guvernul poate regla frecvența de emisie, conținutul etic/moral, dreptul de proprietate, și, uneori, exercită o presiune politică asupra agențiilor de știri și jurnaliștilor;

– factori economici, regulile meseriei de jurnalism, preferințele oamenilor care conduc agenții de știri și calitățile unor jurnaliști care furnizează sau comentează știrile – toate acestea afectează conținutul mass-media.

Toată mass-media, într-o oarecare măsură, se află sub controlul cuiva și, ca urmare, serviciilor speciale le este mai ușor să analizeze o sursă mass-media. Obiectivul principal al angajaților din domeniul OSINT este de a identifica factori și elemente aflate sub controlul elitelor, instituțiilor sau persoanelor fizice (gradul de influență a lor) și ce domenii reprezintă interes pentru a îndeplini cerințele de intelligence ale serviciilor speciale.

Toate sistemele politice sunt compuse dintr-o ierarhie de putere, care urmează în mod logic declarațiile oficiale ale "elementelor" (lideri, conducători politici, etc.), în conformitate cu ierarhia de autoritate. Autoritatea presupune că opinia exprimată în declarație reflectă punctul de vedere dominant în cadrul unui sistem politic. Structura ierarhiei puterii poate fi observată în mod clar la nivelul politic – declarația prim-ministrului are o greutate politică mai mare decât cea a ministrului. In alte cazuri, ierarhia poate să nu fie atât de evidentă, discursul unui președinte de partid este mai autoritar, decât cel al șefului statului.

Tabelul 4. Ierarhia puterii în mass-media

În viziunea NATO, managementul OSINT presupune parcurgerea următoarelor etape:

planificarea și direcționarea acțiunilor;

cercetarea, căutarea, culegerea, procesarea și exploatarea informațiilor;

producerea informațiilor;

diseminarea, valorificarea și evaluarea (feed-back).

În acest proces există etape de lucru cărora li se acordă o maximă importanță, cum ar fi:

descoperirea acelor informații de care este nevoie pentru îndeplinirea sarcinilor asumate, după principiile „să știi cine știe” și „să știi unde să cauți”;

selectarea dintre sursele bune și cele rele, cele viabile și cele expirate, cele relevante și cele irelevante;

filtrarea acestora și furnizarea informației rezultate în timp util, în condiții securizate, într-un format ușor de înțeles de către beneficiar.

În actuala epocă a globalizării, multe state devin victime ale spionajului economic, politic, tehnic, informatic, factor ce aduce atingere securității.

 Elaborarea produsului informativ.

Este etapa care presupune cea mai complexă și aprofundată pregătire a lucrătorului în intelligence din surse deschise, fapt pentru care training-urile OSINT axate pe analiza informațiilor sunt cele mai consistente, elaborate și extinse.

Formarea continuă și perfecționarea analiștilor de informații din surse deschise este esențială pentru creșterea calității produselor informaționale pe care le întocmesc, instruirea în acest domeniu având atât rolul de a specializa lucrătorul pe anumite tipuri de analiză (în funcție de necesitățile organizației din care face parte), cât și de a asigura menținerea sa constantă într-o zonă de cunoaștere a elementelor specifice principalelor activități de intelligence (știut fiind faptul că omiterea sau necunoașterea unor aspecte importante ale situației analizate poate altera utilitatea produsului livrat beneficiarilor).

Complexitatea activității de elaborare a unui document de informare de tip analitic dictează structurarea atentă a training-urilor în module clar delimitate în funcție de obiectivele propuse.

În prezent, criteriile de formulare a acestor obiective sunt stabilite în principal de:

tipul de analiză a informațiilor pentru care sunt instruiți lucrătorii;

Analiza tactică, strategică, analiza de trend, analiza de risc, analiza predictivă – sunt doar câteva exemple de domenii caracterizate de mijloace și metodologii proprii de realizare a materialelor în format integrat.

spațiile monitorizate;

Oscilația polilor de instabilitate pe anumite perioade de timp și în spații diferite determină

focalizarea atenției analiștilor OSINT pe respectivele regiuni/ state, în vederea informării extinse și operative a beneficiarilor, respectiv pentru susținerea cât mai eficientă a deciziilor relevante pentru siguranța națională.

problematicile pe care le au în competență.

Tratate separat sau interconectate din perspectiva cauzalității anumitor evoluții, problematici precum terorismul, proliferarea armelor de distrugere în masă, criminalitatea organizată, securitatea economică, conflictele înghețate, extremismul, radicalizarea și fundamentalismul religios, etc. presupun metode specifice de abordare în cuprinsul documentelor analitice, în special din punctul de vedere al încadrării lor în anumite tipuri de analiză și al resurselor utilizate în elaborarea produselor informative.

Un aspect distinct pe segmentul obiectivelor operaționale ale training-urilor OSINT, valabil pentru toate stadiile de instruire și toate etapele procesului de intelligence, este reprezentat de sistemul de avertizare timpurie – early warning – funcție de bază a Intelligence-ului Competitiv, care are rolul de a asigura beneficiarilor, într-un timp cât mai scurt, informațiile/ produsele informative relevante pentru formularea operativă a unor decizii, eventual cu caracter anticipativ, preventiv, privind evenimente cu potențial ridicat de impact asupra stării de securitate.

Obiectivele principale ale instruirii în privința avertizării timpurii vizează dezvoltarea abilităților analistului OSINT de a selecta elementele care trebuie semnalizate decidenților, precum și de a stabili importanța, gradul de validitate a informației/ sursei și destinatarul respectivei avertizări.

Metode de colectare a informației din Internet.

Clasificarea motoarelor/directoarelor de căutare:

Motoare simple de căutare – au baza proprie de date (www.google.com, www.yahoo.com, www.bing.com, www.ask.com, www.ixquick.com, www.teoma.com);

Metamotoare de căutare – interoghează bazele de date ale mai multor motoare de căutare și coroborează rezultatele după algoritmi proprii (www.metasearch.com, www.ez2find.com, www.metacrawler.com, www.dogpile.com, www.infogrid.com);

Interfețe de căutare – permit consultarea mai multor motoare de căutare, pornind de pe aceeași pagină și introducînd o singură dată termenii-cheie (www.zuula.com, www.browsys.com);

Motoare de căutare speciale – sunt motoare specializate pe anumite medii (bloguri, știri, filme, imagini), respectiv domenii (juridic, literatură, știință, UE).

Căutarea pe medii: technorati.com, www.newsnow.co.uk, www.youtube.com, www.picsearch.com.

Căutarea pe domenii: scholar.google.com, www.science.gov/scigov, scirus.com, www.scitopia.org/scitopia;

Motoare de căutare serială – sunt software-uri care interoghează mai multe motoare de căutare simple în serie, fără rescrierea interogării (www.search3.com, www.twingine.com);

Motoare de clusterizare – organizează rezultatele în clustere/nuclee pe tematici interconectate sau avînd conținut similar (www.webclust.com, www.yippy.com, www.iboogie.tv, search.carrot2.org/stable/search);

Motoare federative de căutare – reprezintă programe care lansează căutări pe mai multe resurse simultan și în timp real, deosebit de metamotorul de căutare care caută prin indexuri statice (biznar.com/biznar, opus.tu-bs.de/zack/index.en.html);

Motoare de căutare în timp real/ în rețele de socializare – sunt acele aplicații care lansează căutări în timp real, la nivelul rețelelor de socializare (www.topsy.com, www.48ers.com, www.leapfish.com, www.sency.com, twitter.com/#!/search-advanced);

Motoare de căutare în web-ul de profunzime (Deep/Invisible/Dark/Hidden Web Search Engines) – caută în conținutul web neindexat de motoare standard de căutare – baze de date academice, guvernamentale, ale unor organizații, site-uri care resping roboții de căutare, pagini web solicită autentificare pentru acces, cu acces plătit, site-uri cu conținut dinamic/ creat de calculator (www.incywincy.com, www.goshme.com, turbo10.com);

Motoare de căutare semantice – web-ul semantic mizează pe utilizarea unor tehnici de descriere a resurselor care să pună în evidență semnificația conținutului și relațiile dintre diversele piese de informație, astfel încît informația să fie inteligibilă nu doar pentru oameni ci și pentru mașini:

SenseBot – dispune de Link Sensor pentru platforme de blog și face un sumar al linkurilor rezultatelor;

Cognition Search – util pentru companiile care doresc să extragă rezultate din propriul conținut;

Lexxe – util pentru cereri sub formă de întrebări și pentru egosurf (propria popularitate pe net);

Swoogle – web-ul semantic, despre înțelesul termenilor;

Factbites – rezultatele despre înțelesul semantic al căutării;

Powerset – achiziționat de Microsoft, returnează rezultate cît mai precise pentru cît mai puține cuvinte cheie.

Directoare web

Open Directory Project (disponibil la adresa dmoz.org) – este cel mai vast și mai comprehensiv director de pe Web, editat de operatori umani. Este construit și administrat de către o vastă comunitate globală formată din editori voluntari. Open Directory a fost fondat în spiritul mișcării Open Source și constituie singurul director web de durata disponibil 100% gratuit. Nu se percepe nici o taxă de înscriere a unui site în director și/sau pentru a utiliza datele incluse în acesta. Datele din acest proiect sunt disponibile gratuit tuturor celor care consimt licenței de liberă utilizare. Alimentează serviciile de directoare web furnizate de cele mai vaste și mai populare motoare de căutare și portaluri, incluzînd Netscape Search, AOL Search, Google, Lycos, HotBot, DirectHit etc.

Alte directoare web – www.zeal.com, www.joeant.com, www.gimpsy.com, www.searchenginecolossus.com (director pentru motoare de căutare din 313 țări).

Căutarea avansată Google

Motorul de căutare Google oferă o serie de operanzi speciali pentru cutări avansate, cu ajutorul cărora se pot căuta site-uri în memoria cache, informații suplimentare despre o anumită pagină, informații în titlul paginilor web, definiții de cuvinte, linkuri ce indică spre o anumită pagina web și altele.

În contextul în care se apreciază că alegerea unor cuvinte cheie potrivite reprezintă 80% din dificultatea unei căutări, este recomandabil să se recurgă la o serie de tehnici de căutare pentru filtrarea informațiilor: folosirea unor cuvinte cheie (termeni sau sintagme) relativ simple, caracteristice subiectului urmărit, cu un nivel adecvat de specificitate (precise, dar nu foarte restrictive); expresii sau combinații ale mai multor cuvinte cheie; gruparea termenelor cu ajutorul parantezelor; scrierea termenelor cu litere mici; utilizarea cu atenție a operatorilor booleeni („și”, „AND”, „&”, „+”; „și nu”, „AND NOT”; „nu”, „-”) și a „wildcard-urilor” (asteriscul simplu și dublu, semnul întrebării); se va evita folosirea conjuncțiilor, verbelor, adverbelor și adjectivelor, lansarea unei cereri prea „lungi” (mai mult de 6-8 cuvinte).

AND – permite căutarea a mai mult de un concept sau termen simultan; toți termenii trebuie să fie prezenți în document; orice spațiu folosit în linia de interogare reprezintă operatorul AND;

OR – permite căutarea oricăruia dintre termenii introduși; este un operator folosit pentru regăsirea folosind sinonime sau conținut legat de subiectul căutat; poate fi folosit semnul „|” (bară verticală) în loc de OR;

NOT – exclude din căutare rezultatele ce conțin și un termen/ concept nedorit; poate fi folosit semnul „-” în loc de NOT (fără spațiu între simbolul minus și cuvînt cheie);

„” – șir – căutare doar în cadrul frazei. Termenii trebuie să apară în ordinea din frază, fără alte cuvinte între ele;

* – pentru identificarea unui cuvînt lipsă; se poate folosi pentru a obține rezultate conținînd variații de scriere și terminații diferite pentru cuvîntul cheie introdus; se recomandă folosirea a cel puțin 3 caractere înaintea inserării „*”; pentru rezultate mai bune e recomandată folosirea a încă unui cuvînt cheie specific;

În Google, pentru rezultate cît mai corecte este recomandată căutarea în trei moduri:

fără ghilimele: Prenume Nume

între ghilimele: „Prenume Nume”

între ghilimele cu * între cele două criterii: „Prenume * Nume” (caracterul * poate înlocui o eventuală inițială)

„+” – forțează Google să caute un anume termen; este folosit, de regulă, înaintea cuvintelor care sunt ignorate de Google (and, the, etc. = cuvinte STOP pentru Google); poate fi util cînd căutăm un anumit concept cu topic specific (fără spațiu între simbolul plus și cuvînt cheie).

De asemenea, Google oferă o legătură din memoria cache lîngă fiecare rezultat al căutării. Acesta este un lucru folositor în cazul în care paginile web sunt inaccesibile temporar de la serverul de Internet.

În interfața de căutare Google se scrie cererea operand urmat de site-ul, cuvîntul sau expresia folosită. Astfel, pentru a vizualiza o pagină aflată în cache-ul Google se va folosi expresia cache:adresa site. Poate fi folosit alături de un cuvînt sau o expresie pentru a sublinia aceste cuvinte în pagină.

Link – afișează popularitatea unei pagini; la introducerea acestui cuvînt se vor afișa paginile care conțin un link către pagina respectivă; se tastează link:adresa site (fără spațiu între operand și link).

Related – afișează site-uri legate de un anumit site, în general, prin tematică și conținut; se tastează related:adresa site.

Define – permite regăsirea unor definiții pentru cuvinte/ expresii; se tastează define:termenul vizat. Marea majoritate a definițiilor este extrasă din dicționare online, Wikipedia sau din surse academice.

Intitle/Allintitle – permite lansarea de căutări în titlul paginii web; se poate limita căutarea la conținutul titlului paginilor web; se tastează intitle: (allintitle:), urmat de cuvintele/expresii vizate. Google va returna paginile ce au în conținutul titlului cuvintele/expresii cheie folosite. Cu cît mai multe cuvinte cheie sunt folosite, cu atît rezultatele vor fi mai precise.

Inurl/Allinurl – face posibilă căutarea în URL-ul paginilor web; se poate limita căutarea la conținutul URL-ului paginilor web; se tastează inurl: (allinurl:), urmat de cuvintele/expresii vizate. Google va returna paginile ce au în conținutul URL-ului cuvintele/expresii cheie folosite.

Intext – se folosește pentru căutarea în textul paginilor web; se poate limita căutarea la conținutul text al paginilor web. Google va returna paginile ce au în conținutul text al paginii cuvintele/expresii cheie folosite.

Site – restrînge căutarea în cadrul unui anumit site/portal web/domeniu (de ex.: .com, .org, .edu); se tastează cuvîntul cheie urmat de „site:adresa site/domeniu”. Google va returna paginile din cadrul site-ului/domeniului vizat ce au în conținut cuvintele/expresiile cheie folosite. Cu cît mai multe cuvinte cheie sunt folosite, cu atît rezultatele vor fi mai precise. Se pot combina domenii distincte folosind operatorul OR (de ex.: cuvînt cheie site:domeniu1 OR site:domeniu2).

Filetype – permite căutarea unui anumit tip de fișiere; se introduce cuvîntul cheie vizat urmat de filetype: și se alege tipul de fișier; se pot realiza căutări după mai multe tipuri de fișiere simultan, folosind operatorii logici OR/AND. Google permite combinarea filtrelor de căutare pentru a rafina și mai mult rezultatele căutării; pot fi utilizate și funcțiile oferite de www.google.com/advanced_search.

Cele mai populare tipuri de fișiere indexate de Google:

Adobe Portable Document Format – .pdf;

Microsoft Word/Excel/PowerPoint – .doc(.docx)/.xls/.ppt;

Rich Text Format – .rtf;

Atom and RSS feeds – .atom, .rss;

Google Earth – .kml, .kmz.

Site-uri de traducere online

Foreignworld.com – resursă lansată în 2000, prin intermediul căreia utilizatorul se poate conecta la peste 170 de dicționare lingvistice online, ceea ce îi permite traducerea din aproximativ 65 de limbi;

WorldLingo – serviciu de traduceri online, cu o gama de 33 de limbi străine;

Babylon – utilitar de traducere cu actualizare automată și suport în diferite limbi, din categoria programelor descărcabile gratuit; traduce cuvinte și texte integrale în peste 75 de linbi, cuprinde cele mai cunoscute 2000 de dicționare;

Yahoo Babelfish – site de traducere online complex, poate efectua traduceri în și din aproximativ 15 limbi;

Reverso – portal gratuit de traducere online; oferă, contra-cost, soluții premium pentru PC, soluții de traducere în regim real-time pentru Intranet, precum și dicționare de specialitate în domeniile medical, informațional, business, nuclear, aerospațial, bancar etc.;

Systranet – site de traducere online cu variante ale programei pentru casă și oficiu; poate efectua traduceri în și din 52 de limbi; utilizează un motor hibrid de traducere, astfel încît software-ul învață automat din traducerile existente și validate; oferă peste 20 de dicționare specializate;

Promt – site de traducere online, poate efectua traduceri de texte,pagini web și aplicații pentru telefonie mobilă pentru 7 limbi europene de circulație (engleză, franceză, italiană, germană, portugheză, rusă, spaniolă);

Webforditas – site de traducere online, poate efectua traduceri de texte și pagini web în și din 50 de limbi.

Motoare de căutare bilingvă

2lingual.com – este un motor de căutare bilingv simplu de utilizat, dar robust din punct de vedere funcțional, ce permite căutarea simultană în două limbi. Este disponibil în două variante: 2lingual Bing Search, 2lingual Google Search, găzduind, totodată, și două instrumente de căutare bazată pe comenzi vocale: Google Multilingual Voice Search și Twitter Multilingual Voice Search (ambele în 51 de limbi). Utilizarea acestei resurse este extrem de facilă, utilizatorii au la dispoziție fie 37 de limbi (pentru Bing), fie 45 de limbi (pentru Google).

În caseta de căutare se introduce cuvîntul cheie/sintagma dorită, asemenea oricărui alt motor de căutare, se selectează perechea de limbi țintă și variante de căutare (Bing sau Google) și rezultatele sunt afișate aproape instantaneu, pe aceeași pagină, în două coloane distincte, amplasate alăturat – pentru limba țintă și pentru limba selectată realizării automate a traducerii cuvîntului cheie/sintagmei introduse la căutare.

2lingual dispune de opțiuni de căutare pe web, imagini, video, Wikipedia, bloguri și Twitter, dovedindu-se un instrument util pentru documentare, atît studenților, cît și specialiștilor din meniu academic.

Yamli – acest motor de căutare este o premieră în mediul virtual, dat fiind faptul că se focalizează pe soluționarea problemelor specifice pe care le ridică web-ul pe segmentul de limbă arabă. În prezent, acest site oferă două produse de bază: tastatura inteligentă pentru limba arabă și motorul de căutare Yamli destinat aceleiași limbi.

În timp ce tastatura inteligentă permite tastarea de cuvinte în arabă fără să fie necesară o tastatură cu caractere arabe, tehnologia avînd la bază un motor de transliterație în timp real, motorul de căutare se focalizează pe furnizarea unui număr mai mare de rezultate relevante pentru o căutare în arabă, oferind o gamă extinsă de rezultate cu reprezentările cu caractere latine cel mai frecvent folosite. Conținutul online în limba arabă și în dialectele acesteia apare sub două forme: scriere arabă și reprezentări fonetice ad-hoc în latină (alfabetul de chat în arabă).

Obținerea unor rezultate relevante cu ajutorul unui motor de căutare tradițional poate fi dificilă deoarece formularea căutării necesită încercarea a numeroase variații folosind caractere latine. Formula de căutare este trimisă către un motor tradițional, fiind returnat un număr mult mai mare de rezultate originale decît ar fi generat o căutare inițială.

Căutările efectuate cu ajutorul motorului Yamli sunt astfel redirecționate către Google pentru web și știri, către Wikipedia pentru căutări enciclopedice, Bing pentru căutare de imagini și YouTube pentru filme și căutări video.

Regăsirea de imagini și fișiere video în mediul virtual.

Regăsirea de imagini:

Google – principala funcție a motorului Google Images este căutarea de imagini în baza unui text introdus de către utilizator. Acesta poate să stabilească anumite filtre prin intermediul meniului de căutare avansată (dimensiunile imaginii, tipul acesteia, sursa) sau prin adăugarea/eliminarea/combinarea cuvintelor atribuite imaginilor căutate.

Cea de-a doua funcție a Google Images a fost dezvoltată inițial ca o aplicație destinată smartphone-urilor și permite ca, după fotografierea unui obiect, Google să ofere informații referitoare la conținutul pozei. În prezent, aceasta funcție de a căuta informații prin intermediul unei imagini este disponibilă și pentru PC. Concret, există posibilitatea de a încărca o poză din calculatorul personal sau de a introduce link-ul către o imagine existentă pe Internet, iar Google va returna în timp real date despre conținutul respectivei imagini, precum și site-uri cu imagini similare din punct de vedere vizual.

www.tineye.com – pe prima pagină a site-ului TinEye există două spații, unul destinat încărcării imaginii dorite din calculatorul personal, iar celălalt – introducerii unei adrese (link) către o imagine existentă. În urma căutării, aplicația va returna imaginile pe care motorul de căutare le consideră similare, împreună cu link-urile către aceste imagini, precum și link-urile către articolele sau paginile care conțin aceste imagini. Site-ul TinEye include și funcția de comparare a imaginii indicate de utilizator cu cele returnate de motorul de căutare.

www.flickr.com – are următoarele posibilități: se pot încărca fotografii direct pe Internet; imaginile pot fi făcute publice tuturor vizitatorilor sau doar grupurilor de prieteni; orice fotografie postată poate fi ușor editată online. Flickr are o hartă virtuală proprie, pe care se pot puncta zonele în care au fost făcute fotografiile.

www.corbisimages.com – este unul dintre principalii furnizori de resurse media vizuale pentru profesioniștii din media, marketing, publicitate și alte domenii, punînd la dispoziția acestora o selecție amplă de fotografii, ilustrații, fonturi etc.

Regăsirea fișierelor video:

Motoare de căutare online, precum Google, Bing sau Yahoo au integrat, de-a lungul timpului, și motoare de căutare și indexare pentru fișiere video. Pe lîngă acestea, pe Internet putem găsi și servicii de partajare și regăsire de fișiere video, denumite portaluri video, precum YouTube, Blinkx, Vimeo, Blip, LiveLeak, Videosurf, Truveo etc. Portalurile video se caracterizează prin organizarea materialelor video pe domenii și prin atribuirea de etichete fișierelor, lucru care facilitează organizarea și regăsirea de fișiere cu tematici conexe.

www.zuula.com – reprezintă o resursă foarte utilă de căutare a imaginilor, dar și a fișierelor video pe Internet. Rezultatele returnate au ca sursă principalele motoare de căutare și aplicații web de stocare a imaginilor (Google, Yahoo, Bing, Exalead, Flickr, Photobucket, SmugMug, Picasa, Stockxchng, Pixsy) și fișierelor video (YouTube, Yahoo, Google, Bing, Truveo, DailyMotion, Metacafe, Vimeo, Spike, Pixsy, ClipBlast).

Hărți.

Google Maps – acest serviciu asigură hărți stradale, opțiunea de a planifica trasee pentru deplasarea pedestră, cu mașina sau pentru transportul public de persoane. Imagini capturate de sateliții Google nu sunt actualizate în timp real, existînd întîrzieri care pot varia de la cîteva luni la cîțiva ani. În perioada dintre actualizări, imaginile pot suferi modificări sau pot fi trucate, pentru a ascunde anumite elemente de interes.

Google Earth – este un program de informare geografică, sub formă de glob virtual, dezvoltat inițial de către o companie înființată și finanțată de către CIA.

Bing Maps – oferă mai multe servicii precum vizualizarea străzilor, drumurilor, hărți 3D, direcții de circulație, de primblare și de tranzit.

Rețete sociale.

Potrivit unor experți, există șase tipuri diferite de social media sau comunități (rețele) online:

proiecte colaborative (ex.: Wikipedia);

site-uri ale rețelelor sociale (ex.: Facebook, Twitter, MySpace, Google+);

platforme de tip blog și micro-blog (ex.: WordPress, Blogger, Twitter);

comunități de conținut (ex.: YouTube, Flickr);

lumi virtuale pentru jocuri (ex.: World of Warcraft);

lumi virtuale sociale (ex.: Second Life).

Resurse utile în explorarea rețelelor sociale:

www.onlineschools.org/state-of-the-internet/soti.htm

vincos.it

www.alexa.com

www.websitespytraffic.com

en.wikipedia.org/wiki/Social_networks

www.topsy.ro

Regăsirea de date personale/de contact în mediul virtual, localizarea unor persoane după nume, nr. de telefon sau adresă de e-mail.

În scopul identificării unor date despre o persoană doar după nume, pot fi utilizate:

123People – este un motor de căutare care poate ajuta la găsirea diverselor informații în mediul virtual despre persoanele care au „lăsat urme” pe Internet: adrese e-mail, poze, videoclipuri, numere de telefon, pagini web, bloguri, clipuri video, documente, profile de social networking (MySpace, Twitter, Facebook, Wikipedia etc). Motorul de căutare „adună” toate informațiile referitoare la o anumită persoană (chiar și articolele care îi aparțin) și le afișează într-o singură interfață. Avantajul acestui motor – regăsirea persoanelor după username-uri.

Wink.com – funcționează prin căutarea profilelor pe MySpace, Bebo, Friendster, LinkedIn, Live Spaces dar se inspiră și din alte surse (ex. Google), dacă nu aveți profil pe serviciile respective. Wink oferă posibilitatea definirii, printre altele, a locației, școlii absolvite sau domeniilor de interes ale persoanei căutate.

Spokeo.com – afișează, contra-cost, vîrsta, adresa, poza cu locuința, veniturile anuale, fotografii, video, conturi pe rețele sociale, informații despre stilul de viață etc.

Isearch.com – este un motor de căutare după nume, număr de telefon sau adresă de mail, folosind aceeași metodă precum Wink.com, respectiv căutarea prin rețelele sociale. Rezultatele sunt de multe ori afișate prin intermediul serviciului „Intellius.com”.

Pipl.com – necesită introducerea numelui și prenumelui persoanei căutate, nr. de telefon sau username, indicînd profilurile de pe rețelele sociale, contul Twitter, site-ul personal al acesteia, adresa de e-mail și alte informații similare. Pipl.com caută inclusiv pe Google și images.google.com și aduce referirile cele mai importante într-o singură fereastră, de la prima căutare.

FaceSearch – este un motor de căutare a persoanei după nume. Introducînd numele persoanei, motorul va afișa mai multe imagini cu persoanele care au numele căutat. Accesînd imaginea, vom intra direct pe site-ul unde se află imaginea pe care am accesat-o.

NameChecklist – este un motor prin intermediul căruia pot fi obținute date referitoare la site-urile pe care este înregistrat un nume/pseudonim. După introducerea username-ului în cîmp dedicat, motorul online va efectua căutarea în mediul virtual, indicînd paginile web în care nickname-ul respectiv apare ca fiind înregistrat.

LinkedIn – este cea mai mare rețea de socializare profesională, disponibilă în mai multe limbi, cu peste 100 de milioane de utilizatori la nivel mondial.

Knowem – este un site care verifică în circa 340 resurse web, prin introducerea numelui de utilizator căutat. Serviciul arată inițial cele mai populare rețele sociale și conturile existente, dar se poate opta pentru afișarea listei complete cu site-uri. O dificultate în identificare o reprezintă situația în care o persoană folosește de fiecare dată un alt username.

yoName – este un site care poate fi folosit gratuit, însă are un număr limitat de site-uri suportate, iar căutarea nu returnează întotdeauna detalii complete asupra profilelor persoanelor căutate. Este însă foarte eficient în căutările după nume. Printre rețelele sociale pe care caută yoName se numără Bebo, Flickr, LinkedIn, HI5, Yahoo 360, Digg și Facebook.

Kabroo – este motor de căutare prin intermediul căruia se pot căuta CV-uri în format electronic, disponibil online.

WHOOZY (acum la adresa www.kgbpeople.com) – este un motor de căutare adresat strict căutării informațiilor despre persoanele ce își desfășoară în general activitatea pe Internet și au conturi pe diverse rețele sociale etc. Necesită introducerea numelui, prenumelui și, opțional, a locației din care provine persoana pe care dorim să o căutăm. Există posibilitatea de a alege între introducerea numelui și nickname-ului acesteia, ceea ce poate fi foarte util. Rezultatele sunt structurate în cinci secțiuni:

Social networks (Twitter, LinkedIn, Facebook, Myspace, Hi5, Netlog);

Search engines (Google, Yahoo, Bing, Wikipedia, Technoratti, Blogs, Cuil);

Photo/Video/Audio (Google Images, Flickr, YouTube, Vimeo și LastFM);

Personal (documente, nume, profiluri, eventual adrese de e-mail sau taguri referitoare la persoana vizată);

Profiles (conturile deschise de persoane cu numele căutat pe Whoozy; va returna informațiile publice personale ale acestora).

Identificarea unor date despre o persoană doar după adresa de e-mail

Whois.com – este un serviciu care permite aflarea unor detalii despre un domeniu, precum: providerul de la care s-a cumpărat domeniul, deținătorul lui (Registrant), diverse date de contact: administrativ, tehnic, de zonă, cînd a fost creat/cumpărat domeniul și cînd expiră, care sunt serverele utilizate.

Reverse whois – dacă se cunoaște un nume, o adresă de mail, număr de telefon sau orice alte date de identificare, pot fi vizualizate domeniile deținute vreodată de o companie sau de o persoană.

EmailFinderPro – este unul dintre cele mai eficiente motoare de căutare a adreselor de e-mail, care folosește ca sursă rețelele sociale. Caută informații concomitent pe site-uri ca Flixster, Friendster, HI5, Ringo, Twitter sau Flickr, generînd o singură pagină cu informații detaliate și chiar poze, în cazul în care persoana respectivă a încărcat imagini pe vreunul dintre aceste site-uri. Serviciul acoperă majoritate rețelelor sociale și, în cazul în care e-mailul respectiv a fost folosit pentru a înregistra un cont pe oricare dintre aceste site-uri, acesta va culege automat informația.

EmailSearch – permite căutarea după o adresă veche de mail, după compania la care lucrează persoana căutată.

Identificarea unor date despre o persoană doar după numărul de telefon

International Numbering Plans – este serviciul specializat în furnizarea de informații și baze de date cu privire la alocarea și localizarea numerelor de telefon. Serviciul oferă, în principal, instrumente de căutare și analiză online și chiar posibilitatea de a descărca, din bazele de date proprii, informații referitoare la numerele de telefon la nivel internațional, rețelele de telefonie mobilă, telefoane mobile sau rețele internaționale. Site-ul oferă următoarele posibilități: analiză a numerelor de telefon, servicii de telefonie online, descărcare de baze de date specifice.

NumerWay – oferă informații detaliate cu privire la posesorul unui număr de telefon, locația acestuia și alte date de identificare.

INTELIUS – serviciul de reverse search, care, pornind de la un număr de telefon, poate identifica persoana căreia îi aparține, precum și date despre aceasta.

Inmarsat – este site-ul specializat în domeniul serviciilor de telefonie/fax pentru nave maritime și aeronave precum și al transmisiunilor de date de bandă largă prin terminale mobile.

Căutarea pe forumuri, bloguri și microbloguri.

Printre cele mai cunoscute aplicații de micro-blogging se numără Twitter (peste 160 de milioane de utilizatori înregistrați), Identi.ca, Tumblr, Plurk, Edmondo.

Pentru căutarea discuțiilor de actualitate pe forumuri, se recomandă, printre altele, utilizarea unui motor de căutare pentru forumuri. Acestea pot fi căutate mai exact în funcție de termeni și teme de discuții pe forumuri și (micro)bloguri.

Se recomandă următoarele pagini:

www.whostalkin.com – site-ul are o vastă căutare în bloguri, știri, video, forumuri și în funcție de tag-uri;

www.omgili.com – motor de căutare în forumuri cu filtre ce permit obținerea unor rezultate cît mai apropiate de subiectul de interes;

www.boardreader.com – site-ul are o prezentare forte clară și o căutare bună a temelor;

v2.boardtracker.com.

Pentru căutarea informațiilor pe bloguri sunt recomandate resursele:

Technorati – este un serviciu de agregare a blogurilor, care adună articole din peste 1 milion de surse. Cea mai importantă caracteristică a sa este aceea că organizează blogurile într-un director cu mai multe domenii principale, fiecare dintre acestea fiind, la rîndul său, împărțit în mai multe subdomenii. Aceasta facilitează filtrarea materialelor la căutări și regăsirea celor care prezintă interes. O altă facilitate importantă este indexul alfabetic al celor mai populare etichete folosite pe site pe parcursul ultimelor 30 de zile.

Technorati beneficiază, de asemenea, de posibilitatea de generare de fluxuri de sindicalizare RSS pentru fiecare termen căutat. O caracteristică importantă a blogurilor este că, alături de titlu, este afișat și numărul total de comentarii postate pentru respectivul material. Utilizatorii care se autentifică pot posta comentarii sau lansa teme de discuție referitoare la subiectul materialului respectiv.

Cea mai utilă trăsătură a acestui serviciu este aceea că, pe lîngă bloguri pe tematica principală, mai sunt prezentate și diferite statistici, grafice și tabele specifice, precum și știri importante sau alte bloguri cu tematici conexe. Alte caracteristici care facilitează regăsirea materialelor sunt sistemul de etichete aferente materialelor postate, arhiva blogului pe tematica selectată și posibilitatea abonării la fluxuri RSS.

Motoarele de agregare a știrilor.

Procesul de colectare a informațiilor/știrilor de actualitate sau pe tematică de interes evidențiază importanța instrumentelor de agregare în limitarea eforturilor de identificare a datelor recente pe un anumit spațiu/problematică.

Actualmente, în Web sunt prezente următoarele tipuri de site-uri de știri:

rețele și site-uri de știri – surse primare, care pot prelua și articole postate de către alte site-uri;

agregatoare de știri – pentru colectarea unor noi articole de știri din surse multiple;

site-uri ale publicațiilor – în fapt, variantele online ale unor ziare, reviste;

site-uri ale posturilor de radio și ale televiziunilor;

motoare multisursă de căutare de știri – oferă posibilități extinse de căutare pentru o gamă variată de resurse de știri.

Agregatoare de știri pun la dispoziția utilizatorului următoarele categorii de facilități:

servicii specializate se știri – concentrate pe știri dintr-un anumit domeniu de interes;

servicii de alertare – oferă o selecție personalizată a știrilor recente.

Cele mai utilizate cataloage de resurse media și agregatoare de știri:

abyznewslinks.com – este un serviciu specializat de știri, organizat pe spații geografice. Cuprinde liste primare de ziare, precum și din ce în ce mai multe transmisiuni TV, servicii Internet, reviste și agenții de presă. Accesarea se realizează prin intermediul linkurilor, majoritatea rezultatelor fiind în limba engleză.

www.allyoucanread.com – este un director media ce cuprinde aproximativ 25 de mii de reviste și ziare din peste 200 de state. Încadrarea știrilor se realizează atît în funcție de țara de origine, cît și de topică (artă, afaceri etc.).

www.kidon.com/media-link – are în portofoliu linkuri către aproximativ 20 de mii de ziare și alte resurse de știri din aproximativ toate statele, cu indicarea tipului de resursă și a limbii.

www.mondotimes.com – este un serviciu online ce include 33 de mii de surse media din aproximativ 200 țări.

www.newspapers.com – este un index de publicații online din 216 țări și regiuni.

www.newspapers24.com – este un ghid/director gratuit cu ziare din fiecare țară.

www.onlinenewspapers.com – conține 10 mii de ziare, accesate pe țară și în funcție de publicație.

www.world-newspapers.com – director de ziare, listate după țări și regiuni, precum și după domenii de interes.

Serviciile unor agregatoare de știri pot fi evaluate în timp, pe baza unei ponderări a rezultatelor, în consonanță cu interesul specific al utilizatorului.

Tipuri de produse OSINT

Intelligence-ul ca produs, conform Doctrinei naționale a informațiilor pentru securitate, este considerat un rezultat al activității de procesare (producere) a informațiilor pentru securitate, obținut de către structuri analitice specializate, materializat și individualizat în documente și forme de evidență specifice și destinat factorilor decizionali stabiliți de lege. Acest produs se poate prezenta sub formă de:

buletine de informare – elaborate periodic;

sinteze informative – prin integrarea unui lot de informații;

note – în baza uneia sau a mai multor informații, prin care se semnalează aspecte esențiale ale unui fapt, fenomen, eveniment;

alte tipuri de documente de informare.

Primul pas în vederea realizării unor produse din surse deschise este cel al prelevării informațiilor relevante pentru atingerea obiectivelor propuse. Acesta este un proces complex ce presupune o prelucrare primară a informațiilor, prin intermediul următoarelor activități succesive: comparare, completare, rezumare, catalogare și indexare.

Prin comparare, se urmărește surprinderea elementelor de noutate, prin punerea față în față a două sau mai multe conținuturi informaționale vehiculate de una sau mai multe surse, pentru a detecta ce este diferit de datele deja existente, în vederea evitării redundanțelor.

Completarea constă în întregirea unor date existente cu elemente de noutate, identificate în faza de comparare, cu menționarea sursei de unde a fost extras fragmentul complementar.

Rezumarea este procedeul prin care, dintr-un material selectat, se rețin doar ideile principale, expuse în ordinea în care apar în text. În fine, catalogarea și indexarea se realizează potrivit unor criterii de natură a facilita operațiunea de căutare cu elemente de identificare obligatorii.

Elementele circumscrise unei teme se prelucrează unitar, specificându-se similitudinile și diferențele în modul de prezentare în sursele deschise a subiectului avut în atenție, după care informația este stocată în baza sau bazele de date specifice.

În general, datele obținute din surse deschise trebuie să răspundă, prin conținutul și/ sau natura lor, următoarelor criterii: să fie prelevate într-o ordine stabilită potrivit priorităților; să fie utile sau, în timp, să se dovedească a fi utile pentru satisfacerea cerințelor de cunoaștere necesare realizării obiectivelor propuse; să cuprindă măcar unul din răspunsurile la întrebările cine?, ce?, când?, unde?, de ce? , cum?; să nu cuprindă ambiguități, aspecte redundante și elemente nerelevante, care nu răspund la niciuna din întrebările menționate și nu transmit nici o atitudine; să nu fie trunchiate, sens în care se va urmări: menționarea cu precizie a relațiilor între persoane, atribuirea corectă a citatelor, selecționarea cu fidelitate a datelor de context, pentru a nu amalgama, în același text, informarea cu opinia; să nu fie scoase din context; să surprindă atitudinea autorului față de problema sau tema generală abordată în cadrul unor comentarii/ editoriale/analize; să fie redactate cu claritate și acuratețe pentru a reda corect gramatical și cu exactitate textul prelevat, precum și numele, datele calendaristice, cifrele, unitățile de măsură, termenii de specialitate; să conțină elemente de identificare a sursei deschise din care au fost obținute.

Experiența analitică a structurilor de intelligence identifică trei posibile dimensiuni ale unei activități de informații eficiente. Aceste dimensiuni sunt reflectate prin realizarea de:

diagnoze – radiografierea unei situații sau a unui fapt;

avertizări timpurii – anticiparea impactului unor evenimente;

evaluări strategice – identificarea aspectelor strategice și a implicațiilor ce țin de natura obiectului supus analizei.

Cele trei dimensiuni sunt acoperite de principalele tipuri de produse obținute în cadrul activității de exploatare a surselor deschise, prezentate în tabelul de mai jos: buletinul de informare, nota, sinteza și analiza. (Tabelul 4). Coerență, consistență, acuratețe și operativitate sunt calitățile principale pe care trebuie să le îndeplinească toate cele patru tipuri de materiale.

Tabelul 4 – Tipuri de produse OSINT

Factorii care influențează procesul de furnizare și diseminare a informațiilor

La furnizarea și difuzarea datelor din surse deschise, trebuie luate în considerare:

Clasificarea. La analiza datelor brute, este necesar de a crea și distribui informații la cel mai scăzut nivel de clasificare pentru ca aceasta să fie distribuită unui număr cât mai mare de personal. La întocmirea rapoartelor, poate fi utilizat formatul «tearline» (linia restrictivă) pentru a separa informații clasificate și neclasificate pentru utilizatori care lucrează în rețele cu diferite niveluri de securitate. Instituțiile sau angajații responsabili de stabilirea parafei de secretizare trebuie să ofere unităților subordonate și personalului ghidul privind clasificarea nivelurilor de securitate și reguli de utilizare a datelor și informațiilor obținute din surse deschise.

Dezvoltarea unui mecanism de feedback. Poșta electronica, adrese poștale, sistemele de rating și sondaje sunt mecanisme care pot fi utilizate de angajați din domeniul OSINT pentru a înțelege cerințele de informare a beneficiarului.

Identificarea (definirea) proprietății intelectuale. Este necesar de a stabili informațiile care sunt protejate prin drepturi de autor, patente sau care au marca comercială a diferitor

organizații. Procesul activității OSINT nu se referă la vânzare, import sau export de proprietate intelectuală. Angajați din domeniul OSINT trebuie să indice toate sursele utilizate în

raport și la diseminarea acestor informații. În cazul de incertitudine angajații trebuie să consulte conducerea, înainte de a distribui informații irelevante.

Folosirea metodelor existente de distribuire a informațiilor (după posibilități). Dezvoltarea noilor metode de diseminare a informațiilor poate complica uneori procesul de utilizare a metodelor existente.

Complexități analitice. Analiștii trebuie să înțeleagă că există dificultăți la întocmirea rapoartelor și diseminarea informațiilor publice de intelligence. Greșeli în formă de eroare (omiterea informațiilor importante și previziuni) sunt comise, de obicei, întâmplător, însă, uneori, ele sunt folosite în scopul convingerii sau înșelăciunii. Analiștii, de asemenea, ar trebui să fie informați despre generalizări pripite, motive false, utilizarea incorectă de analogi și limbajuri (culturale, personale, organizaționale, cognitive) și evaluarea evenimentelor. 

Factori și elemente care influențează asupra procesului de utilizare a informațiilor obținute din surse deschise:

Deep Web – domeniul necunoscut al surselor deschise.

Deep Web prin prisma funcției strategice ale OSINT

1 Conținutul Internetului este mult mai divers și volumul lui, cu siguranță, este mult mai mare decât cel perceput de obicei.

În primul rând, deși uneori folosit ca sinonim, World Wide Web (protocolul HTTP) este doar un subset de conținut al Internetului. Alte protocoale de Internet, în afară de Web, includ FTP (File Transfer Protocol), e-mail, știri, Telnet, și Gopher (cel mai proeminent dintre protocoale pre-web). 

În al doilea rând, chiar și în contextul strict de Web, majoritatea utilizatorilor își conștientizează doar conținutul care le este prezentat prin intermediul motoarelor de căutare, cum ar fi Excite, Google, Bing, AltaVista sau NorthernLight , sau directoarelor de căutare, cum ar fi Yahoo!, About.com sau Looksmart . Circa 85 la suta dintre utilizatori ai Web-ului folosesc motoarele de căutare pentru a găsi informații necesare, însă un procent aproape la fel de mare menționează incapacitatea motoarelor de a găsi informații dorite.

Importanța colectării informațiilor pe Web, rolul central și de necontestat al motoarelor de căutare, precum și frustrările exprimate de către utilizatori în privința caracterului adecvat al acestor motoare, evidențiază importanța studierii modului de exploatare a acestui domeniu.

Companiile noi, activitatea cărora se bazează în Internet, aleg Web-ul ca mediu preferat pentru comerț și transfer de informații.

Web-ul de suprafață conține aproximativ 3 miliarde de documente cu creștere de circa 7,5 milioane de documente pe zi. Însă motore tipice de căutare sunt limitate în posibilitățile sale. Conținutul identificat este doar ceea ce apare la suprafață, iar o valoare extraordinară se află mai adânc. Informația este acolo, însă se ascunde sub suprafața Web-ului.

Astăzi, nimeni nu și-ar putea imagina viața, activitatea fără web sau Internet, fără email, fără acces la ultimele știri, fără rapoarte meteo live, fără cineva sau ceva care să ofere răspunsuri la toate întrebările. Iar termenul Google a devenit un cuvânt substantiv și/sau verb comun, făcînd parte din viața, munca și distracția noastră. Cea mai mare parte a informațiilor din viața de zi cu zi o accesăm din web, via Internet. Utilizăm tot felul de dispozitive inteligente, PC-uri, smart-phone, laptopuri, tablete pentru a obține informațiile de care avem nevoie sau pentru a comanda la distanță dispozitivele de acasă. Webul este o pseudo-entitate incredibil de mare, complicată, complexă și în permanentă extindere.

Majoritatea persoanelor care folosesc internetul ca sursă de informare apelează la motoarele de căutare, însă există site-uri care nu sunt indexate. În mod uzual, când căutăm o informație după cuvinte cheie, ne așteptăm ca motorul de căutare să ne ofere, având în vedere dimensiunea webului, un răspuns plin de semnificații, complet și edificator.

Motoarele generale de căutare au indexate câteva miliarde de pagini web în bazele lor de date (18 miliarde în cazul Google), dar nici măcar unul nu acoperă toate siteurile și/sau paginile existente în spațiul cybernetic. Nici un motor nu poate indexa întregul web. Și asta nu numai din cauza imensității sale, ci și din cauza proprietarilor siteurilor, care din diverse motive au restricționat acest lucru.

Potrivit lui Mike Bergman, fondatorul site-ului BrightPlanet, “navigarea pe Internet în ziua de azi poate fi asemănată cu întinderea unei plase de pescuit la suprafața oceanului. Deși s-ar putea să prindă multe lucruri, bogăția de informații, ascunse în adâncuri, va fi ratată”.

Motorul de căutare Google stochează informații despre câteva trilioane de pagini web, iar o simplă apăsare de buton ar putea întoarce informații despre oricare dintre acestea, în mai puțin de o secundă. Oricât de impresionante ar părea aceste cifre, specialiștii afirmă că partea uimitoare a Internetului se află ascunsă mai adânc și conține paginile care nu sunt indexate de motoarele de căutare clasice. „The New York Times” afirmă că aceste pagini conțin date importante și sensibile, cum sunt informațiile financiare, rapoartele medicale sau programele de zbor.

În fiecare moment, motoarele de căutare indexează mii de pagini web, extrăgând cuvinte cheie, fragmente de text ce ar putea fi relevante, ulterior punându-ni-le la dispoziție atunci când le solicităm. Asemeni plaselor de pescuit, web crawlers (roboți de căutare) căută doar acolo unde ajung sau unde le este permis: la suprafață. Pentru informare, în sensul larg al conceptului, această „suprafață” poate reprezenta sufucient. Dar pentru instituțiile care doresc informație sub formă de intelligence, ceea ce este cu adevărat util se află „la mare adâncime”, în ceea ce este recunoscut ca fiind „Deep Web”.

Business Insider aseamănă Internetul cu un aisberg. Partea de suprafață, numită și Internetul vizibil, reprezintă în jur de 4% din volumul total de informații. Această zonă este accesată de utilizatori simpli în fiecare zi, prin motoare de căutare ca Google sau Yahoo și este supravegheată constant de autorități.

Partea de adâncime, Internetul invizibil, ascuns, sau întunecat (deep, dark, hidden Web), este zona care nu este indexată de motoarele de căutare și este greu de urmărit și de analizat. Pentru că nu există date clare despre aceasta, estimările referitoare la dimensiunile exacte variază foarte mult. Conform unelor aprecieri, partea invizibilă a Internetului ar reprezenta 96% din volumul total și poate fi de 500 de ori mai mare decît volumul Internetului vizibil.

Trebuie să înțelegem foarte clar că paginile din Deep Web nu sunt ilegale. În mod normal, motoarele de căutare tradiționale indexează și explorează conținuturile paginilor statice sau a celor legate de cele statice. Deoarece web crawlers ale motoarelor generaliste nu pot pătrunde dincolo de suprafața web-ului, o mare parte din acesta rămâne ascuns marelui public neavizat. Sursele Deep Web-ului înmagazinează baze de date care conțin rezultate dinamice, disponibile la o solicitare directă, a URL-ului paginii. Există tehnologii/softuri care realizează automat o multitudine de solicitări directe utilizând tehnologia canalelor multiple și astfel reușește să identifice, extragă, evalueze, clasifice și organizeze atât deep web, cât și surface web.

Resursele Deepweb sunt:

Site-uri care au pagini cu conținut dinamic, care nu pot fi indexate de motoarele de căutare obișnuite. Aceste pagini pot fi acceste în special de cei care cunosc conținutul domeniului/paginii;

Pagini care nu sunt conectate la altele prin backlinks/inlinks, fapt care împiedică web crawlers să le acceseze conținutul în vederea indexării;

Site-uri private care necesită înregistrare sau logare;

Site-uri contextuale, care conțin pagini cu conținut variabil, determinat de contextul în care sunt accesate, depinzând de clasa de IP-uri a clientului sau de secvența e navigare precedentă;

Site-uri cu acces limitat, datorat fie necesităților de confidențialitate impuse de posesori, fie de limitările legale privind accesul la conținut (ale producătorilor de tutun, alcool etc.);

Site-uri care au programe anti-crawler (Robots Exclusion Standard, CAPTCHAs), ai căror posesori nu sunt interesați de indexarea lor de către motoarele de căutare;

Pagini cu conținut non-HTML sau text, codate în fișiere de tip multimedia sau formate nesuportate de site-urile de căutare;

Pagini cu continut criptat ce sunt accesibile doar prin link-uri de JavaScript, dar și alte continuturi dinamice descărcate de pe serverele web, via Flash sau AJAX;

Pagini text care utlizează Gopher protocol și fișiere găzduite pe FTP.

Capacitatea sau mărimea Deep Web este imensă, în raport cu cel de suprafață, următoarele date fiind edificatoare:

60 dintre cele mai mari siteuri din Deep web conțin mai mult decât întreg conținutul disponibil la suprafață;

Volumul de informații publice stocate este de 400 până la 550 de ori mai mare decât cea din web-ul indexabil/de suprafață;

Deep web ar conține 7,9 zettabytes de informație, comparabil cu cei 19 terrabytes de la „suprafață”;

Conține peste 550 miliarde de documente individuale față de cele 2 până la 18 miliarde indexate la suprafață;

Mai mult de 200.000 de site-uri sunt în Deep Web;

În medie, site-uri din deep Web primesc cu cincizeci la sută mai mult trafic lunar și sunt mai puternic legate între ele, în comparație cu site-uri de suprafață; cu toate acestea, site-uri tipice ale deep Web nu sunt bine cunoscute utilizatorilor;

Deep Web este cea mai mare categorie, ce permanent crește, a noilor informații;

Site-uri deep Web tind să fie mai înguste, cu un conținut mai profund;

Aproximativ 95 la sută din conținutul deep Web-ului sunt informații accesibile în mod public, care nu fac obiectul unor taxe sau abonamente.

Mai mult de jumătate din conținutul Deep Web constă în baze de date structurate pe subiecte specifice.

1 Deep Web-ul este aproximativ de 500 de ori mai mare decât Web-ul de suprafață. Calitate totală a deep Web-ului depășește pe cea a Web-ului de suprafață de mii de ori. Numărul total de site-uri deep Web depășește, astăzi, 200.000 și este în creștere rapidă. Deep Web pare a fi o componentă de informații cu cea mai rapidă creștere de pe Web.

Conținut deep Web-ului are unele diferențe semnificative față de conținutul celui de suprafață. Documentele Web-ului în profunzime (mărime medie-19,7 KB) sunt în medie cu 27% mai mici decât documentele web-ului de suprafață. 

1 În medie, un site „ascuns” primește aproximativ cu 50 % mai mult trafic lunar, în comparație cu site-ul de suprafață (123.000 vizualizări de pagină lunar vs 85.000). Site-uri deep Web-ului sunt mai puternic legate între ele decît cele de suprăfață (6200 de link-uri vs 3700 de link-uri). În același timp, site-uri bine-cunoscute în deep Web sunt foarte populare, însă site-ul tipic, care poate să conțină și mai multe informații de valoare, nu este deloc cunoscut publicului.

Se consideră că 97,4% din site-uri deep Web se află la dispoziția publicului fără restricții; circa 1,6% sunt mixte (rezultate limitate sunt disponibile publicului, iar rezultate mai valoroase necesită abonament și/sau plata taxei); numai 1,1% din rezultate sunt în totalitate limitate prin abonament sau taxe. 

1 "Calitatea" este subiectivă: dacă obținem rezultatele dorite, ele sunt de înaltă calitate, dacă nu, nu există nici o calitate.

Pentru căutarea informațiilor/documentelor în Internet, există o probabilitate de aproximativ trei ori mai mare de a obține rezultate calitative în deep Web, decît în cel de suprafață. De asemenea, cercetările din domeniul arată că site-urile deep Web tind să întoarcă cu 10% mai multe documente.

Există multiple posibilități de căutare în Deep Web, care au ca scop numai identificarea de resurse, utilizabile dintr-un browser obișnuit. O caracteristică aparte este că nu sunt motoare generaliste, ci specializate, pe domenii de căutare: biblioteci, baze de date, jurnale electronice, cataloage online, articole și alte surse.

Cele mai semnificative sunt:

Infomine, Virtual Library, Intute (numai pentru Anglia) – biblioteci universitare;

Infoplease – enciclopedii, almanahuri, atlase și biografii;

DeepPeep – auto, aviație, cărți, biologie, hotel, locuri de muncă și închirieri;

TechXtra – inginerie, IT și matematică;

Scirus – destinat oamenilor de știință, indexează jurnale, site-uri ale oamenilor de știință, note de curs sau alte materiale similare;

DeepWebTech – știință, medicină și oameni de știință.

Această formă de navigare pe Internet este complet legală. Numărul utilizatorilor care vor ca activitatea lor să rămână anonimă a crescut, partea ascunsă a Internetului fiind folosită de jurnaliști, de persoanele care vor să facă publice informații secrete, cum sunt Edward Snowden sau Julian Asange și, evident, de autorități.

Din ce în ce mai utilizat pentru navigare în Deep Web devine browserul TOR (The Onion Router). Acesta este un program gratiut care creează o rețea deschisă prin care poți naviga relativ anonim, fără a fi înregistrat. De remarcat că această rețea este utilizată și în cazul derulării unor convorbiri sau transmisii de date cu caracter confidențial. Softurile ca TOR împart și direcționează traficul printr-o rețea anonimă mondială, iar rezultatele nu sunt accesate de la o singură sursă, ci prin intermediul tuturor calculatoarelor online care dețin informația căutată, traficul fiind astfel mult mai greu de urmărit și de detectat. Utilizarea acestui browser nu este ilegală.

Există indicii care atestă că dezvoltarea acestei rețele paralele a fost susținută, la momentul creeri sale, de către Oficiul pentru Cercetare Navală din SUA pentru a sprijini agenții aflați în misiuni sub acoperire să depășească „firewall”-urile sau alte forme de cenzură.

Din cauza anonimității pe care o oferă softurile ca TOR, partea ascunsă a Internetului a început să fie folosită pentru activități ilegale, de genul traficului de droguri și de arme, a pornografiei infantile sau chiar a asasinatelor la comandă. De asemenea, Tor se folosește pentru a accesa anonim rețelele sociale, jocuri online.

„Silk Road” (Drumului Mătăsii), unul dintre cele mai populare site-uri din Internetul invizibil, a devenit cunoscut ca o resursă online de vânzare a bunurilor ilegale. Dezvoltat inițial ca o platformă pentru vânzări și cumpărări, anonimitatea oferită de programele necesare accesării, a transformat Silk Road într-un magazin online pentru droguri, arme, bancnote false, produse pornografice, etc. Această resursă, precum și alte resurse ale Dark Netului legate de vânzare de droguri, prostituție, pedofilie, etc., crește extrem de rapid. Pentru anonimizarea tranzacțiilor, pe baza facilităților oferite de acest site, a fost creată și dezvoltată o monedă virtuală, greu de urmărit, Bitcoin.

Legătura dintre bitcoin și Silk Road devine evidentă atunci când analizăm cotația monedei, în paralel cu activitatea site-ului. În 2011, la o lună după deschiderea Silk Road, valoarea bitcoin a crescut de trei ori, iar când Senatul Statelor Unite a început să investigheze legătura dintre cele două, valoarea monedei a scăzut cu 90%. În octombrie 2013, FBI a închis site-ul și l-a arestat pe cel care l-a fondat, însă o nouă versiune a fost lansat peste mai puțin de o lună, făcând moneda bitcoin să-și tripleze valoarea. În februarie 2014 site-ul a fost din nou închis, dovadă a faptului că autoritățile și-au perfecționat lupta împotriva criminalității organizate în cyberspace. În prezent însă, prin intermediul Tor-ului poate fi găsită o versiune nouă a site-ului plasată pe un URL nou.

1 Problema calității informațiilor este destul de actuală. Furnizarea răspunsurilor dorite a fost întotdeauna o problemă pentru Web-ul de suprafață, și fără tehnologia adecvată va fi și o problemă pentru Web-ul în profunzime. Căutări eficiente ar trebui să identifice informațiile relevante dorite și să le prezinte în ordinea relevanței – calitate. 

Site-uri Deep Web nu pot fi un factor critic in descoperirea informațiile dorite, însă pot îmbunătăți rezultatele de 600 de ori.

O posibilitate interesantă a Deep Web este că site-urile individuale pot stabili de sine însuți autoritatea. Motoarele de căutare, din cauza principiului lor de „nediscriminare”, nu determină veridicitatea acetor aprecieri. Direcționînd interogarea la surse Deep Web, utilizatorii pot alege site-uri „autoritare” și pot face propriile determinări de calitate.Asftel trebuie să fim atenți în selectarea site-urilor.

Ce ascunde Deep Web și cum poate fi exploatat

Există o mulțime de informații, care se află la adîncime și, prin urmare, poate fi scăpată. Motivul este simplu: cele mai multe informații de pe Web sunt stocate pe site-uri generate dinamic și motoarele de căutare standarde nu-i găsesc.

Pentru a fi descoperită de motoarele de căutare tradiționale, pagina trebuie să fie statică și legată de alte pagini. Motoarele de căutare tradiționale nu pot "vedea" sau prelua conținut în deep Web – aceste pagini nu există până când ele sunt create dinamic. Deoarece crawlerii nu poate sonda sub „suprafața”, deep Web-ul a fost până acum ascuns.

Web-ul în profunzime diferă, din punct de vedere calitativ, de la cel de suprafață. Conținutul surselor deep web se stochează în baze de date care produc rezultatele doar în mod dinamic, răspunzând la o solicitare directă. Actualmente, apar tehnologii de căutare care automatizează procesul de punere a zeci de întrebări directe simultan și, astfel, sunt capabile de a identifica, recuperarea, califica, clasifica și organiza conținutul web-ului "de suprafață "și "în profunzime".

În cazul în care produsul cel mai valoros în epoca de informare, pe care o trăim, este într-adevăr informația, atunci valoarea conținutului Web-ului în profunzime este incomensurabilă.

În mod evident, căutarea simultană pe suprafață Web-ului și în deep Web este necesară atunci când avem nevoie de a regăsi informații complete.

Baze de date căutate: Ascuns Valoarea pe Web

2 În primele zile de la apariție Web-ului, au fost relativ puține site-uri și postarea documentelor pe pagini statice era o sarcină rezolvabilă. Deoarece toate paginile au fost persistente și disponibile în mod constant, acestea puteau fi accesate cu ușurință de către motoarele de căutare. 

Începînd cu anul 1994, rata de creștere a documentelor Web a fost mai mult de 200% anual.

Se poate de spus că ceea ce nu poate fi văzut, nu poate fi definit și ceea ce nu este definit, nu poate fi înțeles. Un asemenea caz se referă la importanța conținutului bazelor de date de pe Web.  De asemenea modalitatea mai veche de „crawling” a paginilor Web statice nu se mai aplică, în prezent, la conținutul informațiilor pe Internet.

În 1994, Dr. Jill Ellsworth a inventat expresia "web invizibil" pentru a se referi la informații, care au fost "invizibile" pentru motoarele de căutare convenționale.  Importanța potențială a bazelor de date a fost, de asemenea, reflectată în primul site de căutare dedicat acestora – motorul AT1, anunțat la începutul anului 1997.

Însă termenul de "Web invizibil" nu este destul de exact. Singurul lucru "invizibil" este că bazele de date nu sunt nici indexabile, nici nu pot fi interogate de către motoarele de căutare convenționale. Dacă se identifică locul da aflare a bazelor de date căutate, o interogare orientată poate fi utilizată pentru a colecta rezultate dorite.

Tehnologii noi de căutare permit să ajungem la informații din Deep Web și să aducem rezultatele la suprafață. Însă doar o mică parte a Web-ului este accesibilă prin intermediul motoarelor de căutare.

Foarte puțin este scris sau cunoscut despre deep Web. Ca orice fenomen nou descoperit, el este doar definit și înțeles. Pentru a studia domeniul Deep Web este necesar de a:

Cuantifica dimensiunea și importanța deep Web-ului ;

Caracteriza conținutul de calitate și relevanță a deep Web-ului pentru solicitanții de informații ;

Descoperi mijloace automate de identificare a site-urilor de căutare în deep Web ;

Începe procesul de educare a utilizatorilor Internetului cu privire la acest depozit de informații ascunse și valoroase.

În general, în deep Web pot fi găsite următoarele bazele da date :

Baze de date pe anumit subiect – acumularea informațiilor din domenii specifice, cum ar fi baze de date medicale, înregistrările de brevet, etc.

Site-ul intern – baze de date cu paginile interne ale site-urilor mai mari, care sunt create dinamic.

Publicații – baze de date de articole actuale și arhivate.

Shopping / Licitații.

Anunțuri.

Portaluri – site-uri mai largi, care includ mai mult decît una din aceste categorii în baze de date.

Biblioteca – dețineri interne, mai ales biblioteci universitare.

Pagini de aur și albe – căutarea oamenilor și afacerilor.

Calculatoare – nu sunt strict baze de date, însă merită a fi incluse în căutarea (calculatoare ipotecare, dicționare și traducători online).

Locuri de munca – postări de locuri de muncă și CV.

Mesaj sau Chat.

Căutare generală – baze de date cele mai relevante pentru căutarea subiectelor și informațiilor pe Internet.

2 De exemplu, șaizeci dintre cei mai cunoscuți site-uri din deep Web conțin date de aproximativ patruzeci de ori mai mare decât a Web-ului de suprafață. Aceste site-uri apar într-o gamă largă de domenii ca știință, dreptul, comerț etc. și, în mare majoritate, pot fi accesate gratuit. (vezi Tabelul 2 din anexa). Această listă este preliminară și incompletă, deoarece numărul de site-uri Web-ului în profunzime se modifică permanent. Una dintre particularități ale acestui tip de site-uri este că nu există nici o limită pentru creșterea dimensiunii acestora.

Potrivit unor certări în domeniul, deep Web-ul are următoare distribuție uniformă a conținutului:

În funcție de tipul de conținut site-uri de pe deep Web sunt distribuite conform următoarei diagrame:

Mai mult de jumătate din toate site-urile deep web-ului conțin baze de date pe anumite subiecte. Baze de date pe subiecte, site-uri interne mari și publicațiile arhivate alcătuiesc aproape 80% din toate site-urile Web-ului în profunzime. Site-uri de comerciale și de tranzacții – inclusiv licitații si anunțuri – fac încă 10% din site-uri. Celelalte opt categorii reprezintă în mod colectiv cele 10% rămase de site-uri.

Motoare de cautare, bloguri și agregatoare de știri reprezintă metode de accesare a Webului "invizibil" sau Deep Web. Motoarele de căutare actuale găsesc sute de miliarde de pagini, la ora actuală. Însă Deep Web-ul se referă la trilioane de pagini de informații localizate în world wide web în diverse fișiere și formate, care nu pot găsite de motoarele de căutare actuale de pe Internet sau au dificultăți de accesare a lor.

În ultimii ani, unele motoare de căutare mai cuprinzătoare au elaborat algoritmi de căutare a informației în porțiunile mai adânci ale World Wide Web, încercînd să găsească fișiere pdf, doc, xls, ppt, ps și altele. Aceste fișiere sunt folosite predominant de către întreprinderi pentru a comunica informațiile în cadrul organizației sau pentru a difuza informații către lumea exterioară. Căutarea acestor informații folosind tehnici profunde de căutare și cele mai noi algoritmi permite cercetătorilor de a obține o cantitate mare de informații corporative care n-au fost anterior disponibile sau accesibile.

Cercetările au aratat, de asemenea, că informații și mai profunde pot fi obținute de la aceste fișiere prin căutarea și accesarea informației de "proprietăți" ai acestor fișiere.

Acest ghid este conceput pentru a oferi resurse de care este nevoie pentru a înțelege mai bine istoria cercetării Deep Web-ului, precum și diverse resurse clasificate care permit căutarea pe Internetul actual a surselor principale de informații valoroase, care pot fi găsite numai după înțelegerea modalității de căutare în Deep Web.

Secțiunile componente ale Deep Webului unde pot fi căutate informații ascunse:

articole, lucrari, forumuri, inregistrari audio și video ;

baze de date ;

servicii de cautare in baze de date ;

unelte de cautare in baze de date ;

peer to peer, partajarea de fișiere, motoare de cautare de rețea/matrice ;

prezentari ;

resurse căutate în deep web;

resurse căutate în webul semantic;

cautarea subiectelor de informații in bloguri.

Pe de o parte, Deep Web conține, în mare parte, baze de date enorme de informații cu caracter de afaceri, de natură științifică și tehnologică. Cea mai mare parte a "Web-ului în profunzime" – sunt baze de date gigantice structurate după toate domenii, segmente și părți a businessului, științei, ingineriei și tehnologiei.

Pentru a opera în acest domeniul al Web-ului, actualmente, există deja un număr destul de mare de motoare de căutare specializate. Evident este faptul că lucru în acest segment ar trebui să fie bun venit. Atât publicul, cît și toate guvernele încearcă să încurajeze dezvoltarea unor astfel de resurse și întreprind măsuri pentru a le face mai accesibile și cunoscute pentru masele largi de utilizatori. În acest sens, de exemplu, are o valoare mare mișcarea, ce se desfășoară în ultimii ani, de către mii de oameni de știință, cercetători, dezvoltatori cu renume mondială, care de-facto i-au forțat pe proprietarii mai multor resurse Deep Web, în special celor legate de reviste științifice și tehnologice, să le pună la dispoziția publicului în mod gratuit. Esența mișcării a constat în faptul că mii de oameni de știintă conduse de laureați ai premiului Nobel și Filds, care, de fapt, și fac cea mai mare parte a autorilor de reviste științifice, în care ei publică articolele sale gratuit, au emis un ultimatum – fie ei se opresc să scrie în reviste de top din lumea sau revistele nu mai taxează utilizatori. Ca urmare, proprietarii revistelor s-au retras.

Într-o situație complet de diferită se află Dark Net. Profesorul Nicolas Christian din Carnegie Mellon University a studiat modelul de afaceri al site-ului „Silk Road”, celei mai cunoscute resurse a Web-ului ascuns. S-a dovedit că vânzătorii realizează lunar produse, în medie, în valoare de aproape două milioane de dolari fiecare. Mai mult ca atât, ei efectuează tranzacții cu o frecvență de două ori pe lună. De asemenea, numărul de vânzători crește considerabil în fiecare lună. Surprinzător este faptul că 4% din numărul total de vânzători au efectuat tranzacții aproape în fiecare săptămână, și au fost prezenți pe piața în întreagă perioadă de studiu.

În afară de droguri și alte operațiuni ilegale Dark Netul este, de asemenea, cunoscut prin faptul că aproape toată lumea care îl accesează, primește pe calculatorul sau gadgetul său un malware și alte mijloace necesare pentru realizarea fraudei cibernetice. De asemenea, există în cadrul Dark Netului și o piață separată unde pot fi achiziționate programe malware utilizate pentru fraudă.

Spre exemplu, se cunoaște că prin Dark Net se realizează rețele botnet. O rețea botnet este compusă din computere care, fără știrea utilizatorului, au fost compromise prin exploatarea unor vulnerabilități de către o aplicație malware, și sunt manipulate pentru a derula activitati nocive, cum ar fi trimiterea de mesaje spam sau spyware către alte computere de pe Internet. Aceste computere “bot” acționeaza sub comanda unui singur hacker (sau grup de hackeri de dimensiuni reduse) . Astfel, cu aproximativ opt mii de dolari (preș pentru o astfel de rețea), utilizînd trei adrese IP de bază, puteți folosi, fără cunoștința utilizatorilor, o rețea de aproximativ 10 000 de calculatoare.

Cercetările arată că, pe piața neagră, botii și malware puțin învechite se cumpara de infractori cybernetici de rînd. Banii cîștigați sunt folosite pentru crearea noilor arme cibernetice, mai sofisticate.

2 Pentru a efectua o interogare directă trebuie să cerem în baza de date exact ceea ce vrem, altfel nu vom primi rezultatul dorit.

Este imposibil de a emite sute de mii sau milioane de interogări directe către bazele de date de căutare individuală în Deep Web. Și, desigur, pentru că conținutul se schimbă și este dinamic, este imposibil de a repeta această sarcină pe un program de actualizare rezonabil. Din aceste motive, ponderea predominantă a conținutului deep web va rămâne sub suprafața și poate fi descoperită doar în contextul unei cereri de informații specifice.

Contradicții în existența Deep Web-ului pentru comunitatea de intelligence

Aspecte pozitive și negative ale Deep Web-ului.

Accesînd diferite resurse, noi lăsăm unele date ale noastre cu caracter personal. Mai mult ca atât, orice activitate a noastră în Internet, indiferent dacă este vorba de o vizitarea resursei, aflarea pe ea, activitatea în rețele sociale, vizualizarea diferitor clipuri pe You Tube, etc. se fixează prin software și hardware. Ca urmare, colectarea datelor personale și datelor privind activitatea noastră zilnică în toate segmente ale web-ului reprezintă un fel de identitate digitală, geamănul nostru electronic.

Numeroasele cercetări arată că geamănul electronic și acțiunile lui oferă informații suficient de detaliate cu privire la fiecare dintre noi și, de asemenea, permit prezicerea acțiunilor noastre în viața reală și cea virtuală. De asemenea, în prezent există nu sunt doar fundamente teoretice, dar și unele oportunități practice de expropriere sau atribuire a identității noastre digitale.

În plus, urmărirea acțiunilor utilizatorului în Internet și crearea bazelor de date celor mai complete, de pe o parte, și celor mai detaliate, pe de altă parte, privind grupurile de utilizatori este una dintre principalele interese nu doar ale guvernelor, ci și, în primul rând, a domeniului de business. Pentru ultimul, aceste date sunt un capital de neprețuit pentru a spori eficiența marketingului și a crește nivelul vânzărilor.

Ni se pare că folosim Internetul gratuit, cu excepția unei plăți ieftine pentru trafic. Însă, la stadiul actual de dezvoltare a netului, este o percepție greșită. De fapt, noi plătim pentru a avea acces la motoarele de căutare, diferite servicii, portaluri gratuite de divertisment și informații, prin dreptul de a utiliza date componente ale identității noastre digitale. Cu toate acestea, multă lume nu e de acord cu acest fapt. Alții ascund identitatea sa deoarece sunt preocupați de posibile persecuții politice. Prin urmare, s-a născut dorința, atît de populară în prezent, de anonimat.

Anonimatul – este cuvântul grecesc care însemnă "fără nume." Anonim în Internet – este persoană față de care e imposibil de identificat o identitate digitală. Principalul și cel mai fiabil mod de a asigura anonimatul acum – este utilizarea rețelelor I2P sau TOR.

Destul de actuală și importantă este întrebarea: Cît de legal este navigarea anonimă pe net? Comunitățile internaționale în ultimul timp sunt preocupate de domeniul ascuns al Internetului, Deep Web, și de anonimatul în rețea. Merită analizată reacția marilor puteri la acest fenomen.

In SUA, atunci când se studiază problema legată de anonimat se folosește decizia Curții Supreme cu privire la o plângere a lui Makintair împotriva statului Ohio. Decizia instanței spune: "Protejarea anonimatul este vitală pentru democrație. Aceasta corespunde proiectului de lege a drepturilor și primul amendament". Deoarece în SUA dreptul are caracter de precedent, o astfel de decizie este luată în conformitate cu precedentul menționat. În același timp, Curtea Supremă de Justiție a decis că legalitatea anonimatului "ar trebui să fie acceptată și analizată în fiecare caz aparte, în mod individual". Însă "oamenii au dreptul de a comunica folosind pseudonime și a ține legătura anonim, atîta timp cît acest fapt nu intervine legislației". Trebuie menționat că, sistemul de legi adoptate în SUA după 11.09.2001 permite autorităților de stat, agențiilor și serviciilor de intelligence competente de a încălca, în anumite cazuri specifice, viața privată a nu numai cetățeniilor altor țări, dar și cetățenilor americani pe teritoriul SUA.

În ceea ce privește Europa, poziția de aici este dublă. Pe de o parte, articolul 8 din Carta Uniunii Europene privind drepturi fundamentale prevede dreptul fiecărei persoane la protejarea datelor cu caracter personal și stabilește necesitatea unor sancțiuni severe pentru cei care încearcă să încalce aceste drepturi. Pe de altă parte, legislația europeană și legislația individuală a țărilor prevede oportunități majore pentru organele de drept și serviciile de intelligence de depășire a normelor vieței private și anonimatului în caz de pericol pentru societate. Această dualitate se datorează conținutului controversat a "Web-ului în profunzime".

În Federația Rusă (FR), treptat, se întreprind acțiuni de limitare a accesului în rețea necontrolată de autorități. Multă lume are o atitudine extrem de negativă față de acest proces, însă, un asemenea domeniu ca Deep Web necesită să fie controlat de stat. În prezent, în FR, se studiază la nivel legislativ problema de interzicere a accesului la servere anonime și Tor, care sunt prezentate, în mare măsură, prin baze de date și site-uri de vânzare a lucrurilor ilegale. Faptul examinării la nivel legislativ a problemei de interzicere a utilizării browser-ului Tor și programelor de anonimizare a devenit cunoscut după ce unii reprezentanți ai societății civile au cerut de la Serviciul Federal de Securitate (FSB) al FR blocarea rețelei Tor. În răspunsul său, reprezentanții FSB-ului au comunicat despre interesul autorităților față de această problemă.

Problemă principala de interzice a Tor-ului este faptul că el se bazează pe infrastructura de rădăcina a Internet-ului.

Trebuie menționat faptul că tehnologia Tor a fost creată într-un laborator secret de cercetare științifică al Marinei Militare a Statelor Unite, în scopuri militare. Însă în anul 2002 acestă tehnologie a fost declasificată și transmisă unor programatori.

De asemenea, și Internet a fost creat în SUA și un număr mare de așa-numite servere de rădăcină, în baza cărora lucrează Internetul, se află în SUA.

Potrivit unor păreri, anonimatul în rețea trebuie interzis, deoarece anume prin intermediul lui sunt promovate lucruri ilegale, iar Deep Web-ul este o parte componentă integrantă a segmentului ilegal virtual.

3 Internetul a devenit mediul preferat pentru difuzarea publică a documentelor și a informațiilor și tot mai mulți diseminatori de informații (cum ar fi agențiile guvernamentale și proiecte majore de cercetare), care au conținut suficient pentru a se califica ca Web-ul în profunzime, transfer informațiile sale în domeniile online. Astfel, Web-ul în profunzime pare a fi o sursă critică atunci când avem nevoie imperative să găsim documente/informații/date importante, valoroase și greu accesibile.

Cele mai importante rezultate ale analizei domeniului Deep Web sunt că există un conținut masiv și semnificativ ce nu poate fi descoperit cu tehnologii de căutare convenționale și că există o lipsă aproape uniformă de conștientizare a faptului că chiar există acest conținut critic.

Conținutul „profund” original actualmente depășește întregul conținut global de materiale imprimate. Organizația International Data Corporation estimează că numărul de documente aflate în Web-ul de suprafață va crește de 6 ori în trei ani, de la nivelul actual de aproximativ 2,5 miliarde la 13 miliarde. Deep Web-ul va depăși, eventual, această rată de creștere și se va majora de aproximativ noua ori în aceeași perioadă. 

Nu există nici o linie care separă surse de conținut de pe Web. Există circumstanțe cînd conținutul de "adâncime" poate apărea la suprafață și când conținutul de "suprafață" poate apărea ca „de profunzime”, mai ales cu ajutorul motoarelor de căutare de specialitate.

Conținutul Web-ului de suprafață este prezent pe pagini statice vizibile pentru motoarele de căutare, în timp ce conținutul Deep Web-lui este prezentat numai dinamic în urma unei solicitări directe. Cu toate acestea, odată solicitate direct, informații din Deep Web vin asociate cu un URL, care conține deseori numărul de înregistrare a bazei de date, ce poate fi re-utilizat pentru a obține același document. Orice conținut „ascuns” plasat pe o pagină Web statică poate fi descoperit de către crawler-ele și, prin urmare, este indexabil de către motoare de căutare.  Astfel poate fi explicat faptul de ce o parte a conținutului Deep Web apare ocazional în motoare de căutare a Web-ului de suprafață.

Prin urmare, surse sau motoare de suprafață specializate ar trebui să fie luate în considerare atunci când avem nevoie de o căutarea într-adevăr în profunzime.

3 Conținutul Web-ului, odată postat "public", este distribuit la orice sursă care alege să-l reproducă. De aceea apar mai multe întrebări cum ar fi: Este conținutul deep web-ului unic? Cât de mult este duplicat? Există diferențe ale conținutului duplicat în Web-ul „adînc” și cel de suprafață? Într-adevăr, în prezent nu se știe cât de multe documente duplicate sunt în Web de suprafață.

Studii arată că sunt categorii importante de informații chiar unde există duplicarea. Proeminent printre acestea sunt pagini albe/de aur, înregistrări genealogice și evidențele publice cu potențial comercial. Există și numeroase site-uri dedicate activității financiare ale companiilor.

Pe de altă parte, există categorii întregi de site-uri web „ascunse” al căror conținut apare unic valoros. Acestea se încadrează în mare parte în cadrul categoriilor de baze de date pe anumit subiect, publicații și site-uri interni – reprezentând în total de aproximativ 80% din site-uri Deep Web – și includ asemenea surse ca baze de date științifice, biblioteci, bibliografii unice, precum și depozite unic cu date guvernamentale, cum ar fi date de imagini de pe sateliți și altele.

Însă duplicarea este agresivă pe Web-ul de suprafață. Multe site-uri sunt copiate.  Informații obișnuite, cum ar fi cărți, software, comunicate de presă etc. pot apărea de mai multe ori pe motoare de căutare.

Astfel potențialul duplicării are funcții de disponibilitate și importanță publică, precum și de descoperire. Deep Web-ul nu este la fel de ușor de descoperit și, ca urmare, nu poate fi la fel de ușor copiat și adus la „suprafață”. Acești factori sugerează că duplicarea poate fi mai mică în Deep Web. 

3 Solicitanți serioși de informații nu mai pot evita importanța sau calitatea informațiilor din Deep Web. Dar informații din Deep Web sunt doar o componentă de informațiilor total disponibile. Căutarea trebuie să se evolueze pentru a cuprinde Web-ul complet. Tehnologia de interogare directă este singurul mijloc de a integra informații din deep Web și cel de suprafață. 

Mai multe studii din domeniu sugerează o divizare în cadrul pieței de căutare a informațiilor pe Internet:

directoarele de căutare care oferă informații alese de pe Web de suprafață pentru a satisface nevoile de căutare populare; 

motoare de căutare pentru căutări mai robuste la nivel de suprafață; 

serveri de agregare a informațiilor din Deep Web pentru a oferi răspunsuri în cazul în care complexitatea și calitatea sunt imperative.

ANEXE

Tabelul 1: Resurse media publice, componente și elemente.

Tabelul 2. Șaizeci de cei mai mari site-uri ai deep web-ului

Similar Posts