Analiza Osint Și Propaganda Rusă Contra Statelor Nato În Mediul Online Tita Alexandru Mihai Studii De Securitate 2018 [302067]
LUCRARE DE DISERTAȚIE
la programul de masterat
STUDII DE SECURITATE
cu titlul
ANALIZA OSINT ȘI PROPAGANDA RUSĂ CONTRA STATELOR NATO ÎN MEDIUL ONLINE
CAZUL TWITTER
Coordonator:
Prof. univ. dr. Cristian Barna
Absolvent: [anonimizat] 2018
Rezumat
Lucrarea cuprinde în prima parte aspecte metodologice despre informațiile obtinute din surse deschise(OSINT) [anonimizat], cu accent pe rețelele sociale.
A doua parte a lucrării se axează pe problematica propagandei și diseminarea informațiilor false în mediul virtual(în special pe platforme de social media), [anonimizat]. [anonimizat] s-a observant aceasta. Este prezentat de asemenea conceptul de Soft Power și mecanismele prin care Moscova il utilizează și sunt identificare zonele în care este prezent.
[anonimizat], în vederea identificării elementelor de propagandă și dezinformare. [anonimizat].
[OSINT, [anonimizat], NATO, UE, Rusia, Propaganda, Dezinformare, Cyber, [anonimizat], Twitter, Trolls, Bots)
Introducere
Indiferent că e Rusia, China, Daesh/[anonimizat], [anonimizat] “inamicului”,(a noastră, a tututror) cu scopul de a modela sau a controla comportamentul lui.
[anonimizat] a [anonimizat], viețile.
OSINT
“Open Source Intelligence (OSINT) [anonimizat], [anonimizat], cât și online. [anonimizat] a [anonimizat] a schimbat, [anonimizat].”
[anonimizat], politice, [anonimizat] a informaților. [anonimizat] o mai mare audiență interesată.
[anonimizat], social media poate fi folosit pentru a colecta și analiza date valoroase ce pot fi transformate în informație și care pot ajuta în luarea deciziilor. [anonimizat], mai ales în vederea obținerii informațiilor în timp real sau lucrând cu platforme de tipul Big Data.
În timp ce tradiționalele surse OSINT ([anonimizat].) [anonimizat] este "Vestul Sălbatic". Lipsa de cunoștințe, schimbarea rapidă a tendințelor, metodologiilor și a instrumentelor pentru exploatarea social media, este o provocare care trebuie abordată.
Este essențial să întelegem că social media, pe lângă rolul de a împărtăși informații în diverse comunități, unor indivizi sau organizații, este și o unealtă de manipulare activă în domenii precum politică, medii de afaceri sau apărare. Operațiuni precum cele din Afganistan, Venezuela, Egypt, Libia, Syria au confirmat puterea social media în mobilizarea oamenilor.
De asemenea, insurgenții și teroristii se folosesc de tehnologie și de social media pentru a-și transmite mesajele de propagandă și amenințările, unei audiențe cât mai mari. Social media vine cu multe avantaje, printre care abilitatea de a comunica în timp real și de a atrage o audienta mai mare, prin algoritmii săi. Chiar dacă un mesaj poate influența o persoană dintr-o mie dar mesajul este propagat unei audiențe de 3 milioane de oameni, există șansa ca el să influențeze 3000 de oameni. Social media oferă abilitatea de a coordona activități de la o foarte mare distanță și de asemenea capacitatea de a “te ascunde în mulțimea de pe internet” foarte ușor și toate acestea cu cât mai puține resurse.
150.000$ au fost banii plătiți pentru publicitate pe Facebook, de entități ruse în timpul campaniei electorale din SUA de la sfârșitul lui 2016. Facebook a identificat 3.000 de reclame plătite de pe 470 de conturi false afiliate Rusiei. Postările promovate au avut teme diverse, de la probleme sociale precum imigrație și drepturile LGBT până la conținut cu tentă rasistă și mesaje religioase menite să incite. O sumă mică dacă ne gândim la miza jocului.
Utilizarea mediului online permite anonimizarea utilizatorilor și face dificilă descoperirea lor fizică. De multe ori, aceste persoane rău intenționate cunosc foarte bine tehnicile de anonimizare și folosesc diverse tipuri de criptări, care le permit să rămână cat mai ”low profile” pe internet. (atât în WWW dar mai ales în DeepWeb).
”Populațiile din statele nedemocratice vor încerca să folosească din ce în ce mai social media în căutarea informațiilor și a creării de legături. Cu toate acestea, guvernele din aceste state vor continua să dezvolte mecanisme mai nuanțate, mai insidioase și mai eficiente pentru exploatarea mediilor sociale, menținând deja un control persuasiv asupra surselor media tradiționale. Din aceste motive, Comunitățile de Informații recomandă sporirea atenției asupra dezvoltării instrumentelor de observare, măsurare și raportare a utilizării complexe și evolutive a social media atât de cetățeni, cât și de guvernele din societățile închise.”
Social media este parte a OSINT și trebuie tratată la fel de serios ca orice altă disciplină de intelligence.Valoarea informațiilor din acest mediu i-a oferit un statut și un nume în lumea disciplinelor – SOCMINT (Social Media Intelligence). Dacă privim atenți, social media este un set foarte complex de date, care include mii de formate diferite, limbi și sute de milioane de autori, astfel încât sunt necesare cunstințe de întelegere de limbaj, cultură și știinte sociale, pentru o interpretare cât mai exactă.
De exemplu, dacă ne uitam la operațiunile de tip PsyOps, OSINT poate furniza informații socio-culturale necesare cunoașterii percepțiilor, aspirațiilor și capacităților celor vizați drept ținte. Fluxul media live din social media și viteza cu care se propagă datele, pot fi de mare ajutor analiștilor, pentru a întelege evoluția unui scenariu în timpul unui eveniment.
Studiile în domeniu arată ca 80% din informațiile agențiilor de securitate sunt bazate pe OSINT. Informațiile obținute din social media pot fi folosite individual în luarea deciziilor, dar este mult mai probabilă folosirea lor in combinații cu informații obtinute din surse provenite din alte discipline(HUMINT,SIGINT, MASINT, IMINT, etc.).
”Conceptul de colectare și utilizare a informațiilor pentru a susține procesul de luare a deciziilor nu este unul nou. Pentru a obține avantaje în fața unui adversar, este imperativ să posedăm date de actualitate, informații corecte referitoare la intențiile și capabilitățile acestuia. Această regulă se aplică în orice domeniu, fie el politică, afaceri, strategie militară sau investigarea criminalității. Totodată este un proces care a fost și este într-o continuă dezvoltare și evoluție, în răspuns la schimbările sociale, ale factorilor culturali, tehnologiei, nevoilor organizaționale și a noilor nivele ale aptitudinilor analitice.
Studierea modului în care a apărut analiza informaților ne ajută să înțelegem deopotrivă unde ne aflăm astăzi, cum și de ce am ajuns în acest punct. Totodată ne ajută să conștientizăm că domeniul analizei informațiilor se află într-o continuă schimbare, aplicabilitatea lui practică evoluează, în mod constant fiind necesară o abordare mereu nouă, flexibilă, idei noi, aptitudini și tehnici de actualitate. Singura constantă în munca unui analist de informații este faptul că nu există două sarcini sau proiecte absolut identice, fiecare lucrare nouă necesită cel mai adesea o abordare diferită.”
OSINT, cu capacitatea sa de a colecta și a exploata informații de la publicul general, ar trebui sa fie esențial în analizele făcute de structurile de securitate. Odată cu dezvoltarea de noi tehnologii și cu boom-ul de date prezent în social media, OSINT a câștigat tot mai multe procente în ultimii ani pe scena intelligence-ului.
Publicațiile structurilor de securitate(ex: SRI-revista Intelligence, NATO- OSINT Handbook), dar și conferințele unde se discută statutul OSINT-ului arată un interes în creștere legat de exploatarea mediului virtual și în special al social media.
“80% din ceea ce am nevoie să cunosc, provine din informații din surse deschise, nu din informații clasificate. Și din restul de 20%, dacă știu unde să caut, găsesc încă 16%. La sfârșit, informațiile clasisficate m-au ajutat doar in proporție de 4%
Recentele experiențe din operațiuni au arătat că OSINT nu este doar o sursă importantă pentru informațiile de bază, ci poate contribui și în stadiile incipiente ale ciclului de intelligence.
Importanța OSINT-ului în societate
Începând cu 1988, a luat naștere o mișcare emergentă care însă nu a avut succes, dar care a dorit să facă mai vizibil conceptul de OSINT, scoțându-l din agențiile de informații și organizațiile guvernamentale, în mediul public.
Inițial conceptualizat ca adjuvant al surselor clasificate, OSINT a fost alăturat mișcării Informațiilor colective, care a fost numită și "inteligent mobs", "înțelepciunea mulțimilor" sau "creierul mondial".
H.G. Wells a conceptualizat un creier mondial în anii 1930. Qunicy Wright a conceptualizat un centru mondial de informații în anii 1950. Și alții au scris despre națiunile inteligente, inteligența colectivă si creierul global.
Termenul de Smart Nation a fost introdus în literatura de specialitate de Robert David Steele, un lider al comunității OSINT, fost soldat Marine Corps și angajat CIA, acesta identificând importanța conceptului de intelligence în sectorul public și în viața de zi cu zi, arătând necesitatea ca fiecare cetățean trebuie să fie un colector, producator și consumator de informație.
În 1992, în ciuda opunerii CIA, el a primit permisiunea de a organiza o conferință OSINT, care s-a dovedit a fi un succes, prin prisma discuțiilor și prezenței multor oameni cunoscuți in Intelligence. CIA nu a fost foarte fericită astfel încat Steele și-a încheiat socotelile cu aparatul guvernamental, fondând Open Source Solutions Network Inc., iar mai târziu Earth Intelligence Network. În 2014 a publicat cartea Open Source Everything, unde subliniază că ”avem 7 miliarde de creiere care sunt singura resursă infinită, disponibilă pentru noi”. De asemenea el punctează că ”informațiile din surse deschise nu mai au eficiență atunci când avem dispozitive și software închise”, cerându-i vice-președintelui de la acea vreme, Joe Biden, să considere înființarea unei agenții pentru Informații din Surse Deschise, care ar putea reduce costurile agențiilor de informații și ale aparatului guvernamental în mod semnificativ.
Deși multă lume nu cunoaște semnificația OSINT-ului, mulți folosesc involuntar tehnici și metode de a se informa cât mai bine și corect într-un anumit domeniu. Cu toții putem spune că folosim OSINT în viața de zi cu zi, așa cum folosim și HUMINT(informații din surse umane). Însă diferența dintre cei care fac acest lucru involuntar și specialiști, este dată de nivelul de cunoștințe si expertiză. Exista câteva comunități importante care exploatează sursele deschise și încurajează oamenii să conștientizeze importanța exploatării surselor deschise în viața de zi cu zi, atat pe plan personal cât și profesional.
În afara agețiilor de informații, jurnaliștii de investigații folosesc des tehnici de OSINT în analizele lor. Organizații ca Bellingcat, ICIJ(International Consortium of Investigative Journalists) sau RISE Project au facut anchete cu descoperiri importante, utilizând tehnici și metode de analiză a surselor deschise. Exemple de investigații precum Panama Papers, atacuri cu arme chimice in Syria sau zborul MH-17 sunt câteva din exemplele care au dezvăluit informații valoroase. Persoane precum Michael Bazzell, un guru al OSINT-ului, împărtășesc online informații despre tehnicile de investigare. Cele mai importante surse unde găsim instrumente și informații sunt https://inteltechniques.com , http://osintframework.com/ sau http://www.automatingosint.com/blog/.
Sursele OSINT
BIG DATA
Big data este creată de aproape tot ceea ce ne înconjoara în materie de tehnologie. Fiecare proces digital și fiecare schimb de date generează ceea ce numim Big Data. Atunci când intervin probleme legate de manipularea, stocarea și analizarea datelor în mod traditional, ne putem gândi la Big Data. Big Data cuprinde informații culese din Social Media, din diverse dispozitive conectate la internet(cum ar fi telefoanele mobile, tabletele, ceasurile inteligente etc.), interogări pe motoare de căutare, fotografii, înregistrari audio și video sau alte date structurate și nestructurate.
Big Data este generată de numeroase surse, într-un volum și o varietate imensă. Celalate două proprietăți, viteza și veridicitatea sunt la fel de copleșitoare. Big data este identificată în general ca “Ce 4 V”
Big Data creează atât oportunități cât și provocări. Pentru a putea genera valoare din aceste date, ele trebuie procesate și analizate într-un timp util și într-o manieră care să facă posibilă accesarea lor în situații care pot schimba lucruri și influența decizii. Eficiența acestor procese se bazează pe obținerea unui mix de metode, tehnologii și în special oameni foarte bine pregătiți și cu un mare bagaj de cunoștințe.
În sensul ei pur, analiza urmărește de fapt descoperirea unui model în setul de date. Însă analiza trebuie privită și cantitativ, statistic și ca un model predictiv în luarea deciziilor.
Fluxul analizei de informații
În timp ce Big Data este generată de o varietate de surse, se estimează că majoritatea datelor provin din surse care generează date nestructurate. Big Data are relevanță în studiul acesta deoarece Social Media constituie probabil cea mai mare sursă nestructurată de date care aparține implicit de Big Data.
SOCIAL MEDIA
Social Media este un termen pe care îl folosim foarte des astăzi, de obicei pentru a descrie ce postăm pe platforme precum Facebook, Twitter, Instagram, Reddit și altele. Însă dacă ne uităm cu o mai mare atenție la ele, individual, lucrurile pot deveni confuze.
Ce este de fapt social media?
Termenul este folosit atât de vag încât poate defini o mare parte din site-urile pe care le accesăm zilnic. Foarte multe persoane identifică social media ca Facebook sau Twitter, însă termenul poate fi analizat separând cele două cuvinte:
Partea “socială” descrie interacțiunea dintre indivizi ca metodă de a produce și a impărtăși informații.
“Media” descrie instrumentul de comunicare, cum ar fi internetul(sau televizorul, radioul, ziarele, care sunt canale tradiționale de comunicare). Aceste canale tradiționale nu sunt social media deoarece ele nu interactionează cu interlocutorul. Ele doar oferă informații.
Percepția generală despre social media este că reprezintă înglobarea tehnologiei, a comunicațiilor și a coordonării dintre ele pentru a facilita crearea și schimbul de informații și idei într-o comunitate de interese. Crearea de comunități este o caracteristică fundamentală a social media. Aceste comunități se creează rapid și dezvoltă o comunicare foarte eficientă și deși sunt doar virtuale, ele nu sunt mai puțin robuste decât comunitățile fizice în care trăim. În unele situații, sunt chiar mai robuste datorită simplului fapt că barierele spațio-temporale sunt eliminate. Social media promovează schimbul de informații dintre membrii unei comunități într-o manieră care încurajează contribuția conținutului, a colaborării și a schimbului de idei.
Formele Social Media
Social Media este un termen vast definit deoarece există foarte multe tipuri de canale de comunicare, în funcție de nevoile utilizatorilor:
Rețelele Sociale: Se concentrează pe crearea relațiilor dintre indivizii cu interese și activități similare. Exemple: Facebook, VKontakte, Weibo etc.
Bloguri: Cea mai populară platformă este WordPress.com
Microbloguri: Diferă de blogurile tradiționale deoarece conținutul este livrat mult mai rapid și în doze mai mici. Exemplu: Twitter
Agregator de știri: Utilizatorii propun și votează noi subiecte. Exemplu: Digg
Întrebări și Răspunsuri: Utilizatorii pot întreba și răspunde pe seama diverseleor subiecte. Exemplu: Answers.com, Yahoo! Answers
Platforme de Photo și Video Sharing: Utilizatorii pot încărca și comenta conținutul foto și video. Exemplu: Instagram, Flickr, Pinterest, Youtube etc.
Rețelele profesionale: Aici utilizatorii împărtășesc informații din industria pe care o reprezintă și se recomandă între ei, iși încarcă CV-ul și informațiile profesionale și aplică pentru job-uri. Exemplu: LinkedIn
Platforme cu conținut editabil: Cunoscute sub numele de “Wiki”. Acest tip de “social media” este des întalnit, cel mai cunoscut fiind Wikipedia.
Rețelele sociale
Așa cum social media reprezintă azi poate cea mai importantă ”felie” din tortul WWW, atunci cu siguranță cea mai mare felie a social media o reprezintă rețelele sociale. Potențialul lor este așa de mare încât numărul utilizatorilor din întreaga lume va ajunge la aproape 3 miliarde până în 2020, aproape o treime din totalul oamenilor de pe glob. Asta în situația în care pe Pământ, 51% din oameni au acces la internet(3.8 miliarde).
Aproximativ 650 de milioane de utilizatori sunt din China iar apoape o treime de milliard din India. Zona cu cea mai puternică rată de penetrare a rețelelor sociale este America de Nord, unde în jur de 65% din oameni au cel puțin un cont pe rețelele de socializare. În anul 2018, se estimează că 78% din Americani vor avea cel puțin un cont pe rețelele sociale.
În ciuda “omniprezenței” rețelelor sociale, potențialul continuă să crească, nu doar ca număr ci și ca angajament(engagement) al utilizatorilor, fiind într-o continuă creștere. În decursul anului 2016, timpul zilnic mediu petrecut de utilizatorii din Brazilia sau Filipine era de peste 3 ore, în timp ce în Statele Unite ale Americii de 1,7 ore. Media zilnică petrecută pe rețelele de socializare a unui utilizator de pe glob este de aproximativ 109 minute.
Propaganda rusă contra țărilor NATO
Rusia iși exercită influența în intreaga lume dar și în propria țară prin diverse concepte de propagandă și dezinformare, război informațional, diplomație publică și militară sau acțiuni de Soft Power.
Începând cu 2008, odată cu conflictul din Georgia, Rusia și-a intensificat acțiunile de propagandă, cunoscând o creștere odată cu anexarea Crimeei și continuând cu statele NATO. Rusia cunoaște foarte bine punctele slabe ale Alianței și încearcă destabilizarea ei prin metode adaptate și croite pe problemele fiecărui stat NATO(cu precădere statele baltice) dar și statelor care empatizează cu Alianța(Suedia, Finlanda, Moldova,Ucraina etc.) sau unde are un anume interes.
Nici Muntenegru, ultima țară care a aderat Alianței nu a scăpat de furia rușilor, care au propagat în mediul online mesaje anti-NATO și chiar au pus la cale un puci(care a eșuat), pentru răsturnarea guvernului și chiar asasinarea premierului pro-occidental, Milo Djukanovic.
Într-o mare măsură, aceaste abordări seamănă cu cele din fosta Uniune Sovietică și a Războiului Rece, fiind transpusă într-un alt mediu, Internetul.
Această propagandă și-a dezvoltat o identitate și are caracteristici specifice, care au fost identificate de cercetătorii care au analizat această problemă. Printre cele importante, putem observa volumul și multitudinea de canale în care este diseminată informația. Asta deoarece oamenii tind să creadă că o informație recepționată din mai multe surse este mai credibilă, fără să mai verifice informația, iar dacă există argumente multiple care duc la aceeași concluzie, credibilitatea informației este cu atât mai mare.
De asemenea, dacă mesajul este diseminat pe un grup în care utilizatorul se regăsește, este perceput cu o mai mare încredere. Studii psihologice sugerează că mesajele primite dintr-o multitudine de surse și intr-un volum mare par mai credibile, cantitatea fiind o “calitate” în cazul acesta. În primul rând, volumul mare de informații poate distrage atenția audienței și poate eclipsa celelalte mesaje, sau le poate pune în dezacord.În al doilea rând, când un mesaj este diseminat pe cât mai multe canale, șansele ca audiența să fie expusă la el sunt mult mai mari.
Rapiditatea, continuitatea și repetitivitatea sunt de asemenea identificate, împreună cu lipsa obiectivității și a consistenței mesajului.
Propaganda rusă reacționează foarte rapid la evenimente iar ”datorită” lipsei de obiectivitate a mesajelor, propagandiștii nu trebuie să verifice validitatea informației, diseminându-le rapid, dacă ele sunt favorabile scopului urmărit. Mai mult decât atât, repetitivitatea creează familiarizare iar familiarizarea creează acceptare. Chiar dacă nu sunt foarte interesați de un anumit subiect, această familiarizare creeată prin repetare, face informația să pară corectă. Totodată, dacă individul este familiarizat cu un anume subiect(auzit în trecut, de exemplu), acesta tinde să-l proceseze cu mai puțină atenție și să discrediteze argumentele puternice în detrimentul celor slabe dar cu un volum mai mare.
Uneori informația conține și elemente de adevăr dar de multe ori ea este falsă în totalitate. În 2014, o campanie menită să creeze panică în urma unei asa zise explozii a unui depozit de chimicale din Louisiana, s-a dovedit a fi total falsă, incident neexistând efectiv. Propaganda rusă se bazează deseori pe evidențe fabricate – de exemplu fotografii, care de multe ori sunt prost prelucrate.
Ministerul Rus al Apărării a publicat pe 14 noiembrie 2017 pe contul său de Twitter, mai multe imagini care prezentau presupuse dovezi ale faptului că guvernul SUA susține, pe ascuns, organizația Stat Islamic/Daesh. Aceste imagini însotesc “confirmarea irefutabilă că Statele Unite, imitând în fața comunității internaționale o luptă fără concesii împotriva terorismului, asigură o acoperire a unităților Statului Islamic”. Eliott Higgins, un cercetător de la Kings College din Londra, si fondatorul organizatiei Bellingcat, a descoperit că una dintre imagini este o captură de ecran din jocul video AC-130 Gunship Simulator: Special Ops Squadron, lansat în 2015. Mai mult, un grup numit Conflict Intelligence Team, a descoperit că celelalte imagini au fost făcute în 2016 de către Forțele Aeriene Irakiene în timpul unui bombardament.
Imaginea postata de Ministerul Rus al Apararii(stânga) vs. imaginea din jocul video
După ce aceste informații s-au răspândit pe internet, Ministerul Apărării a șters postările, iar într-o declarație făcută pentru RT, oficialii ruși au admis că imaginea preluată din jocul video a fost o greșeală și că o investigație a fost declanșată pentru a se găsi vinovatul.
Potrivit publicației online “The Intercept”, Kremlinul a recrutat peste 250 de "trolli", persoane angajate să disemineze informații false, zvonuri sau propagandă pe diverse platforme populare, plătindu-le fiecăruia aprox.1000$ pe lună pentru a produce conținut fals și a-l răspândi. Internet Research Agency sau “Trolli din Olgino”(zona din Sankt.Petersburg unde a fost descoperit sediul agenției), a creat un flux de informații false orientat împotriva mass-mediei pro-ucrainiene și a țărilor vestice, ”trollii” postând numeroase comentarii și postări pe rețelele de socializare în fiecare zi, folosind mii de alias-uri. Odată cu dezvoltarea și ușurința folosirii tehnologiei, a dispozitivelor mobile dar și disponibilitatea unor tehnici și instrumente de programare, diseminarea propagandei în social media devine din ce în ce mai ușor de facut și dificil de combătut.
Studiile arată că o mare parte din propaganda diseminată în social media este generată de “boți”, useri programați să îndeplinească anumite sarcini automate, mult mai rapid și mai eficient decât ar putea-o face o persoană. Poate cel mai evident canal de comunicare unde s-a observat această practică este Twitter, despre care voi detalia mai pe larg în capitolul următor.
Centrul de Excelență pentru Comunicare Strategică NATO(STRATCOM), a realizat un studiu de unde reiese că boții creează aproximativ 70% din mesajele anti-NATO, în limba rusă, în țările baltice si Polonia. Ca o comparație, 39% din tweet-urile în limba engleză sunt create de boți.
Un studiu făcut de oamenii de știință de la NY University a izolat caracteristicile boților de pe Twitter descoperind diferențe notabile dintre postările ”boților” și cele ale oamenilor, dar și similitudini, făcând dificilă detectarea lor. Boții tind să utilizeze platforme desktop iar oamenii pe cele mobile. Alte tipare arată că tweet-urile postate de oameni prezintă uneori și caracteristici de geolocație iar numarul de tweet-uri postate de oameni este cu mult mai redus decât cel al boților. Tiparele au descoperit de că boții postează cu precădere titlurile conținuturilor fără a menționa și sursa originală. Cercetătorii au analizat și un set de 15 milioane de tweet-uri din perioada în care subiectele din acea perioadă făceau referire la anexarea Crimeei sau asasinarea liderului opoziției ruse, Boris Nemtsov. Aceștia au descoperit că au fost postate mesaje de pe 230.000 de conturi rusești, iar 67% din conturi erau boți. Diferite evenimente au arătat o creștere a narativelor anti-NATO, un exemplu fiind “Zapad 2017”, exercitiul militar desfășurat de Rusia și Belarus. În perioada dinaintea exercițiului, narativele s-au amplificat și au beneficiat și de ajutor din partea publicațiilor Kremlinului, Sputnik si RT. La fel s-a întâmplat și în alte cazuri corelate cu exerciții militare ale Alianței, declarații ale unor lideri politici sau sosirea trupelor NATO în diferite zone. S-a observat o accentuare a narativelor si în preajma alegerilor politice din țări ca Olanda, Franta, Germania si Statele Unite.
Analize au arătat că o campanie agresivă de dezinformare s-a desfășurat chiar înainte de referendumul privind BREXIT-ul, când 45.000 de tweet-uri au fost postate în doar 48 de ore. Cercetători de la Swansea University și cei de la Berkeley din California au descoperit că în jur 150.000 de conturi din Rusia au avut o activitate neobișnuită chiar înainte de referendum. Theresa May a acuzat atunci Kremlinul de “'weaponising information”.
Un cunoscut caz de știri false și propagandă este cel al Lisei, o presupusă minoră de origine Lituaniana, ce ar fi fost violată de soldați germani sosiți în Lituania, pentru un exercițiu NATO. O parte din mass-media vizată de această informație a difuzat masiv știrea, care ulterior a fost negată de autoritățile lituaniene și de cele germane. Dezinformarea este una cunoscută părții germane, fiind o știre replicată cu aproape doi ani in urmă, când presa rusă a scris că o minoră de origine rusă a fost violată de către imigranți arabi în Germania. Rezultatul investigațiilor a arătat și atunci că știrea a fost un fals iar oficialii NATO au susținut că Germania este o ținta importantă a propagandei și dezinformării venite din partea Rusiei. De altfel, NATO are o întreagă listă de atacuri ruse și măsuri împotriva statelor membre ale Alianței, obiectivul lor fiind acela de a agita opinia publică anti-americană, pe cea susținătoare a rupturii transatlantice și stârnirea discordiei între statele aliate.
Tot prin propagandă, Rusia a încercat să se absolve de acuzațiile privind actiunile din Crimeea sau legăturile cu prăbușirea zborului MH-17, unde numeroase anchete au dovedit implicarea Moscovei.
NATO a acuzat Sputnik că face parte dintr-o “mașinărie de propagandă a Kremlinului” care produce și distribuie conținut de dezinformare pentru a influența opinia publică din întreaga lume.
Purtătorul de cuvant al Alianței, Oana Lungescu, a declarat despre mass-media rusă că “nu e o modalitate de a convinge oamenii sau de a-i informa, ci de a îi face să fie confuzi, dezbinându-i, fară a oferi și un alt punct de vedere alternativ.”
Agenția produce conținut în 30 de limbi, portalul având chiar și varianta în limba română. (https://ro.sputnik.md/)
Sputnik a ajutat răspandirea de conținut fals acuzand-o chiar pe Angela Merkel ca a apărut intr-o fotografie alături de un suspect al atacurilor din Brussel, Najim Laachraoui. Există sute de anchete care au dezvăluit răspândirea de conținut de dezinformare de către mass-media rusă, însă ca de fiecare dată, oficialii ruși au folosit ca armă “negarea”, arma lor preferată chiar și când la mijloc există dovezi clare.
Twitter este doar o mică parte din arsenalul liderului de la Kremlin, în acest razboi al informațiilor.Rusia se folosește de toate canalele de social media pentru a propaga dezinformare. Nici Instagram nu a fost ignorat. După cum știm, o poza face cât 1000 de cuvinte. Rușii au înțeles asta iar un studiu realizat de Jonathan Albright, cercetător la Tow Center for Digital Journalism din cadrul Universității Columbia, arată că Instagram(care are 800 milioane de conturi active) este un diseminator major al propagandei armatei de trolli de la Kremlin. Facebook a fost de asemenea acuzată că nu reușește să stopeze fluxul de știri false venite de la Moscova. Facebook a anunțat că persoane din Rusia au publicat aproximativ 80.000 de postări pe rețeaua de socializare, într-un interval de doi ani, în tentativa de a influența politica americană, iar aproximativ 126 de milioane de americani au avut acces la aceste mesaje. De altfel, în urma anchetelor care au stabilit implicarea Rusiei în alegerile de anul trecut din Statele Unite ale Americii, membrii executivi ai Facebook, Twitter și Google au fost audiați la sfârșitul anului 2017 de Congresul American, fiind puși la zid pentru cele întamplate. Printre alte canale folosite de Russia se numară și televiziunea, precum RT(Russia Today), care emite prin satelit în peste 100 de țări dar și pe internet, cu programe croite special pe nevoile publicului din țări NATO, UE și nu numai.
Harta narativelor in tările NATO si spatial Uniunii Europene
Cenzura
Rusia a încercat în ultimii ani să copieze modelul Chinei, în monitorizarea și controlul online al propriilor cetățeni(și mai ales a opozanților) prin diverse măsuri care au generat sute de proteste. Informații despre averile liderilor de la Kremlin, cazuri de corupție și frica de o mai eficientă organizare și comunicare de care pot beneficia opozanții sistemului, au facut ca Moscova să adopte măsuri represive asupra internetului. Interzicerea serverelor proxy și a rețelelor virtuale private (VPN – tehnologii ce oferă posibilitatea de a naviga anonim), sunt doar câteva din măsurile luate de Rusia.
În prezent, în Rusia, accesul la retelele WiFi gratuite este condționat de introducerea numărului de telefon(rusesc) iar bloggerii cu mai mult de 3.000 de vizitatori zilnici trebuie să își înregistreze datele personale unui regulator(Roskomnadzor). Pentru a reduce dependența de serviciile străine și pentru a-și putea controla mai eficient populația din mediul online, Rusia și-a creat propriul Google(Yandex) și propriul Facebook(Vkontacte), fiind conștientă de importanța și valoarea datelor utilizatorilor în propagarea și dezinformarea generală.
De ce totuși funcționează așa de bine această dezinformare?
De multe ori, oamenii sunt leneși în procesul de gândire. Literatura de specialitate prezintă cum un fenomen cunoscut ca “sleeper effect” arată că slaba credibilitate a unei surse poate creea convingere odată cu trecerea timpului. Deși inițial oamenii asociază credibilitatea unei surse cu informația diseminată, cu trecerea timpului acestea se disociază, iar o informație poate deveni cu timpul“discutabilă”, uitându-se sursa îndoielnică.
De asemenea, informația care se presupune inițial ca fiind validă iar ulterior demonstrându-se falsă, poate continua să modeleze gândirea și poate influența percepția oamenilor. Chiar și atunci când oamenii sunt conștienți că anumite surse nu sunt de încredere, abilitatea lor de a clasifica gradul de încredere al informației este destul de neclară.
Subiectele familiare pot fi atractive, chiar dacă mesajele lor sunt false. Informațiile care sunt asociate cu identități ale utilizatorului și care trezesc emoții pot fi deosebit de convingătoare. E mult mai usor ca cineva să accepte o informație ca fiind adevarată atunci când ea e asociată cu alte informații pe care persoana le consideră adevărate.
Oamenii au de asemenea prejudecăți cognitive(biasuri) și neglijează deseori calitatea argumentelor în detrimentul opinilor determinate de aceste erori de raționare. Prezentarea multiplelor argumente de către multiple surse creează o credibilitate mult mai mare decât prezentarea mai multor argumente de o singură sursă sau prezentarea unui argument de mai multe surse.
O persoană dezinformată care crede cu tărie în opinia pe care o are, va accepta cu greu dovezi care sa-i schimbe părerea. S-a observat de asemenea, ca mesajele care sunt prezentate într-o notă de mânie, sunt mai convingătoare pentru cei care o prezintă stare de nervozitate la momentul respectiv.
Chiar dacă informația este falsă, prezența dovezilor(false) și furnizarea cât mai multor detalii poate crește credibilitatea acesteia.
Nici inconsistența mesajelor transmise de Rusia pare să nu fie o așa mare problemă. Evenimente precum prăbușirea zborului MH-17 au generat mesaje contradictorii din partea oficialilor de la Kremlin, cu privire la producerea incidentului. Rușii au venit cu numeroase teorii despre cum a fost doborată aeronava, și de către cine, acestea fiind putin plauzibile. Lipsa consistenței s-a observat și la Vladimir Putin. Un exemplu e legat de Crimeea, despre care la început, Vladimir Putin a negat că dorește anexarea ei, în cele din urmă recunoscând ca planul acesta l-a avut de multă vreme.
Dacă totuși sursele sunt inconsistente, cum pot fi ele credibile?
Studii au arătat că inconsistența mesajelor poate influența gândirea cognitivă într-un mod în care oamenii încearcă să înțeleagă ce a dus la schimbarea opiniei emițătorului. Totuși, atunci când schimbarea opiniei vine cu argumente mai puternice ca prima oară și cu mai multe detalii, oamenii tind să perceapă mesajul ca fiind mai convingător, iar sursa să pară mai credibilă.(venind cu o altă opinie și deci preocupându-se importanța subiectului).
Dacă inconsistența mesajelor de pe canelele mass-media(RT de exemplu) poate fi “scuzată” prin atribuirea erorilor anumitor jurnalisti sau anumitor erori de redactare/tehnice, atunci când e vorba de credibilitatea lui Vladimir Putin, lucrurile nu sunt asa simple. Chiar și așa, majoritatea oamenilor au așteptări destul de mici atunci cand vine vorba de declarațiile politicienilor, iar asta poate să nu afecteze atât de serios credibilitatea și inconsistența mesajelor pe termen lung, creând impresia de ceva normal și nicidecum ieșit din comun.
Soft Power
La fel ca Twitter, social media este și ea doar o mica parte din arsenalul Moscovei, în acest război al informațiilor și al influenței. Deși poate cu o propagare a informațiilor mai puțin dinamică, dar sigură, Moscova a început să construiască, după căderea Uniunii Sovietice, o vastă rețea de Soft Power.
Termenul a fost introdus de politologul american Joseph Nye la sfârșitul anilor 1980 și definit ca o capacitate de a-i atrage și convinge pe alții să facă lucrurile de care tu ai nevoie, fară a-i forța. Dar această capacitate nu este întotdeauna folosită în scopuri bune, propaganda fiind un exemplu de soft power. Rusia a început să se folosească în mod real de aceasta capacitate începând cu anii 2000, după crearea agenției Rossotrudnichestvo( Agenția Federala pentru Comunitatea Statelor Independente, a Diasporei si Cooperării Umanitare) cu scopul de a crea organizații pro-ruse peste hotare și de a promova “Lumea Rusă”(Russkiy Mir).
Acestea, pe lângă rolul de a disemina propagandă, au și rol de a îndoctrina și de a colecta informații. Soft power se referă la metode și instrumente dezvoltate în intreaga lume(în special în tările Baltice, Ucraina, Germania), prin care Rusia încearcă să-și atingă obiectivele strategice fără utilizarea forței, prin informații și influență.
Mediile în care soft power este folosită de Rusia sunt nenumărate, dar le putem clasifica în câteva arii importante:
Media Tradițională: Este reprezentată în special de agențiile mass-media ale Kremlinului, printre care RT(cu un buget de 300 mil.$/an), TASS sau Sputnik.
New Media: reprezentată de canalele de Social Media
Societatea civilă: programele de tipul “Exchange Students” – aproximativ 250.000 de studenți stăini(majoritatea din fostele state Sovietice) aleg să studieze anual în Rusia iar 35.000 de studenți ruși au ales să studieze în afara țării în anul 2017
Diaspora ajută într-o mare măsură în promovarea doctrinelor și influențelor Rusiei, în Ucraina fiind 8,3 mil de ruși, urmată de Kazakhstan(3,1 mil) și alte state vecine.
În SUA sunt aproximativ 3,1 mil de ruși iar în Germania 1,2 mil. Printre alte state cu un număr mare de ruși se numară Israel(1 mil), Canada(550 mii), Franța(300 mii). În Romania sunt înregistrați aproximativ 30 mii de cetățeni ruși.
Cultură: Centrele culturale sunt de asemenea cunoscute ca fiind o sursă de soft power, ele având și rolul de a educa și a propaga ideologiile de la Moscova. Fundațiile afliliate oligarhilor ruși și implicit Moscovei, care oferă burse dar și ajutoare caritabile, sunt de asemenea incluse în această vastă rețea, alături de think-tank-uri și diverse asociații si alte mici fundații.(ex: organizații religioase). Rusia are de asemenea o vastă istorie care a dat de-a lungul timpului renumiti artiști de renume(pictori, muzicieni), care au promovat “Lumea Rusă” în Vest.
Sport: Evenimentele sportive găzduite de Rusia (Campionatul Mondial de Fotbal din Rusia, de anul acesta) sunt momente bune de care rușii pot profita pentru a-și promova ideologiile.
Turism: Deși pentru majoritatea țărilor din lume este nevoie de viză, Rusia a ușurat în ultimii ani procesul de obținere al vizei, devenind tot mai conștientă de importanța pe care o are turismul în atingerea scopurilor. Totodată, tot mai mulți ruși vizitează Europa si SUA.
Industrie: De aici nu lipsesc nici companiile de stat(ex: Gazprom, Rosnef) care au creat și mențin o dependență economică în vest.
Soft power mai este prezent si in domenii precum cel culinar(de ex. Magazinele Berezka din Romania), sau produse de lux.
Twitter oferă o modalitate mult mai rapidă de comunicare în comparație cu alte canale de social media. Postările mai scurte, împreună cu timpul mai rapid de citire, determină o utilizare mult mai mare și la fel și o rată de actualizare. Am văzut utilitatea acestei viteze în eforturile de ajutorare în caz de dezastre. Dar o mare parte din informațiile din tweet-uri se concentrează pe prezent și viața lor este efemeră. O cercetare din 2009 a arătat că aproximativ 40% din tweet-uri ar putea fi foarte bine clasificate ca fiind făra valoare. Chiar și așa, 2009 a fost începutul zilelor pentru Twitter. Azi, site-urile de social media permit postarea multor alte tipuri de date, ceea ce a dus la o mare mai valoare și un număr mai însemnat de utilizatori. În prezent, utilizatorii pot pune în tweet link-uri către alte site-uri, pot să încarce fotografii, videoclipuri sau chiar să facă streaming live, de pe dispozitivele mobile sau chiar ceasuri inteligente. Toate aceste implementari au complicat însa un pic munca de analiză, facând-o mai complexa dar și mai interesantă.
Dacă aceste platforme sociale sunt utilizate pentru a comunica, trebuie să știm ce fel de comunicare există, dar și scopul utilizatorilor, înainte de a ne putea da seama de potențialele utilizări ale informațiilor. O cercetare a identificat faptul că oamenii folosesc acest mediu de microblogging din trei motive majore: "schimbul informațiilor, căutarea informațiilor și relațiile de prietenie".
Studiile consideră trei tipuri de bază ale conținutului social media: conținutul propriu-zis, link-urile de legătură și metadata. Există numeroase tipuri de conținut: postări pe bloguri, comentarii, forumuri, imagini, video, podcasturi etc. La fel și tipurile de legături: relații între oameni si conținut, oameni și oameni, oameni și grupuri și altele; dar poate cele mai numeroase sunt informațiile din metadată, care reprezintă partea de sub apă a aisberg-ului. Oră, dată, loc, influență, urmăritori, contacte, profil, geolocație, tip de dispozitiv și multe altele, le gasim în metadată. Din aceste trei tipuri de bază enumerate mai sus se pot face corelații infinite.
TIPURI DE ANALIZĂ
Influența
Se pot face diverse tipuri de analiză pe datele de pe Twitter, unul din ele fiind influența.
Google a fost printre primii care a găsit un răspuns la întrebarea legata de cât de semnificativă e o pagină, cu PageRank, care utilizează legăturile dintre pagini și folosește algoritmi pentru a-și da seama de relevanța paginilor. Cu toții putem afirma că rezultatele căutărilor noastre pe Google sunt mai mult decât satisfăcătoare.Pe Twitter, utilizatorii pot să urmărească ceilalți utilizatori și pot fi urmăriți de alții în mod independent și fără permisiune. Există de cele mai multe ori, cu siguranță, o reciprocitate semnificativă a legăturilor dintre ei. Problema găsirii celor mai influenți oameni este menționată mai jos.
Atunci când ne uităm la importanța și influența unui tweet, ne uităm la numărul de repostări ale lui, de către alți utilizatori(retweet), numărul menționării persoanelor, numărul comentariilor și a „like-urilor”(reprezentate de o inimă). Importanța unui subiect poate fi dată și de hashtag(#), acesta venind deseori în ajutorul analiștilor, care pot organiza conținutul mai ușor. S-a mai observat de asemenea că repostările pot fi o măsura a valorii conținutului iar menționarea oamenilor îi încurajează să posteze.
Au fost studiate inclusiv metodele prin care influența unui utilizator poate crește. S-a observat că liderii trebuie să se dedice serios pentru a putea construi și a menține o influență asupra urmăritorilor. Useri precum CNN sau alte mari agenții media sunt repostați de sute de mii de ori datorită conținutului și numărului mare de urmăritori. La fel și persoanele celebre. Însă pentru userii obișnuiți e mai greu. Pentru a putea reuși și a căpăta influență, ei trebuie să se concentreze pe un singur topic(eventual cu subiecte controversate) și tweet-uri atractive. Cu toate acestea, efemeritatea mesajelor se observă atunci când popularitatea subiectului scade în celelalte medii.
Într-un alt studiu s-au analizat mai multe caracteristici ale unui tweet(număr de urmăritori și urmăriți, numărul tweet-urilor favorite, vârsta contului și numărul și frecvența postărilor), pentru a afla elementele care pot influența repostarea unui tweet. S-au utilizat 74 de milioane de mesaje, care au constituit în jur de 2-3% din totalul lor, în perioada de colectare. S-a observat că adăugarea unui URL crește șansele ca tweet-ul să fie repostat. La fel și adăugarea unui hashtag dar și numărul de urmăritori și urmăriți este relevant. Surprinzător este faptul că numarul postărilor totale de la crearea contului nu a influențat numărul repostărilor.
S-au studiat inclusiv sarcinile fiecărui comportament de pe Twitter și rolul lui legat de influența conținutului. Au fost identificate cinci roluri:
Inițiatorul discuției: individul care pornește conversația
Amplificatorul este cel care vine cu multiple gânduri, idei și opinii(brute), pe care le împărtășește
Curatorul, adica individul care folosește un context mai larg pentru a-și defini ideile
Comentatorul, care detaliază și șlefuiește ideile
Observatorul, care are un interes pasiv în conversație
Cocluziile au arătat că utilizatorii pot fi clasificați în aceste rolulri în corelare cu numarul repostărilor iar în comparația cu comportamentul lor din lumea reală, exista mari similitudini.
Limbaj
Din cauza spațiului restrâns al postărilor, utilizatorii Twitter au dezvolatat un vocabular abreviat. Lăsând la o parte nevoia de traduceri, în cazul unor analize există și caracteristica limbajului specific. Înainte de a se putea încărca și alte tipuri de formate în postări(foto, video, URL), limbajul de pe Twiiter era de multe ori un mix de numere, litere, jargon și chiar grupuri de litere, care alăturate, sună precum alte cuvinte(ex: “u r” for “you are” or “l8tr” for “later”)”.
S-au studiat chiar și diferențe de gen ale limbajului de pe Twitter, observându-se de exemplu că femeile folosesc mai mult „LOL”, în timp ce bărbații „LMFAO”. Termenii „bro” sau „dude” indică persoane tinere iar femeile tind să repete unele litere în cuvinte(ex: „niceeee”, „nooo waaay”).
Ca umare a complexității caracteristicilor de limbaj, analiștii au nevoie de un nivel foarte bun de cunoaștere culturală pentru a întelege și a interpreta corect conținutul. De asemenea, în cazul proceselor automate, algoritmii vor trebui modificați frecvent pentru a ține pasul schimbărilor de limbaj.
Validitate
În era „Fake News-ului”, validitatea mesajului trebuie privită cu mare atenție. La fel ca informațiile din toate celelalte surse, și conținutul tweet-urilor trebuie verificat serios. De altfel, așa cum am prezentat în capitolul anterior, s-a dovedit că Twitter și Facebook sunt cele mai mari canale prin care se răspândesc informații false.
Predictie
Studii au analizat utilizarea Twitter pentru a face prognoze. Au fost analizate 2.89 de milioane de tweeturi(de la 1.2 milioane de utilizatori) care făceau referire la filmele din box-office și au fost corelate cu încasările lor. Au fost folosite elemente precum repostările, like-urile și analiza sentimentelor, pentru a construi regresia liniară. Rezultatele foarte bune au depăsit prognozele oficiale de la Hollywood și au arătat că informația colectivă, atunci când este bine analizată, poate furniza date destul de clare ale evenimentelor viitoare. Avantajul utilizării Twitter în studiul prognozelor este ciclul scurt de viață al subiectelor. S-a observat în general că predicțiile au fost mai precise pe elemente cu o durată de viata mai scurtă, comparativ cu cele cu un ciclu de viață mai lung.
Analiza de sentiment
Analiza sentimentelor utilizează clasificări pentru a vedea opinia utilizatorului în diferite scenarii. O mulțime de tehnici automate de analiză de text, utilizează reguli de corelare și modele secvențiale împreună cu algoritmi de învățare automată. Mai mult de atât, algoritmii de tip ”machine learning” devin din ce în ce mai avansați iar recentele dezvoltări în lingvistica computațională (natural language processing) creează modele pentru a furniza informații cât mai exacte legate de limbaj.
Nișa acestor programe este una în dezvoltare dar există opțiuni prin care analiștii pot realiza acest tip de evaluare. Am folosit in cercetările făcute, MeaningCloud, un motor care foloseste caracteristicile limbajului natural avansat în toate aspectele legate de morfologie, sintaxă, semnatică si pragmatică.
Motorul generează arbori de text sintactico-semantici, iar apoi termenii lexiconului sunt aplicați, pentru a identifica polaritatea analizând întreg contextul pentru acuratețea rezultatului.Motorul returnează 6 nivele de polaritate: pozitiv(P), negativ(N), foarte pozitiv(P+), foarte negativ(N+), neutru(NEU) și nici unul(NONE) în situația în care nu a fost detectată nicio polaritate.
Locație
Geolocația este un aspect esential în analiza de informații. Geolocatia nu se face automat pe Twitter, unde userii pot selecta singuri o locație(a contului), fiind un câmp liber. Locația postării poate fi activată utilizând coordonatele GPS-ului dipozitivului. Chiar și așa, nu foarte mulți utilizatori iși dezvăluie locația de unde postează, studiile arătând undeva între 1-2% din numarul total al postărilor. Am putea spune că totul este în zadar, însă există și alte tehnici prin care putem deduce locația. Metadata din spatele postării ne ajută cu câteva indicii precum fusul orar. Putem face și alte corelații ale orei postării mesajelor cu data evenimentelor sau detalii de pe diferite conturi ale utilizatorului, dacă există.
Frauda
Frauda a fost studiată îndelung ca o problemă prezentă în tot domeniul informațiilor. E foarte dificil să știm cu adevărat cine e în spatele ecranului. Există totuși numeroase tehnici care pot demasca individul, uitilizând algoritmi și observând modele.
Așa cum Moscova are propria armată de „trolli”, nici China nu e mai prejos. Așa numita “internet water army” este formată din oameni plătiți pentru a posta și comenta, având diverse obiective ascunse.Studii au descoperit modele de comportamente specifice care au permis detectarea lor prin analize statistice. În aceste modele sunt incluse numarul și viteza postărilor și a repostărilor, timpul mediu dintre postarea conținutului, numărul de zile în care userul a rămas activ sau inactiv, etc. Au fost identificate și conturi împărțite de mai mulți utilizatori din diverse zone într-un timp foarte scurt dar și multe conturi create într-un timp foarte apropiat și scurt.
Instrumente de analiza
Industria a creat numeroase ghiduri și instrumente pentru a monitoriza și analiza social media și implicit Twitter. Problema acestora este că iți ofera ce vor și nu totdeauna ce ai tu nevoie. Opțiunea de a dezvolta o aplicație croită pe nevoile analistului este una profesionistă și trebuie luată în calcul. Totusi, dacă analistul nu a mai lucrat deloc cu acest tip de date, opțiunile existente în industrie merită încercate.
Prima problema de care se lovesc analiștii sau cercetătorii, atunci când folosesc Twitter, este cea a colectării datelor.
Atâta timp cât datele de pe Twitter sunt publice, presupunem că le putem folosi cum dorim. La începuturile Twitter-ului, accesul la date nu era așa de constrans ca în ziua de azi. Accesul se face printr-o interfață programabilă a aplicației (API- Application Programming Interface), exstând două fluxuri de date: REST API și Streaming API, cu roluri diferite. Din păcate, aceste API-uri nu sunt clar definite și se pot schimba în orice moment, creând confuzii. În implementarea lor, Twitter a restrâns semnificativ accesul la întreg fluxul de date(”fire hose”). Acest lucru complică munca analistului în a putea avea acces la întreg setul de date și îngreunează problemele acestuia cand se dorește colectarea datelor pe un anumit segment.
Twitter a avrut mereu o relație dificilă cu comunitatea de dezvoltatori. Inițial a încurajat dezvoltarea aplicaților de tip third-party, ulterior constrângându-le. La fel s-a întamplat și cu conferințele organizate special cu dezvoltatorii, pe care le-a redus treptat, iar uneltele special create pentru a veni în ajutor au fost uitate sau nu s-au mai dezvoltat. În ciuda recunoașterii acestor probleme, compania nu a reușit să-și recâștige încrederea în fața dezvoltatorilor.
În prezent, Twitter încearcă să-și îmbunătățească relațiile acestea, anunțând o noua viziune și un nou drum pentru API-ul lor, prezentând chiar etapele în care lucrurile urmează să se implementeze.
Twitter de abia acum începe să beneficieze de investiția făcuta în compania Gnip, un partener pe care Twitter l-a lăsat să colecteze toate datele care au trecut vreodată prin serverele lor și pe care l-a cumparăt în 2014. Ideea a fost construirea unei echipe care să folosească infrastructura de tip Big Data pentru analiza datelor, pe care să le vândă companiilor interesate, ca date brute sau direct prelucrate.
Majoritatea dezvoltatorilor înca folosesc metodele tradiționale de colectare, în timp ce marii dezvoltatori pot beneficia contra cost de serviciile Gnip, care au o mai mare deschidere. API-ul Gnip permite accesul la întreg fluxul de date și oferă funcționalități mai mari decât metodele tradiționale. Prețurile mari i-au facut însă pe dezvoltatori să se plângă de asta, iar Twitter a promis că va integra cele 2 API-uri (Gnip și cel tradițional), pentru a crea unul singur, disponibil tuturor. Compania nu a anunțat prețurile dar a menționat ca vor exista și variante gratuite, încercând să mulțumească pe toată lumea.
Colectarea Datelor
Se poate face având cunoștințe minime de programare, folosind diverse limbaje(JAVA, Python) pentru a interoga API-ul Twitter. Dacă analistul nu dispune de cunoștinte, există câteva opțiuni care pot într-adevăr să colecteze conținutul împreună cu toată metadata. Aplicația pe care am folosit-o este Tweet Archivist Desktop, care poate interoga Streaming API-ul Twitterului o data la 5 minute. Deoarece restricțiile permit doar 1500 mesaje/interogare, putem captura în jur de 18000 mesaje/ora/interogare. De multe ori, volumul datelor colectate prin această metodă e suficient pentru a face o analiză destul de cuprinzătoare.
Interogarea se poate face utilizând cuvinte cheie și/sau hashtag-uri dar exista și alte combinații de interogări.
După interogare, este posiblă salvarea rezultatelor în două tipuri de formate: Excel .xlsx(având predefinite doar 15 câmpuri de date– id, username, sursa dispozitivului, data, limba, etc.) sau .JSON(întreaga metadată a conținutului), care conține peste 700 de câmpuri de date pentru un singur tweet.
În analize, recomand folosirea formatului .JSON datorită numărului mare de date pe care il oferă.
Exemple de câmpuri de date care pot fi exploatate:
statuses – created_at: Data și ora postării tweet-ului
statuses – id: ID-ul userului care a postat conținutul
statuses – text : conținutul tweet-ului
statuses – entities – hashtags – text : hashtag-urile prezente în conținut
statuses – entities – user_mentions – screen_name : userii menționați
statuses – source : sursa dispozitivului (iPhone, iPad, Android, Web etc.)
statuses – user – description : descrierea userului
statuses – user – url : URL-ul menționat
statuses – user – followers_count : numărul de urmăritori ai userului
statuses – user – created_at : data creării contului
statuses – user – favourites_count : numărul de like-uri
statuses – user – time_zone : fusul orar al userului
statuses – user – statuses_count: numărul de postări al userului
statuses – user – lang : limba userului
statuses – retweeted_status – text : mesajul original (daca conținutul a fost repostat)
statuses – retweeted_status – entities – hashtags – text : hashtag-urile originale (daca a fost repostat)
statuses – retweeted_status – user – created_at : data creării contului userului (daca a fost repostat)
etc.
Pentru a putea vedea mai clar datele , formatul .JSON fiind un format semi-structurat, trebuie convertit într-un format structurat(.csv sau .xls). Pentru asta există diverse tool-uri, un exemplu fiind Opal CSV Converter. Aplicația permite și eliminarea din start a unor coloane care nu ne sunt utile.
După ce am salvat, putem importa datele în diferite software-uri de analiză și vizualizare.
Traducerea datelor
Dacă de exemplu avem nevoie de traducerea datelor pentru a face analiza sentimentelor sau pentru a înțelege mai bine ce vor utilizatorii să spună, avem nevoie de un serviciu care să ne permită traducerea rapidă a poate sute de mii de câmpuri. Pentru asta putem utiliza Google Spreadsheet împreună cu API-ul Google Translate.
Datele trebuie importate într-o pagină Google Spreadsheet iar apoi putem face automat traducerea lor folosind formula din Google Translate((=GOOGLETRANSLATE(CELL;”lang1”;”lang2”)), care ne permite traducerea tuturor câmpurilor de care avem nevoie.
Analiza sentimentelor
MeaningCloud, pe care l-am prezentat mai sus, poate fi folosit ca o extensie pentru Excel(având deja datele în format Excel). Acesta clasifică conținutul în funcție de polaritatea sentimentelor și de asemenea e capabil să facă clasificări pe diverse arii.(Politic, Militar, Social, Sănătate etc.)
Având toate datele preparate, le putem importa în software(Tableau, Alteryx etc.) care ne permit analiza lor, utilizând funcții și formule, statistici, corelații, etc.
Putem întâmpina dificultăți precum parsarea datei și a orei, care trebuie sa fie cât mai precisă.
Exemple:
Numărul conturilor în funcție de anul creării contului
Numarul conturilor in funcție de anii creării conturilor si limba conținutului
Cele mai repostate tweet-uri
Zonele unde au fost repostate cel mai mult mesajele
Concluzii
Am analizat 4 seturi de date din perioade diferite.
Alegerile din Olanda (Perioada:14-15 martie 2017; Cuvinte cheie: buma, ikstem, klaver, pechtold, roemer, rutte, verkiezingen, wilders, dutch elections)
Alegerile din Franta (Perioada: 22 aprilie-7mai; cuvinte cheie:macron, le pen, french elections)
Perioada dinaintea exercițiilor NATO din zona Baltică (NATO, Lithuania, Letonia, Estonia)
Perioada 12-18 ianuarie 2018; cuvinte cheie: NATO, Russia
Pentru fiecare set de date am colectat în jur de 150.000 de tweet-uri, iar în urma analizei, am facut urmatoarele observații:
O activitate foarte mare(volum) observată în perioada dinaintea alegerilor, cu prezența narativelor care susțineau candidații naționaliști și mesajelor speculand problemele ambelor țări în privința emigranților.
Conturi nou create pentru diseminarea informațiilor înaintea evenimentelor.
Multe conturi false de boti/troli care se terminau cu 8 caractere (ex: DavidJo52951945)
Mesaje fără sursă
Profiluri cu imagini pro-vest care diseminează informații anti-occidentale
Conturi cu o frecvență a postării mesajelor foarte mare (postări o dată la câteva minute)
Conexiuni între conturi care diseminează informații(follower-follower)
Cum putem stopa răspândirea propagandei în mediul online?
Consider că poate cel mai important aspect îl reprezintă educația privind modul în care oamenii consumă informația în mediul online. Investind în educație și încurajând jurnalismul de investigație îi va face pe oameni să gândescă mai mult și mai critic atunci când se lovesc de subiectele de zi cu zi.
De asemenea, o mai bună comunicare între instituțiile și organziațiile mondiale trebuie susținută, în vederea dezvoltării programelor de informare în contracararea propagandei. Deși NATO și UE au propriile centre care analizează războiul informatic, propaganda și comunicarea strategică, la sfârșitul anului trecut a fost înființat un nou centru pentru contracararea amenințărilor hibride, la Helsinki, contribuind astfel la o mai bună securitate și o mai strânsă colaborare NATO-UE. Uniuniea Europeană a votat de asemenea o rezoluție care să stopeze dezinformarea și propaganda rusă, acțiune criticată de Vladimir Putin.
Cu toate că putem vedea lucrurile mișcându-se în acest război al informaților, instituțiile sunt încă nepregătite și nu pot face față volumului mare de propagandă și dezinformare. De aceea, una din soluții o reprezintă conștientizarea individuală a fenomenului și cât mai multe întrebari când suntem puși față în față cu informația.
Bibliografie
František Vrabel, Jakub Janda. (2016). How Russian Propaganda Portrays European Leaders.
George C. Marshall European Center for Security Studies. (2016). Countering Russian Propaganda, vol.7
NATO Strategic Communications Centre of Excellence(2017). Redefining Euro-Atlantic Values: Russia`s Manipulative Techniques.
Russia Studies Centre.(2016). Cyberwar:Russia’s Statecraft in the Fifth Domain.
NATO Strategic Communications Centre of Excellence(2017).Robotrollin.
Labreque, A.(2013), Study of Social Networking Exploitation Tools.
Mike Winnerstig. (2016). Russian Soft Power and Non-military Influence in the Baltic States.
Open Source Intelligence Gathering Handbook,( 2001) NATO.
Dr. Bruce Forrester. (2013). Twitter as a Source for Actionable Intelligence.
Choy, M., M.Cheong, M.N. Laik, and K.P. Shung, US Presidential Election 2012 PedictionPrediction using Census Corrected Twitter Model, 2012.
Jianshu W., L.Ee-Peng, J. Jing and H. Qi. (2013). TwitterRank: finding topic-sensitive influential twitterers, in Proceedings of the third ACM international conference on Web search and data mining, ACM: New York, USA.
Bongwon Suh, Lichan Hong, Peter Pirolli, and Ed H. Chi.(2011). Want to be Retweeted? Large Scale Analytics on Factors Impacting Retweet in Twitter Network
Tinati, R., L.Carr, W. Hall and J.Bentwood.(2012). Identifying Communicator Roles in Twitter
Colbath, S. and A. Srivastava.(2012). MAGPIE: A System for Triaging and Translating Social Media, in HFM-201 Specialist Meeting on Social Media: Risks and Opportunities in Military Applications, R. NATO
Yang, Z., J. Guo, K. Cai, J. Tang, J. Li, L. Zhang, and Z. Su.(2010). Understanding retweeting behaviors in social networks, in Proceedings of the 19th ACM international conference on Information and knowledge management
Medoza, M., B. Poblete, and C. Castillo.(2012). Twitter Under Crisis: Can we trust what we RT?, in 1st Workshop on Social Media Analytics
Asur, S., Huberman, B., Predicting the Future With Social Media. (2009) Disponibil la: http://www.hpl.hp.com/research/scl/papers/socialmedia/socialmedia.pdf
Miner, G., D. Delen, J. Elder, A. Fast, and R. Nisbet.(2012). The Seven Practice Area of Text Analytics, in Practical Text Mining and Statistical Analysis for Non-Structured Text Data Applications, Elsevier Inc.
Yu, S. and S. KakKaka, A. (2012).Survey of Prediction Using Social Media, Oklahoma State University: Stillwater, Oklahoma
Haewoon, K., L. Changhyun, P. Hosung, and M. Sue.(2013). What is Twitter, a social network or a news media?
Chen, C., K. Wu, V. Srinivasan, and X. Zhang.( 2012). Battling the Internet Water Army: Detection of Hidden Paid Posters. Proceedings of the 21th international conference on World Wide Web,
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Analiza Osint Și Propaganda Rusă Contra Statelor Nato În Mediul Online Tita Alexandru Mihai Studii De Securitate 2018 [302067] (ID: 302067)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
