Nevidljiva infrastruktura: Tokovi podataka

01-06-2015

prethodnoj priči smo istražili uzbudljiv život malog internet paketa, ali kako bismo stvorili širu sliku toka podataka i mapirali ključne lokacije i igrače, sproveli smo širu analizu putanja podataka do 100 najposećenijih sajtova korisnika interneta u Srbiji.

networktopology

Koristili smo Nmap i softver za istraživanje mreže kako bismo trejsrutovali i vizualno prikazali putanje do 100 najposećenijih sajtova korisnika interneta u Srbiji, prema kompaniji Alexa koja se bavi internet analitikom, u vlasništvu Amazona1. Slično našim prethodnim mapama, svaka tačka predstavlja jednu IP adresu (ruter ili drugi mrežni uređaj) i linije između tačaka su veze, kablovi koji ih povezuju.

nationalflow2

Nacionalni saobraćaj

Na put oko mreže se kreće sa žute tačke u centru mape. Posle par lokalnih skokova, sav saobraćaj odlazi na nekoliko tačaka. Pošto je Share Lab povezan na internet preko SBB-a, najvećeg regionalnog internet provajdera, rezultati ovog istraživanja su bazirani na njihovoj mreži. Zanimljivo je da svi podaci putuju do njihovog servera u Beogradu, u SBB TelePark, i da sav saobraćaj do lokalnih veb sajtova ide kroz jednu tačku (bg-ds-r-1-oe0-0-0-1sbb.rs)

Tako da, hipotetički, ako bismo želeli da ispitamo, filtriramo ili zadržimo sav nacionalni saobraćaj koji ide preko SBB-ove mreže, mogli bismo to da uradimo koristeći samo ovu jednu tačku. Štaviše, SBB kao i ostali internet provajderi u Srbiji obavezani su zakonom o zadržavanju podataka da rade upravo to – da skladište sve metapodatke o internet saobraćaju i omoguće pristup državnim organima.

Od uskog grla nacionalnog saobraćaja, putanja vodi ka različitim susedskim ruterima (peering routers) ili do čvorišta za razmenu Internet saobraćaja i ostalih telekomunikacionih servisa – Serbian Open Exchange (SOX). Kao što smo već objasnili u našoj mapi umreženosti Srbije, mreže koje drže različiti internet provajderi u Srbiji spajaju se na fizičkim lokacijama gde su njihovi ruteri povezani kablovima. Na tim mestima mreže se utapaju u jedan sistem, omogućavajući nam da se povežemo na druge uređaje povezane na bilo koju mrežu.

SOX

Tačke lokalne razmene dozvoljavaju podacima da teku lokalnije, kao što i sam naziv kaže, značajno kraćom putanjom u poređenju sa onom koju prelaze kada nema direktne veze između dva provajdera. U tom slučaju moraju ići preko trećeg provajdera ili čak kroz drugu zemlju. U Srbiji, nažalost, postoji samo jedna tačka internet razmene i većina paketa putuje u Beograd iz bilo kog drugog kraja Srbije. Kada bi postojalo više lokalnih tačaka razmene u različitim krajevima zemlje, podaci bi putovali više lokalno što bi značajno skratilo njihove rute.

Ali postoji još jedna zanimljivost na mapi i to je tačka na Telenorovim serverima, koja je deo SOX mreže (mainstream-telenor.sox.rs) i povezuje najposećenije sajtove u Srbiji. Ona pripada kompaniji Maintream d.o.o. osnovanoj 2005. koja pruža usluge hostinga i održavanja.

Više od polovine lokalnih sajtova iz našeg uzorka su hostovani kod ove kompanije. Većina njih ima rekove za servere u tri data centra u Beogradu, ali prema našem istraživanju većina ih je smeštena kod Telenorovog Tier3 Data Centra.

Telenor-Data-Center

Based on our map we can conclude that there is a high level of centralization of the local  internet traffic. We can define 3 different levels of centralization :

  1. Centralizacija na nivou internet provajdera – jedna tačka na kojoj se dalje preusmerava sav saobraćaj
  2. Na nivou tačke internet razmene (IXP) – postoji samo jedna takva tačka u Srbiji
  3. Na nivou hostinga – većina najvećih domaćih sajtova je hostovana kod jedne kompanije

Telenor Tier3 Data Centar

Tačke centralizacije su tačke moći i što se više rutera ili provajdera sreće u jednoj tački to je veći značaj te tačke, rutera, servera. Bitno je znati ko ih kontroliše jer ti entiteti imaju kontrolu nad internetom u Srbiji i, u datim okolnostima, mogu upotrebiti ili zloupotrebiti moć.

 

exitnodes

Izlazne tačke

Istraživanjem smo uspeli da utvrdimo nekoliko glavnih putanja kojim se kreću podaci kada izlaze iz zemlje. Slično centralizaciji lokalnog toka podataka kroz jedan ruter, naišli smo i na nekoliko glavnih tačaka kroz koje prolaze naši podaci pre napuštanja zemlje.

Dve najveće izlazne tačke na mapi, prema našem istraživanju, su:

at-be-r-1-pc1.sbb.rs : najviše povezana sa ruterima koju su u vezi sa DE-CIX u Frankfurtu

bg-yo-r-1-pc1.sbb.rs : povezana sa bpt-b4-link.telia.net koja vodi do rutera u Mađarskoj i Pragu

peer-A515169.sbb.rs : povezana sa sajtovima koji pripadaju Guglu

whereismy4-01

Podaci o toku podataka

Sada kada smo ustanovili glavna uska grla lokalnog internet saobraćaja i glavne izlazne tačke, pokušajmo da analiziramo glavne portove tj. tačke povezivanja i zemlje ka kojima naši podaci teku, vođeni konačnom odredištu.

Od 100 najposećenijih sajtova od strane internet korisnika u Srbiji, samo 27 je zapravo hostovano u Srbiji, a više od polovine tih hostuje jedna ista kompanija.

63% naših internet paketa napušta zemlju. Ispitajmo gde.

Jedan obimni tok podataka ide ka Budimpešti (25), zatim deo ka Beču (25) i Pragu (15). To su uglavnom tranzitni portovi koji dalje sprovode podatke ka Nemačkoj, Holandiji, Britaniji ili Švajcarskoj.

Frankfurt u Nemačkoj je svakako prestonica toka naših podataka, najveći tranzitni port podataka. Čak polovina naših internet paketa prođe tuda u nekom trenutku, uglavnom kroz DE-C IX internet tačku razmene koja nije samo najveća tačka skupljanja svih internet paketa iz Srbije, već najveće mesto internet razmene na svetu, spajajući više od 600 internet provajdera..

Iako je Frankfurt prestonica tranzita, tamo se zapravo ne hostuje mnogo podataka. Najveći udeo sajtova koji su hostovani u Evropi su situirani u Amsterdamu. Takođe je interesantno da je više od polovine tih 11 sajtova u vezi sa pornografijom. Ovo je ulica crvenih fenjera internetovog drugog po veličini porta.

data flow cities-01

Čak 36% naših poseta prelazi Atlantski okean ka SAD. Za razliku od evropskih država, kroz koje podaci uglavnom samo prolaze, u Americi su hostovani.

Kada se sagleda cela slika u vezi sa hostingom najposećenijih sajtova internet korisnika u Srbiji, može se zaključiti da je hosting Amerike svakako dominantniji u odnosu na EU i Srbiju, i to 36% SAD, 27% EU, 27% RS.

Što se tiče transfera podataka, najznačajnija tačka na istočnoj obali SAD-a je Ešburn (Ashburn) u Severnoj Virdžiniji – jedna od prestonica Interneta, domaćin velikom broju data centara, strateški komunikacioni centar za istočne zemlje SAD-a, veliki komunikacijski prolaz ka Evropi i najveća tačka spajanja mreža (Internet peering point ) u Severnoj Americi.

Naše istraživanje je pokazalo da su tačke krajnjih odredišta paketa iz Srbije najgušće koncentrisane na Zapadnoj obali, naročito u okolini San Franciska i Silicijumske doline. Međutim, ne možemo biti sigurni u to da li su ovo zaista krajnja odredišta ili samo maska. Nalazi drugih naših istraživanja ukazuju na to da se tačne lokacije nalaze negde drugde, naročito koncentrisane u Severnoj Virdžiniji, gde se nalaze veliki data centri Gugla, Fejsbuka i Amazona.

whereismap-01

Prema rezultatima našeg istraživanja, ispostavilo se da internet koji koristimo zapravo i nije tako decentralizovan, kakvim ga mi zamišljamo. Naš uzorak pokazuje da se on sastoji od glavnih lokacija za tranzit i hostovanje podataka, od prestonica protoka podataka koje su smeštene u svega 13 zemalja. Ova struktura se veoma razlikuje od prvobitno zamišljene decentralizovane mreže, ideje sa začetka interneta.

Sa druge strane, nijedan od 100 najposećenijih sajtova sa liste se ne nalazi van Evrope ili SAD-a.

Nacionalne granice Interneta

U svrhu ovog istraživanja, možemo da ispitamo dva tipa ‘granica’ koje postoje na internetu. Kako bi mogli da posluju u određenoj državi, internet provajderi su dužni da poštuju određenu zakonsku regulativu te države. Otud prvi tip granice.

Fizička infrastruktura, koju čine kablovi, ruteri, prekidači i serveri, fizički je postavljena na teritoriji jedne zemlje i nju poseduje i njom rukovodi određeni entitet, koji podleže državnoj regulativi. Ovo direktno ukazuje na odnose između države, internet provajdera i podataka koji putuju preko mreže. Tako su, na primer, internet provajderi koji posluju na teritoriji Republike Srbije, prema Zakonu o elektronskim komunikacijama, dužni da skladište sve metapodatke i da ih predaju po zahtevu određenih institucija.

Sa druge strane, provajderi imaju različite tačke spajanja sa drugim, najčešće susednim provajderima, kako bi omogućili svojim klijentima pristup čitavom internetu. U tom putovanju od jednog provajdera do drugog, podaci prelaze fiktivne granične tačke interneta. Granice koje se mogu odnositi na internet su iste one koje se nalaze i u ‘realnom’ svetu. Internet provajderi se mogu posmatrati i kao kontrolori i svaka potencijalna cenzura, filtriranje ili gušenje (throttling) saobraćaja će se najčešće izvesti u saradnji sa njima. Mapiranje tačaka spajanja nacionalnih i internacionalnih provajdera i analiza topologije mrežne strukture omogućavaju nam da bolje razumemo ključne tačke ove infrastrukture, gde bi se potencijalna cenzura, filtriranje ili zagušivanje saobraćaja mogli dogoditi.

Drugi tip granica koji bi mogao biti interesantan za naše istraživanje je taj stvoren samim veb sajtovima, internet platformama i aplikacijama. Svaki uređaj povezan na mrežu ima IP adresu, kako bi komunicirao sa drugim uređajima. Iako su IP adrese više logičke nego fizičke, koristeći samo IP adresu moglo bi se lako odrediti u kojoj zemlji se nalazi uređaj sa tom adresom. Ovo je izvodljivo zato što IP adrese korisnicima pripisuje samo jedna institucija – IANA (Internet Assigned Numbers Authority), koja dodeljuje opseg IP adresa entitetima zainteresovanim da ih kupe, ali čuva bazu podataka sa informacijama o tome kome pripada koji opseg i na teritoriji koje zemlje funkcioniše. Zbog ovoga, sajtovi, aplikacije i internet platforme mogu da odrede iz koje zemlje je posetilac i shodno tome dopuštaju ili blokiraju pristup sadržaju ili servisu. Razlozi za blokiranje pristupa sadržaju na nacionalnom nivou su razni i kreću se u rasponu od autorskih prava do blokiranja seksualnog, političkog ili verskog sadržaja pod pritiskom vlasti širom sveta. U ovom slučaju ulogu kontrolora igraju kompanije vlasnici tih veb sajtova ili aplikacija. Sigurno ste se na sajtovima poput Jutjuba već susreli sa porukom tipa: „Ovaj sadržaj nije dostupan u vašoj zemlji.”

Tok podataka i privatnost

Svi internet provajderi u Srbiji i većina provajdera u zemljama EU su još uvek zakonom obavezani da skladište metapodatke. Skladištenjem i obradom metapodataka, provajderi i državni organi su u stanju da prate trag i identifikuju izvor i destinaciju, datum, vreme, trajanje i tip komunikacije. Čak i bez pristupa samom sadržaju, metapodaci otkrivaju privatne informacije, nekad i u većoj meri nego što bi to učinio sam sadržaj.

U jednom video konferencijskom pozivu septembra 2014, Edvard Snouden (Edward Snowden) je objasnio: „Metapodaci izuzetno duboko zadiru u privatnost. Kao analitičar, radije bih radio sa metapodacima nego sa sadržajem, zato što je to brže i lakše i metapodaci ne lažu… Ako slušam vaš telefonski razgovor, možete da pokušate da zaobiđete suštinu, da pričate u šiframa. Ali ako gledam vaše metapodatke, znam koji broj je koji pozvao, znam koji je kompjuter sa kojim komunicirao.” Stjuart Bejker (Stewart Baker), bivši generalni savetnik Nacionalne bezbednosne agencije (NSA), kaže: „Metapodaci vam govore apsolutno sve o nečijem životu. Ako imate dovoljno metapodataka, sadržaj vam zapravo uopšte nije ni potreban.”

Koliko reči koje guglujete, svi naslovi vaših mejlova, mreža ljudi sa kojima komunicirate, veb sajtovi koje posećujete, navike kretanja i komuniciranja otkrivaju o vašem privatnom ili poslovnom životu? Analiza metapodataka značajno je efikasnija i više zadire u privatnost od tradicionalnih tehnika nadzora koje je praktikovao Štazi u bivšoj Istočnoj Nemačkoj, poznata kao jedna od najefikasnijih i najrepresivnijih tajnih obaveštajnih službi ikada, za koju se smatra da je tada upošljavala između 500.000 i dva miliona doušnika.

Ali bez naših podataka i metapodataka, komunikacija na internetu, ovakva kakvu je danas poznajemo, ne bi bila moguća i zbog toga dajemo internet provajderu saglasnost da tim podacima rukuje i da ih dalje obrađuje. Takođe, time što živimo u Srbiji ili nekoj od država EU, prema zakonima o zadržavanju podataka, mi smo saglasni da se naši metapodaci skladište, kao i da razni državni organi imaju pristup njima i pravo na obradu.

Uostalom, podaci su resurs koji pokreće internet industriju. Biznis modeli nekih od najvećih kompanija na internetu se zasnivaju upravo na prikupljanju i obradi naših privatnih informacija i automatskog profilisanja radi prodaje targetiranih reklama.

Imajući sve ovo na umu, ono što smo želeli da postignemo ovim istraživanjem jeste bolji uvid u nevidljive mreže i mehanizme koji su osnova tih procesa. U našem prethodnom radu, pažnja je bila prvenstveno usmerena ka pravnim aspektima ovih procesa i različitim slučajevima ugrožavanja ljudskih prava u onlajn prostoru, uglavnom u vezi sa privatnošću i slobodnom izražavanja. Kako bismo napredovali, verujemo da je neophodno da pokušamo da proučimo i razumemo tehničku realnost i procese skrivene ispod površine ekrana naših uređaja, kompleksan i nevidljiv spoj softverskih i hardverskih slojeva, skrojenih od nebrojeno mnogo linija koda i metara kablova, rutera i servera.

  1. http://www.alexa.com/topsites/countries/RS