Artikkeli on yli 6 vuotta vanha

Valheenpaljastaja: Näin löydät verkosta poistettuja tietoja

Pienet muovihahmot kaivavat dinosauruksen luurankoa esiin hiekasta.
Kuva: Shutterstock/Coffee Lover

Ei ole lainkaan tavatonta, että verkosta katoaa — tai yritetään kadottaa — tietoja. Poliitikot poistavat noloja päivityksiään, yritykset lopettavat toimintansa, joku jättää serverimaksut maksamatta. Syitä on monia. Sivut eivät kuitenkaan välttämättä ole kokonaan kadonneet. Valheenpaljastajan vinkeillä opit etsimään tietoja, jotka on poistettu internetistä.

Internetissä julkaistu sisältö ei suinkaan ole siellä ikuisesti, vaikka usein kuulee niin väitettävän. Internet-historiaa menetetään joka päivä, kun nettisivuja poistetaan, niiden sisältöä muutetaan tai palveluja lakataan ylläpitämästä. Useissa tapauksissa on kuitenkin mahdollista palata ajassa taaksepäin ja löytää näennäisesti kadonneita sivuja.

Internet-historiaa menetetään joka päivä.

Jos huomaat, että jotakin tietoa on muutettu tai jokin sivu on hävinnyt verkosta hiljattain, saatat vielä löytää siitä version Googlen välimuistista. Jos taas etsit jotakin kauan sitten kadonnutta, kannattaa kääntyä Wayback Machinen puoleen.

Esimerkiksi Radiohead-yhtye teki ovelan markkinointitempun juuri ennen uuden levynsä julkaisupäivää ja yritti pyyhkiä pois koko internet-historiansa. Bändi sekä tyhjensi verkkosivunsa kokonaan että poisti päivitykset sosiaalisen median tileiltään, kuten Twitteristä, Facebookista ja Google+:sta. Radiohead.com-sivuston vanhoja versioita voi kuitenkin edelleen selailla Internet Archiven Wayback Machinessa.

Wayback Machinen tallenteita on käytetty todisteina oikeudessa.

Wayback Machinesta on tullut entistä olennaisempi työkalu sen jälkeen, kun EU:n tuomioistuin päätti vuonna 2014, että Googlen ja muiden hakukoneiden täytyy poistaa tiettyjä henkilöä koskevia hakutuloksia, jos tätä perustellusti vaaditaan. Arkistossa saattaa olla tallenne myös sellaisesta sivusta, jota Google ei enää löydä.

Wayback Machinen tallenteita on myös käytetty todisteina oikeusjutuissa, joissa epäilty on pyrkinyt piilottamaan tai hävittämään sivustoltaan raskauttavia tietoja.

1) Googlen välimuisti eli cache

Google ottaa jatkuvasti verkkosivuista tallenteita siltä varalta, että sivun tämän hetkinen versio ei jostain syystä ole saatavilla. Nämä hieman varhaisemmat versiot sivuista säilyvät tallessa Googlen välimuistissa. Voit kokeilla välimuistinäkymää, kun sivua on muutettu, se on poistettu tai se vastaa hitaasti.

Näin käytät Googlen välimuistia:
1. Etsi normaaliin tapaan jotakin Googlesta.
2. Hakutuloksessa näkyvän url-osoitteen perässä on pieni alaspäin osoittava kolmio. Kun klikkaat sitä, saat näkyviin sanan “cached” tai “välimuistissa”. Tästä saat näkyviin Googlen välimuistinäkymän kyseisestä sivusta.

Kuvakaapaus Google-hakutuloksesta.
Kuva: Kuvakaapaus Google-hakutuloksesta/YLE

Ainakin Safarissa, Firefoxissa ja Googlen omassa Chrome-selaimessa voit myös kirjoittaa suoraan selaimen osoiteriville esimerkiksi “cache:yle.fi/kuningaskuluttaja” ja saat sen hetkisen välimuistinäkymän Kuningaskuluttajan etusivusta.

2) Internet Archiven Wayback Machine

Internet Archive eli internet-arkisto on San Franciscossa toimiva voittoa tavoittelematon järjestö, joka tallentaa katoavaista internet-historiaa meille ja jälkipolville. Se aloitti toimintansa jo vuonna 1996, mutta palvelu on edelleen varsin tuntematon Suomessa. Palvelussa on tätä nykyä arviolta yli 150 miljardia tallennetta verkkosivuista kahden vuosikymmenen ajalta.

Internet Archiven perustaja Brewster Kahlen mukaan verkkosivun keskimääräinen elinikä on sata päivää. Verkossa voi siis todella usein törmätä tilanteeseen, jossa tajuaa, että joltakin sivulta on siivottu pois sen ylläpitäjälle epäedullisia tietoja. Silloin kannattaa kääntyä Wayback Machinen puoleen. Arkisto tarjoaa käyttökelpoisia todisteita tilanteissa, joissa pitää osoittaa, että jokin asia oli ennen toisin.

Pomminvarma palvelu Wayback Machine ei ole. Sen toiminta perustuu algoritmeihin, jotka haravoivat ja tallentavat verkkoa koko ajan. Palvelu ei pysty tallentamaan kaikkia sivustoja kaiken aikaa. Kannattaa kuitenkin aina käydä vilkaisemassa, josko etsimästäsi sivusta tallenne löytyisi.

On myös hupaisaa käydä tutkailemassa verkkosivuja niiden muinaisessa olomuodossa. Wayback Machinen vanhin tallenne Yle.fi:n etusivusta on joulukuulta 1996. Tallessa on myös Kuningaskuluttajan kuluttaja-aiheisen runokilpailun satoa vuodelta 1997.

Tallenne yle.fi -sivusta vuodelta 1996.
Kuva: Wayback Machine/YLE
Tallenne Kuningaskuluttajan www-sivuilta vuodelta 1997.
Kuva: Wayback Machine/YLE

Näin käytät Wayback Machinea:
1. Mene osoitteeseen https://archive.org/web/
2. Kirjoita etsimäsi sivun url-osoite hakukenttään.
3. Jos sivu on tallennettu, saat näkymän, jossa voit selata tallenteita eri vuosilta ja kuukausilta. Sininen pallo päivämäärän kohdalla on yksi tallenne.

Valheenpaljastaja käsittelee faktaa ja fiktiota uutisissa ja sosiaalisessa mediassa joka toinen viikko. Ota yhteyttä: valheenpaljastaja@gmail.com

Muokattu 11.1.2017: Lisätty asiasana ja siirretty Yle Oppiminen alle.
Muokattu 11.3.2019: Kommentointi on päättynyt.