v
Avoin data tarjoaa mahdollisuuden tutkia monia mielenkiintoisia yhteiskunnallisia kysymyksiä. Pääkaupunkiseudun kohdalla tämä onnistuu nyt Datademo-rahoituksella toteutetun helsinki-kirjaston avulla. Kirjasto tuo tärkeimmät pääkaupunkiseudun avoimet tietoaineistot R-laskentaympäristöön ja mahdollistaa niiden analyysin, yhdistämisen ja visualisoinnin.
Kirjaston kehitysversio löytyy githubista ja julkaisuversio CRANista. Kirjastossa mukana olevat datalähteet lyhyine esimerkkeineen löytyvät tutoriaalista. Ota yhteyttä jos haluat ehdottaa uusia datalähteitä! Tärkeimmät tällä hetkellä mukanava olevat lähteet ovat
helsinki-kirjasto on osa suomalaisen avoimen datan R-ekosysteemin laajenemista, jossa alkuperäinen sorvi-kirjasto pilkotaan useampaan helpommin hallittavaan ja käytettävään kirjastoon. Datademo-rahoituksen turvin pystyimme toteuttamaan helsinki-kirjastosta tärkeimmät datalähteet kattavan työkalun käyttöesimerkkeineen nopealla aikataululla. Ilman datademo-rahoitusta tässä olisi kestänyt huomattavasti pidempään. Kirjaston kehitys jatkuu tulevaisuudessa uusien datalähteiden lisäämisellä ja käyttöesimerkkien julkaisulla.
Datademo-rahoituksesta jäi erittäin positiivinen kuva. Aktiivinen keskustelu ja kommentointi oli erittäin hyödyllistä, parantaen kaikkien ehdotusten laatua ja synnyttäen myös uusia ideoita. Osallistuimme Datademon toisellekin kierrokselle paikkatietoon keskittyvällä gisfin-kirjastolla ja saimme rahoitusta myös sille, mikä on hienoa!
Esimerkkinä helsinki-kirjaston käytöstä tutkimme miten ala-asteen koulujen sijainti pääkaupunkiseudulla suhtautuu asukastiheyteen. Aloitetaan asentamalla helsinki-kirjasto:
Tutkiaksemme koulujen sijainnin suhdetta väestötiheyteen haemme ensin vuoden 2013 väestöruudukon (HSY:ltä) funktiolla get_hsy()
ja muokataan data sopivaan muotoon. Aineistossa on asetettu kaikkien alle sadan asukkaan ruutujen arvoksi 99 tietosuojasyistä.
Haetaan sitten Pääkaupunkiseudun Palvelukartan uudesta API:sta (uusi Palvelukartta täällä) pääkaupunkiseudun peruskouluihin liittyvät palvelut funktiolla get_servicemap()
. HUOM! API on vielä kehitysvaiheessa ja hakutulokset saattavat muuttua, näin kävi tätä blogikirjoitusta valmistellessakin!
Valitaan hakutuloksista numerot 4 ja 9 (id:t 32539 ja 32717), eli ‘Luokkien 1-6 perusopetus’ kategorioista ‘Suomen- ja vieraskielinen perusopetus 2014-2015’ ja ‘Ruotsinkielinen perusopetus 2014-2015’.
Datan visualisointia varten haetaan ensin karttatausta Stamen-palvelusta käyttäen ggmap-kirjastoa.
Visualisoidaan lopuksi sekä väestöruudukko että koulujen sijainnit kartalle ggplot2-kirjastolla.
Kartalla näkyvät tiheästi asutut alueet sinisellä ja koulut punaisina pisteinä. Koulujen sijainti näyttää vastaavan hyvin väestökeskittymiä, mutta erityisesti Espoon haja-asutusalueilla kouluja on harvassa ja koulumatkat voivat olla pitkiäkin. Samaan tapaan voisi tutkia muidenkin palvelujen sijaintia suhteessa asukastiheyteen.