v
Paikkatiedon käsittely on keskeinen osa avoimen datan analysointia ja visualisointia. Nykyisellään paikkatietoaineistot ovat hajallaan eri lähteissä, tiedostomuodoissa ja koordinaattijärjestelmissä, joten niiden hyödyntäminen vaatii huomattavaa erityisosaamista. Iso osa paikkatietoaineistojen käsittelyyn liittyvistä toimenpiteistä on kuitenkin automatisoitavissa. Tästä syystä olemme kehittäneet suomalaisen paikkatiedon käsittelyyn tarkoitetun R-paketin: gisfin
. Datademo-rahoituksen turvin olemme saaneet gisfin
-paketin kehityksen vauhdikkaaseen alkuun.
Paketin kehitysversio löytyy githubista ja vaikka kehitettävää on vielä paljon, voi pakettia jo hyödyntää monenlaisiin tehtäviin. Datalähteet, joita paketti hyödyntää, sekä lyhyet käyttöä kuvaavat esimerkit löytyvät paketin tutoriaalista.
Tärkeimmät tällä hetkellä mukanava olevat lähteet ovat
Seuraavaksi aiomme laajentaa yksittäisistä kaupungeista saatavilla olevan datan määrä sisällyttämällä pakettiin Lounaispaikan Turku-aineistoja. Ota yhteyttä jos haluat ehdottaa uusia datalähteitä!
gisfin
-paketti jatkaa suomalaisen avoimen datan R-ekosysteemin laajenemista. Keväällä toteutimme Datademon edellisen kierroksen rahoituksen turvin pääkaupunkiseudun avoimeen dataan keskittyneen helsinki
-paketin. Omalta osaltamme Datademo on tarjonnyt sopivia resursseja kehitystyön ylläpitämiseen ja kokemuksemme molemmista kierroksista ovat olleet erittäin positiivisia.
gisfin
on edelleen aktiivisen kehityksen alla ja tulevaisuudessa lisäämme uusia datalähteitä ja kehitämme käyttöesimerkkejä. Paketin kehitykseen liittyi loppumetreillä mukaan myös Jussi Jousimo Helsingin yliopistolta, joka toi mukaan Tilastokeskuksen paikkatietoaineistoja. Lisäksi meillä on Jussin johdolla työn alla fmi
-paketti Ilmatieteen laitoksen avointen datojen käsittelyyn sekä yleisesti paikkatiedon verkkojakeluun tarkoitettua WFS-rajapintamäärittelyä ymmärtävä rwfs
-paketti. Suomalainen avoimen datan R-ekosysteemi jatkaa siis laajenemistaan myös tulevaisuudessa!
Kuntarajat ovat tarpeellisia erilaisissa vaikkappa vaaleihin tai tilastotietoihin liittyvissä visualisoinneissa. Toisaalta kuntarajat muuttuvat lähes vuosittain. Ajantasainen kuntaraja-aineisto on saatavissa Maanmittauslaitokslta, mutta verrattain hankalassa GML-formaatissa. Alla oleva esimerkki näyttää, kuinka list_mml_datasets
-funktiota voidaan käyttää listaamaan saatavilla olevat MML:n avoimet aineistot. Tämä jälkeen kuntaraja-aineisto (hallintoalueet) haetaan get_mml
-funktiolla.
Maamme suuremmat kaupungit kuten Helsinki, Turku ja Tampere tarjoavat monenlaisia avoimia aineistoja, joista osa on myös paikkaan sidottuja. Helsingissä paikkatietoaineistoja on saatavilla esimerkiksi Helsingin kaupungin paikkatietopalveluiden kautta. Seuraava esimerkki noutaa kaupungin sivuilta pääkaupunkiseudun äänestysalueet ja visualisoi kartan kunnittain.
Seuraava esimerkki puolestaan näyttää, kuinka Helsingin peruspiirijako voidaan piirtää Googlen karttapalvelusta saadun taustakartan päälle. Haetaan ensin aineisto:
Googlen kartta-aineistot ovat maantieteellisessä, WGS84-pohjaisessa koordinaattijärjestelmässä. Peruspiirien piirtämistä varten selvitetään ensin missä koordinaattijärjestelmässä peruspiiriaineisto on:
EPSG-koodi 3879 paljastaa, että aineisto on Helsingissä käytössä olevassa ETRS89/GK25FIN tasokoordinaattijärjestelmässä. Aineiston saamiseksi yhteismitalliseksi Googlen taustakartan kanssa, on se ensin projisoitava maantieteelliseen koordinaattijärjestelmään:
Lopuksi piirretään peruspiirit ja taustakartta käyttäen suosittua
ggplot2
-pakettia ja sen karttalaajennosta, ggmap
-pakettia: