R, avoin data ja toistettavat analyysit

Geoinformatiikan tutkimuspäivät 2013

Joona Lehtomäki, Louhos

GitHub

Ongelma?



Tutkimuksessa

Kuilu julkaisun ja toistettavuuden välillä

Päätöksenteossa

Onko päätöksenteko palautettavissa aineistoon ja tutkimuksiin?

  • Avoimen lähdekoodin ohjelmointikieli ja tilastollisen laskennan ympäristö
  • Komentorivipohjainen ja vuorovaikutteinen
  • Grafiikkaominaisuudet
  • Laaja käyttäjä- ja kehittäjäyhteisö
  • Rakenteeltaan modulaarinen ja laajennettavissa

Liikenne sähköpostilistoilla (listerv)
Lähde: r4stats.com

Photo by premus on Flickr, CC-BY

6275

Lähde: r4stats.com

R-pakettien lukumäärä 19.3.2013

R ja toistettavuus

sorvi - suomalaisen avoimen datan R-paketti

  1. Datan saatavuus joustavat datan haku- ja putsausrutiinit
  2. Läpinäkyvyys ja toistettavuus kaikki vaiheet yhdessä koodissa
  3. Uusia tutkimusvälineitä sovelluksia täydentämään
  4. Vuorovaikutteisuus nopea datan seulonta ja visualisointi
  5. Lokalisoitu kotimaisiin tarpeisiin

http://louhos.github.io/sorvi/

datawiki - dataopas esimerkkeihin

  1. Datakatalogi mukana n. 20 kotimaista tietolähdettä
  2. Käyttöesimerkit toistettavat esimerkit sorvilla
  3. Kehittäjäyhteisön tuki kaikki voivat osallistua

http://louhos.github.io/datawiki

Uusi kuntajako: yhdistely ja visualisointi

HSY:n väestöruudukko pk-seudulla

Toistettavuus ja läpinäkyvyys
paranee kun avaamme ja jaamme


dataa koodin osaamista