Helsingin yliopisto Matematiikan ja tilastotieteen laitos
Matemaattis-luonnontieteellinen tiedekunta
Valtiotieteellinen tiedekunta

 

Kurssimateriaali - johdatus R-ohjelmiston käyttöön, k-2007

Menu

Tärkeät R-linkit

Luentomateriaali

Asiasta kiinnostunut henkilö pääsee toivon mukaan sisään R:n käyttöön tarkastelemalla oheisia koodiesimerkkejä. (Materiaalia on enemmän kuin mitä kurssin suorittamiseen tarvitaan.)

  • Tutustuminen R:n käyttöön. R:n käyttöönotto mikroluokassa; työskentely- sekä asennusohjeita.
  • Koodia. R laskimena. Muuttujat ja sijoituslausekkeet.
  • Koodia. Funktiokutsut ja avustus.
  • Koodia. Vektorit ja niiden indeksointi. Säännönmukaisten jonojen luonti, puuttuvat arvot.
  • Koodia. Listat.
  • Koodia. Matriisit ja taulukot.
  • Koodia. Faktorit.
  • Koodia. Data frame eli datakehikko.
  • Koodia. Tiedonsyöttö. Tiedostot e1.dat, e2.dat ja e3.dat.
  • Koodia. Funktio apply() ja sen sukulaisfunktioita.
  • Koodia. Omien funktioiden määritteleminen.
  • Koodia. Ehtorakenteet.
  • Koodia. Silmukat eli toistorakenteet.
  • Koodia. Komentojen suorittaminen tiedostosta ja tulostuksen ohjaaminen tiedostoon (source ja sink). Muuttujan arvon tallettaminen tiedostoon (save ja load).
  • Koodia. Luokat ja metodit.
  • Koodia. Päivämäärät.
  • Koodia. Yleistä R:n grafiikasta.
  • Koodia. Kuvan ohjaaminen tiedostoon.
  • R:n traditionaalista grafiikkaa.
    • Koodia. Funktio plot().
    • Koodia. Funktion plot argumentteja.
    • Koodia. Interaktio kuvien kanssa.
    • Koodia. Ainesten lisääminen kuviin.
    • Koodia. Muita korkean tason funktioita.
  • Koodia. Ristikkografiikkaa kirjastolla lattice.
  • Koodia. Jakaumat ja niiden simulointi R:ssä.
  • Koodia. Aineiston tunnuslukuja.
  • Koodia. Perinteisiä testejä ja luottamusvälejä.
  • Koodia. Yksinkertainen lineaarinen regressio R:llä.
  • Koodia. Lineaarinen regressio numeerisille selittäjille. Tiedostot e1.dat ja cement.dat.
  • Koodia. Faktorit lineaarisessa mallissa. Tiedostot bilirubin.dat ja uffi.dat.
  • Muita ohjeita.

Laskuharjoitustehtävät

Tehtävät käsiteltiin tiistaisin luentojen yhteydessä. Kurssista sai 3 op suorituksen palauttamalla riittävän määrän ratkaisuja (ts. ratkaisemalla noin puolet kaikista tehtävistä).

Harjoitustyöt

  • Lähetin to 14.6. kansliaan niiden henkilöiden (3 op:n laajuiset) suoritukset, jotka eivät olleet palauttaneet harjoitustyötä eivätkä sopineet uutta takarajaa (yksi henkilö palauttaa harjoitustyön myöhemmin).
  • Lähetin ma 19.3. kansliaan niiden henkilöiden suoritukset, jotka eivät siihen mennessä olleet ilmoittaneet tahtovansa tehdä harjoitustyötä.
  • Harjoitustyön tekemällä kurssista saa 5 op edellyttäen, että ensin on palauttanut 3 op:n suoritukseen riittävän määrän laskuharjoitustehtäviä.
  • Harjoitustyö sovitaan luennoijan kanssa. Luennoijalla on valmiina joitakin aiheita, mutta aihetta voi ehdottaa myös itse. Harjoitustyön aloittavat henkilöt saavat kurssista suorituksen vasta sitten, kun työ on hyväksytty (tai tekijä on ilmoittanut luopuvansa sen tekemisestä tai takaraja on saavutettu).
  • Apua ongelmatilanteisiin saa sähköpostin avulla.
  • Yleisohjeita niille henkilöille, jotka aikovat tehdä työn analysoimalla omaa aineistoaan.
    • Kuvaa aineisto ja tutkittava kysymys: mitä on mitattu, ja mitä yritetään saada selville.
    • Piirrä aineistosta informatiivisia kuvia.
    • Tee yksinkertaisia tilastollisia analyyseja (tai yksi analyysi). Selosta, mitä saat tällä tavalla selville.
    • Kokoa nämä tuotokset yhteen, ja lähetä kokonaisuus luennoijalle (sähköpostilla tai paperisena versiona).
  • Selosta harjoitustyön dokumentissa ensi sijaisesti mitä olet tehnyt ja miksi ja miten asian sait tehtyä R:llä. Älä käytä liikaa aikaa dokumentin ulkoasun hiomiseen. Tämän harjoitustyön dokumentiksi kelpaa vaatimaton kirjallinen tuotos.

R-oppaita

Osa alla mainituista oppaista löytyy tulostettuna kurssikansiosta huoneesta C127.

  • R-ohjelman mukana tulee manuaaleja, joita pääsee lukemaan R:n graafisen käyttöliittymän Help-valikon kautta tai vaihtoehtoisesti CRAN-sivuston sivun The R Manuals kautta. Manuaalia An Introduction to R voi käyttää ohjelmaan tutustumisen apuna.
  • Virallisten manuaalien lisäksi CRAN:ista löytyy muita oppaita sivulta Contributed Documentation. Sieltä löytyy esim. Itselleni ovat aikaneen olleet hyödyllisiä tältä sivulta lötyvät Maindonaldin, Verzanin, Farawayn ja ja Paradis'in kirjoittamat oppaat.
  • Jari Oksanen on kirjoittanut suomenkielisen oppaan R: Opas ekologeille.

Kirjoja

Materiaalia kootessani olen käyttänyt hyödykseni seuraavia kirjoja.

  • Richard A. Becker, John M. Chambers, and Allan R. Wilks. The New S Language. Chapman & Hall, 1988.

Tässä kirjassa esiteltiin S-kielen versio 2.

  • John M. Chambers and Trevor J. Hastie. Statistical Models in S. Chapman & Hall, 1992.

Tässä kirjassa esiteltiin S-kielen versio 3, jossa S-kielestä tuli objektiorientoitunut. Liitteessä A kerrotaan, mitä ovat S3-luokat.

  • John M. Chambers. Programming with Data. Springer, 1998.

Tässä kirjassa esiteltiin S-kielen versio 4 ja S4-luokat.

  • Peter Dalgaard. Introductory Statistics with R. Springer, 2002.

Kompakti kirja, jonka avulla pääsee hyvin alkuun R:n käytössä.

  • William N. Venables and Brian D. Ripley. Modern Applied Statistics with S. Fourth Edition. Springer, 2002.

Moderneja tilastomenetelmiä R:llä. Kirjaan liittyy hyödyllinen paketti MASS, joka tulee R:n mukana automaattisesti.

  • William N. Venables and Brian D. Ripley. S Programming. Springer, 2000.

Perusteellinen esitys ohjelmoinnista S- ja R-kielillä. Kirja on tarkoitettu henkilöille, jotka osaavat ohjelmistoa jo käyttää sujuvasti.

  • Paul Murrell. R Graphics. Chapman & Hall/CRC, 2005.

Täydellisin saatavilla oleva esitys R:n grafiikasta.

  • Uwe Ligges. Programmieren mit R. 2nd edition, Springer, 2007.

Kompakti esitys ohjelmoinnista R-kielellä. Kirja on kirjoitettu helppolukuisella saksan kielellä.


Päivitetty viimeksi 14.06.2007 klo 10:48
Petri Koistinen
petri.koistinen 'at' helsinki.fi