Tuesday, July 23, 2013

Day 23

Oeh, tuleb välja, et see mudeldamine on ikka üks täiesti omaette teema. Niipalju ma saan R-ga hakkama juba, et lihtsamaid andmestruktuure kokku kruttida, aga no ilmselgelt järgmine samm on nendega midagi peale hakata. Ja mudeldamise koha pealt on mul täielik lünk, olenemata sellest et ma kevadel TLÜs läbisin aine "matemaatiline modelleerimine". Kuna ma sisu ei jaga, siis lihtsalt andsin oma andmeid erinevatele algoritmidele ette ja vaatasin mis tulemus tuleb. Tulid küll tulemused! Mitte, et ma neid kuidagigi tõlgendada oskaks :D Ainult niipalju tean, et mida suurem korrelatsioon, seda parem. Aga kustmaalt on hea või kustmaalt on halb või millised erinevate andmete ja mudelite puhul üldse need võimalikud vahemikud on - pole õrna aimugi! Ehk siis täna olid suht seosetud infokillud, aga võib-olla millalgi tekivad seosed ka :)

Õhtul sain kokku ammuse sõbraga, kes siinkandis elab. Ta müüs just äsja oma maja maha, seega lammas ja õlu olid minu jaoks tasuta :) Tuttavaks saime temaga ca 6 aastat tagasi samu arvutimänge mängides, mida jätkus siis veel mitmeks aastaks. Viimase paari aasta jooksul aga oleme mõlemad oma hobisid vahetanud ja elu on meie mõlema jaoks palju paremaks läinud :)

Ahjaa, R-st veel tuli meelde üks asi. Ühes blogis jäi silma kellegi arvamus ja võrdlus R-i ja teiste statistika abivahendite kohta, mis minu jaoks pildi palju selgemaks tegi. SPSS-i ja Statistica ja muude taoliste vahendite puhul sa ütled programmile ette, et "tee seda" ja see pritsib siis tulemuseks tohutu hulga tabeleid välja, kust saad endale sobivad välja valida. R-i puhul aga sellist asja ei ole - iga samm on eraldi käsk oma parameetritega ja see lähenemine on hoopis nii, et saad mingi tulemuse, siis kasutad järgmist käsku, et seda tulemust edasi töödelda ja vaadelda, mille tulemust siis omakorda edasi mudid, jne. Ehk siis on küll võimalik ehitada jupp koodi, mis pritsib samu andmeid välja kui SPSS, aga mõtet ei ole. Minu jaoks oli see avastus oluline selle tõttu, et ma seni olen üritanud just ehitada sellist "valmis" asja olukordades, kus "valmis" on väga ähmaselt defineeritud. Tegelikult tegevus ongi selles, et proovid ja vaatad kas tuleb midagi välja ja tegutsed siis teistmoodi edasi, ehk staatilise koodiga pole suurt midagi peale hakata. Learning curve...