Wednesday, July 17, 2013

Day 17

Täna oli üks nokitsemise päev. Hommikul kohe hakkasin LDA kohta artikleid lugema ja tööle jõudes lugesin veel ühe ja sai selgeks kaks asja - minu paari päeva tagune idee vist ole nagu väga idee ja teisalt, et nüüd ma saan aru mis on LDA ja mis need parameetrid seal kõik teevad. Tööjuures arutasime Kamiliga veel seda stuffi ja selgus, et see programm mida ta kasutab teeb neljast variandist kõige paremat, niiet sellega läks hästi. R-i lda pakett ei tee väga hästi, aga topicmodels pakett vist võimaldab eri konfiguratsioone. Igatahes õige asi LDA tegemiseks on hoopis programm nimega Mallet.

Päeva jooksul uudistasime LDA tulemusi ja nuputasime erinevaid viise kuidas selle headust hinnata ja parandada. Test-andmete peal tuli soo ennustusvõime 81% (facebooki likede pealt), mis ei ole just teab kui suur number, mille peale me mõtlesime välja ja ma nikerdasin edasi viisi kuidas mitte-diskrimineerivaid teemasid välja visata. Homme saab katsetada, et mida LDA selle peale arvab ja kas ennustusvõime sellest ka paraneb.

Meeletult palav on. Üle 30 kraadi on sooja varjus. Jõhker :)