· Aineistonkeruu2 · In English1 · Link1 · Meta10 · Suomeksi28 · Tutkimustyö8 · Uncategorized1 · Väitöstä kohti9 · Versionhallinta6 · Web 2.01

Tagipilviä

 emoticon Pitkät piuhat minulla. Vihdoinkin ymmärsin, että folksonomialla voidaan tarkoittaa tagipilveä joka on muodostettu suoraan dokumenttien sisällön perusteella!  Eli dokumenttien kuvaajiksi ei välttämättä tarvitse valita ihmisten määrittelemiä asiasanoja, vaan sanojen esiintymät tekstissä riittää. Tämän oivalluksen saatuani kävin testaamaan minkälaisen tagipilven saa muodostetuksi ZoomClouds palvelun avulla, kun lähteenä käytetään RSS-syötettä. Ja esimerkki löytyy jälleen serola.blosome.com sivuilta.

Ongelmaksi näyttää tietysti muodostuvan usein esiintyvien pronominien ja partikkeleiden sekä muun roskan suodattaminen. ZoomClouds järjestelmässä tämä pitää tehdä käsin, eli sulkulistaa joutunee päivittämään aika ajoin.

Mutta jos tämmöinen kiinnostaa, niin eipä muuta kuin otetaan käyttöön. Samalla voisi ehkä luopua perinteisistä asiasanoista kokonaan, kuten Inger esitti.

TrackBack URI for this entry is:

9 Comments »

  1. Ensinnäkin - mahtava palvelu ja … (nörtti punastuu) kaunis tagcloud.

    Toiseksi, tarkoitin kyllä, postin kirjoittaja itse määrittelisi tagit. En usko, että pilvestä on kauheasti iloa jos sanat luetaan suoraan posteista. Luulenpa että kaikkien sanojen käyttäminen pilvessä ja raaka linkki määrä->koko tekee siitä aika sotkuisen ja epäinformatiivisen. Tilannetta pahentaa se että blogin valtakieli on suomi sekä mahdollinen kaksikielisyys. Olisiko sanojen kokoon käytettävissä jotain muuta keinoa, jos oikeasti lähtisi laskemaan sanoille painoja?

    Kaikista näistä varauksista huolimatta mielestäni tuota on aihetta ainakin kokeilla, hyvin hallitulla sulkulistalla. Ellei muuta, niin onhan sillä ehkä hieman viihdearvoa.

    Jos se lisätään, sopisiko se vaikka ensin valikon ihan alalaitaan. Siellä se ei häiritse, mutta voisimme katsoa, miten se siitä kehittyy?

    Comment by iekman — 27.02.2007 @ 19:03

  2. Laitoin ZoomClouds tagit omalle sivulle. Niitä voi käydä kurkkimassa, kun klikkaa TAGS-linkkiä LOGIN-linkin vieressä. Huomasin kohta itsekin, että koska nämä ovat vain kärkilista usein esiintyvistä sanoista, jää niiden ulkopuolelle mahdollisesti kaikki tärkeät ja kuvaavat termit. Lisäksi nämä listat saa näköjään vain viimeisen kymmenen postin tiivistelmästä, eli ne eivät kuvaa koko blogia :( Koitan vielä kehitellä kompromissia, missä saisi ZoomClouds pilven Infostudies blogin käyttäjien määrittelemistä asiasanoista. Ensin pitäisi vain saada generoiduksi RSS-syöte asiasanoista ja se ei taida onnistua.

    Laitoin samalle sivulle saman tien molemmat saatavilla olevat RSS-syötteet: postit ja kommentit. Klikkailkaa niitä aikanne kuluksi ja miettikää onko hommassa mitään järkeä ja miten sitä voisi kehittää. Itselle putkahti heti päähän, että voisiko tulosta parantaa, jos pystyisi poimimaan vain yli kuuden merkin sanat. Suomen kielessä se voisi purra. Mutta tuota on varmaan jo joku miettinyt.

    Comment by Sami Serola — 27.02.2007 @ 23:19

  3. BlogSomen kommenttien RSS syötettä näköjään pystyi kasvattamaan asetuksissa. Postien määrä RSS syötteessä on sen sijaan kuulemma typerästi sidottu sivuilla näytettyjen artikkelien määrään :( Lisäksi RSS:n pitäisi näyttää posteistakin koko teksti eikä vain abstraktia. Mutta kommenttien osalta vaikutus oli kuiten positiivisesti yllättävä, sillä nyt esimerkiksi Mikon haastatteluposti nousi kivasti esiin kommenttien tagipilvessä.

    Mutta sittemmin selvisi, että ZoomClouds huomio aiemmat lukukerrat. Ja muutoinkin lupailevat systeemin viisastuvan, mitä kauemmin se pyörii sivustolla: http://clouds.zoomblog.com/cat/6208

    Comment by Sami Serola — 27.02.2007 @ 23:54

  4. Ja ratkaisu löytyi sekä kielikysymykseen että syötteessä näytettävien viestien määrään. Blogsome nimittäin antaa listata RSS syötteen erikseen asiasanoille. Eli eräänlainen kompromissi tämäkin, kun ZoomClouds tagit voi tilata esimerkiksi vain tietyille käyttäjien määrittämille aiheille. Siis esimerkiksi artikkeleille jotka käyttäjät ovat kuvailleet asiasanalla ’suomeksi’: http://infostudies.blogsome.com/category/suomeksi/feed

    Comment by Sami Serola — 28.02.2007 @ 1:25

  5. Pikainen huomio: saisikohan asiasanoja lisättyä viesteihin ja jotenkin jatkokäsiteltyä toiminnolla custom fields (write post -> advanced alalaidassa)?

    Comment by iekman — 7.03.2007 @ 15:28

  6. Ongelmana on se, että asiasanat pitäisi saada ujutetuksi postien RSS-syötteeseen, missä näytetään vain otsikko ja sisältö, ei mitään muuta. Eli Esimerkiksi ‘custom fields’ ei näy RSS-syötteessä. Mutta ideasi on loistava, sillä aloin heti miettimään miten postien ‘the_content’ template tagia saisi “hakattua” ;)

    Eli jos jotenkin saisi ujutettua ‘the_content’ osioon avainsanat, määritettyä niille oman tyylin ja sitten piilottaisi ne tyylitiedostossa. Tällöin blogia luettaessa kaikki näyttäisi samalta kuin ennenkin, mutta RSS-syötteeseen postin sisältö alkaisi avainsanoilla. Siten pitkässä juoksussa ZoomClouds alkaisi (toivottavasti) painottamaan näitä avainsanoja tagipilvessä.

    Comment by Sami Serola — 8.03.2007 @ 11:17

  7. Parempi hylätä tämä, ainakin toistaiseksi. Olin jo vähän aika toiveikas, kun ideasi innoittamana keksin käyttää postien otetta kuvailuun. Lisäsin nimittäin TAGS-sivulle pilven missä otetaan huomioon vain avainsanat jotka esiintyvät postin otteessa, jos sellainen löytyy, muutoin napataan sanat postin sisällöstä. Mutta tulos näyttää hirveältä. Zoomcloudin algoritmit näyttävät tekevän vähän sitä sun tätä. Miksi ihmeessä ‘kans’ saa niin suuren painon, vaikka se esiintyy ymmärtääkseni vain kerran yhdessä postissa? Täysi mysteeri koko homma.

    Comment by Sami Serola — 9.03.2007 @ 11:41

  8. Ehdotus: laitetaan ‘categories’ asiasanat otsikkopalkin oikeaan laitaan samaan tyyliin kuin olen laittanut testiblogissani: http://serola.blogsome.com/
    Väänsin tuossa ratkaisussa koodia korvaamalla listakoodit omalla erotinmerkillä ja sulkumerkit alaindeksillä.

    Yläpalkki olisi mielestäni sen takia hyvä paikka, että saataisiin taas tilaa käytetyksi järkevästi ja asiasanat otsikkopalkissa kertoisivat samalla näkyvästi mistä blogissa on kyse.

    Luovutaan samalla kaikenmaailman tagipilvikokeiluistani, sillä testaamistani vaihtoehdoista mikään ei ole toimiva eikä Blogsome palveluun saa varsinaisia tagipilviliitännäisiä todennäköisesti pitkiin aikoihin. Jos ja kun sellaisen joskus tulee käyttöön, niin sen voi sitten viskata tilalle.

    Comment by Sami Serola — 21.03.2007 @ 10:40

  9. Olin omavaltainen ja annoin itselleni luvan hieman päivittää ulkoasua. Levensin postien tekstipalstaa valikkomarginaalin kustannuksella, siirsin kategoriat otsikkopalkkiin, poistin ‘tags’-linkin jokseenkin turhana, siirsin ‘login’-linkin oikealle ylös ja laitoin otsikkokuvan vasempaan laitaan linkkikentän etusivulle.

    Tuon kaiken lisäksi nimesin aiheen ‘Work in progress’ uudelleen nimellä ‘Tutkimustyö’. Näin siksi, että aihesanan on hyvä suoraan ilmaista millä kielellä sisältöä löytyy. Jos joku haluaa kirjoittaa väitöskirjatyönsä etenemisestä englanniksi, niin sitten voi lisätä erikseen tuon ‘Work in progress’-aiheen.

    Comment by Sami Serola — 17.05.2007 @ 10:11

RSS feed for comments on this post.

Leave a comment

Line and paragraph breaks automatic, e-mail address never displayed, HTML allowed: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>



Anti-spam measure: please retype the above text into the box provided.