Að kryfja texta…

IBM hefur undanfarin tvö ár eða svo verið að þróa tölfræði-, gagna- og graf-græju sem nefnist ManyEyes.

Í síðustu viku var ég svo heppinn að fá að sjá fyrirlestur frá höfuðpaurnum á bakvið þessa þjónustu. Þar var hann að sýna tiltölulega nýlega viðbót sem eru tól til að grafa í hreinan texta (frekar en töflugögn sem ManyEyes gengur að mestu út á).

Ég var alveg heillaður af þessari græju og ákvað að skjóta þarna inn séríslenskum gögnum til að prófa græjuna.

Hér er fyrsta tilraunin: Texti Egils Sögu greindur í orðatré.

Til að koma ykkur af stað:

  • Stærðin á orðunum sem koma á eftir upphafsorðinu (Egill) er hversu oft það kemur fyrir næst á eftir orðinu Egill í texta Eglu
  • Smellið á eitt af orðunum í tréinu og grafið ykkur þannig niður í textann

Athugið að það er hægt að byrja á hvaða orði sem er, þó orðið “Egill” sé notað sem útgangspunktur þarna. Prófiði t.d. að þurrka “egill” út úr innsláttarreitnum og skrifa eitthvað annað orð úr Eglu í staðinn. Ég ímynda mér að þetta geti verið ómetanlegt rannsóknartól fyrir málfræðinga og reyndar ýmsa aðra til að greina algeng mynstur t.d. í lögfræðitexta eða fjármálaskjölum.

Ég skil það svo eftir sem æfingu fyrir lesendur að setja inn aðra texta. Til þess þurfið þið að skrá ykkur sem notendur að ManyEyes og svo rekið þið ykkur í gegnum “Upload data set” og “Create Visualization”. Að flestu leiti leiti er þetta ágætlega notendavænt, þó það taki vissulega mið af nörda-notendahópnum, en ykkur ætti nú ekki að vera það fjötur um fót.

Þarna eru svo líka nokkur önnur svipuð textarannsóknartól sem eru líka býsna merkileg.

Skemmtið ykkur!

One comment

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s