Orðið.is: Lóð á vogarskálar Opinna Gagna

Í hádeginu í dag voru úrslitin í verðlaunasamkeppninni “Þú átt orðið” kynnt. Það voru fyrirtækið og Stofnun Árna Magnússonar í íslenskum fræðum sem stóðu fyrir þessari keppni.

Forsaga keppninnar

Forsagan er í stuttu máli sú að forritunarteymi Já og forveri þess – fyrirtækið Spurl – sem Já keypti fyrir nokkrum árum* hafa um árabil átt í samstarfi við Orðabók Háskólans (sem nú er hluti Árnastofnunar) á sviði tungutækni. Það samstarf hefur sérstaklega snúist um Beygingalýsingu íslensks nútímamáls, en það er gagnasafn sem inniheldur beygingarmyndir meira en 270 þúsund íslenskra orða.

Já hefur nýtt sér þetta safn með ýmsum hætti, t.d. til að tryggja að leit á vefnum Já.is finni íslensk nöfn, götuheiti, staði og fyrirtæki óháð því í hvaða beygingarmynd fyrirspurnir eru skrifaðar (ertu að leita að “Laugavegi” eða “Laugavegur“, “sýslumaður” eða “sýslumanninum”, o.s.frv.), við gerð tillagna þegar leitarorð eru rangt slegin inn “Leit að ‘laugvegur‘ skilaði engum niðurstöðum. Áttirðu við ‘Laugavegur’?” o.s.frv.

Já-fólk hefur því lengi vitað hvers konar verðmæti felast í þessum gögnum og við vorum nokkuð viss um að þau verðmæti kæmu fyrst almennilega í ljós þegar aðgangur að þessum gögnum væri opnaður frekar. Þannig kviknaði hugmyndin að því að Já myndi styrkja Árnastofnun og gera stofnuninni þannig kleift að aflétta þeirri gjaldtöku sem hingað til hefur verið á notkun þessarra gagna. Það varð úr, og til að hvetja hugmyndaríka einstaklinga til dáða var auk þess ákveðið að blása til þessarar verðlaunasamkeppni.

Opið aðgengi leiðir til nýsköpunar

Orðavindan

1. verðlaun í keppninni hlaut orðaleikurinn Orðavinda

Í stuttu máli tókst þessi tilraun vonum framar. 20 álitlegum verkefnum var skilað inn á tilsettum tíma. Það skemmtilegasta við þau var hversu fjölbreytt þau voru. Þannig náðu t.d. verðlaunaverkefnin fjögur allt frá nýrri málfræðilega áhugaverðri nálgun við orðflokkun, til tölvuleikja og allt frá gagnlegu tóli fyrir vefnotendur, til “startpakka” fyrir forritara sem vilja nýta sér þessi gögn til annarra góðra verka.

Og þetta var vonandi bara byrjunin. Ég er sannfærður um að miklu fleiri en þeir sem tóku þátt í samkeppninni munu nýta sér þessi gögn hér eftir með margvíslegum hætti og veit reyndar af nokkrum slíkum verkefnum sem eru í gangi.

Þessi afrakstur styrkti mig enn frekar í trúnni um það hversu mikil verðmæti er hægt að leysa úr læðingi með því að opna aðgengi að gagnasöfnum á vegum opinberra aðila. Fjársjóðir á borð við þennan liggja vannýttir og jafnvel ónotaðir hjá stofnunum og fyrirtækjum úti um allt land, en gætu orðið að nýjum vörum, nýjum tækifærum og jafnvel nýrri þekkingu ef aðferðafræði Opinna Gagna fengi að ráða.**

Vonandi verður þingsályktunartillagan góða sem samþykkt var í þá veru fyrir áramótin sem fyrst til þess að þessi mál komist á skrið hér á landi.

– – –

* Ég var stofnandi og einn af aðaleigendum Spurl á sínum tíma
** Gögnin í Beygingarlýsingunni eru reyndar strangt til tekið ekki að öllu leyti “opin” skv. skilgreiningu opinna gagna, en sannarlega opnari en þau voru.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s