Uppfært: Viðtalið er hér á Vísi.is
Ég hélt á dögunum fyrirlestur á málþingi Tungutækniseturs og Íslenskrar málnefndar. Yfirskrift málþingsins var “Á íslenska sér framtíð innan upplýsingatækninnar?” og fjallaði að mestu um tungutækni annars vegar og hins vegar þýðingar á hugbúnaði.
Mitt erindi fjallaði um mikilvægi aðgengis að góðum gögnum, einkum gagnasöfnum í eigu opinberra aðila fyrir nýsköpun. Þetta tel ég reyndar að eigi ekki bara við í tungutækni, heldur á mörgum öðrum sviðum nýsköpunar og reyndi að færa rök fyrir því. Glærurnar eru aðgengilegar á Slideshare.
Blaðamaður Markaðarins heyrði af þessu erindi (sem annars var haldið í litlum hópi íslensku- og tungutækinörda) og birti í dag viðtal við mig um málið (síða 13).
Textinn viðtalsins fylgir líka hér:
„Þjóðhagslegur ávinningur af því að tryggja opið aðgengi að opinberum gögnum er margfaldur á við mögulegar leyfistekjur og kostnað,“ segir Hjálmar Gíslason, tæknistjóri hjá Já – Upplýsingaveitum.
Hjálmar flutti á dögunum erindi um nýsköpun og mikilvægi aðgengis að opinberum gagnasöfnum.
Hann bendir á að í höndum opinberra aðila sé gríðarlega mikið af gögnum sem megi nýta til ýmiss konar nýsköpunar. Þar megi telja gögn frá Stofnun Árna Magnússonar í Íslenskum fræðum (einkum Orðabók Háskólans), Ríkisútvarpinu, Hagstofunni, Landmælingum, Seðlabankanum, Veðurstofunni, Alþingi, Þjóðskjalasafninu og mörgum fleirum.
Aðgengi að þessum gögnum sé hins vegar oft á tíðum háð ýmis konar hindrunum. Þau séu ekki til á stafrænu formi, erfitt sé að nálgast gögnin og finna, leyfismál séu óljós, gjöld séu tekin fyrir þau eða stofnanir einfaldlega liggi á þeim, „eins og ormar á gulli“.
„Verst af öllu er þegar gjaldtaka er jafnvel aðeins til málamynda, þá er bara verið að hindra notkun gagnanna – og þar með nýsköpun – án þess að nokkur von sé til þess að hafist upp í kostnaðinn við söfnun þeirra.“
Hjálmar nefnir dæmi af Emblu, íslensku leitarvélinni, og leitarvélum já.is. Þar er til að mynda gert ráð fyrir mismunandi myndum orða, leitarvélin þekkir nöfn þjóðþekktra einstaklinga, bókartitla, íslensk örnefni og jafnvel gert ráð fyrir skammstöfunum. „Þetta hefði ekki verið mögulegt án góðra gagna,“ segir Hjálmar. Sum þessarra gagna hafi fengist að kostnaðarlausu, önnur með samvinnu við hlutaðeigandi um endurgerð eða aðra nýtingu þessarra gagnasafna. Sem opnast aðgengi skiptir mjög miklu máli þar sem verkefni af þessu tagi séu oftar en ekki unnin af litlum fyrirtækjum, einstaklingum eða nemendum „með lítil fjárráð en mikinn áhuga“. Í þessum tilfellum hafi hins vegar tekist að leysa úr læðingi mikil verðmæti í umræddum gagnasöfnum. „Þá verður að hafa í huga að þegar um opinber gögn er að ræða, þá hefur almenningur þegar greitt fyrir að láta búa þau til,“ segir Hjálmar.
Tölur frá Bretlandi sýni að þjóðahagslegt tap af takmörkuðum aðgangi að opinberum gagnasöfnum, nemi einum milljarði punda á ári í glötuðum þjóðartekjum. „Þetta samsvarar 700 milljónum króna hér á landi ef höfðatölureglunni er beitt. Mér liggur við að segja milljarði. Hluta af þessum fjármunum mætti verja í aukna gagnasöfnun og umfram allt í að bæta aðgengi að gögnum sem þegar eru til – og samt komið út í þjóðhagslegum plús,“ segir Hjálmar Gíslason.
Flott að þetta sjónarmið komi fram, vonandi er hugmyndafræðilegur grundvöllur fyrir þessu hjá hinu opinbera.
Er “transparency” ekki í tísku um þessar mundir?
How about them Microformats á Já :p
Ég ætlaði einmitt að hæla þér fyrir þetta næst þegar ég næði þér. En allt eins gott að gera það fyrir allra augum: Þú ert frábær!
Ég er svo sammála þessu að það er sárt og það eru fyrir löngu orðið tímabært að einhver sem hlustað er á láti í sér heyra.
Þetta er kannski sérstaklega pínlegt, eða kaldhæðnislegt, með íslenskuna framar öðrum sviðum vegna þess að það efni sem gagnast til þess að smíða hjálpartól fyrir íslenskunotkun er haldið í gíslingu af sömu aðilum og hafa áhyggjur af hrörnun íslenskunar.
Mínar eigin tilraunir með tól fyrir íslensku hafa takmarkast gríðarlega af því að hafa ekki aðgang að góðum gögnum. Ég skal koma og syngja bakraddir hjá þér hvaða dag sem er.
Finnur: Microformats munu finna sér leið inn á Já á næstunni – lofa ekki tímasetningum. Þar sem Já er einkafyrirtæki lúta þær upplýsingar þó mjög svo öðrum lögmálum en upplýsingar opinberra aðila.
Borgar: Takk – þú ert líka alveg æði. Hver veit nema ég nýti mér bakrödd þína ef ég reyni að syngja sama sálm víðar.