Uppfært: Viðtalið er hér á Vísi.is
Ég hélt á dögunum fyrirlestur á málþingi Tungutækniseturs og Íslenskrar málnefndar. Yfirskrift málþingsins var “Á íslenska sér framtíð innan upplýsingatækninnar?” og fjallaði að mestu um tungutækni annars vegar og hins vegar þýðingar á hugbúnaði.
Mitt erindi fjallaði um mikilvægi aðgengis að góðum gögnum, einkum gagnasöfnum í eigu opinberra aðila fyrir nýsköpun. Þetta tel ég reyndar að eigi ekki bara við í tungutækni, heldur á mörgum öðrum sviðum nýsköpunar og reyndi að færa rök fyrir því. Glærurnar eru aðgengilegar á Slideshare.
Blaðamaður Markaðarins heyrði af þessu erindi (sem annars var haldið í litlum hópi íslensku- og tungutækinörda) og birti í dag viðtal við mig um málið (síða 13).
Textinn viðtalsins fylgir líka hér:
„Þjóðhagslegur ávinningur af því að tryggja opið aðgengi að opinberum gögnum er margfaldur á við mögulegar leyfistekjur og kostnað,“ segir Hjálmar Gíslason, tæknistjóri hjá Já – Upplýsingaveitum.
Hjálmar flutti á dögunum erindi um nýsköpun og mikilvægi aðgengis að opinberum gagnasöfnum.
Hann bendir á að í höndum opinberra aðila sé gríðarlega mikið af gögnum sem megi nýta til ýmiss konar nýsköpunar. Þar megi telja gögn frá Stofnun Árna Magnússonar í Íslenskum fræðum (einkum Orðabók Háskólans), Ríkisútvarpinu, Hagstofunni, Landmælingum, Seðlabankanum, Veðurstofunni, Alþingi, Þjóðskjalasafninu og mörgum fleirum.
Aðgengi að þessum gögnum sé hins vegar oft á tíðum háð ýmis konar hindrunum. Þau séu ekki til á stafrænu formi, erfitt sé að nálgast gögnin og finna, leyfismál séu óljós, gjöld séu tekin fyrir þau eða stofnanir einfaldlega liggi á þeim, „eins og ormar á gulli“.
„Verst af öllu er þegar gjaldtaka er jafnvel aðeins til málamynda, þá er bara verið að hindra notkun gagnanna – og þar með nýsköpun – án þess að nokkur von sé til þess að hafist upp í kostnaðinn við söfnun þeirra.“
Hjálmar nefnir dæmi af Emblu, íslensku leitarvélinni, og leitarvélum já.is. Þar er til að mynda gert ráð fyrir mismunandi myndum orða, leitarvélin þekkir nöfn þjóðþekktra einstaklinga, bókartitla, íslensk örnefni og jafnvel gert ráð fyrir skammstöfunum. „Þetta hefði ekki verið mögulegt án góðra gagna,“ segir Hjálmar. Sum þessarra gagna hafi fengist að kostnaðarlausu, önnur með samvinnu við hlutaðeigandi um endurgerð eða aðra nýtingu þessarra gagnasafna. Sem opnast aðgengi skiptir mjög miklu máli þar sem verkefni af þessu tagi séu oftar en ekki unnin af litlum fyrirtækjum, einstaklingum eða nemendum „með lítil fjárráð en mikinn áhuga“. Í þessum tilfellum hafi hins vegar tekist að leysa úr læðingi mikil verðmæti í umræddum gagnasöfnum. „Þá verður að hafa í huga að þegar um opinber gögn er að ræða, þá hefur almenningur þegar greitt fyrir að láta búa þau til,“ segir Hjálmar.
Tölur frá Bretlandi sýni að þjóðahagslegt tap af takmörkuðum aðgangi að opinberum gagnasöfnum, nemi einum milljarði punda á ári í glötuðum þjóðartekjum. „Þetta samsvarar 700 milljónum króna hér á landi ef höfðatölureglunni er beitt. Mér liggur við að segja milljarði. Hluta af þessum fjármunum mætti verja í aukna gagnasöfnun og umfram allt í að bæta aðgengi að gögnum sem þegar eru til – og samt komið út í þjóðhagslegum plús,“ segir Hjálmar Gíslason.
Fyrir tveimur árum, þegar ég var með vikulega pistla á NFS um tölvur og tækni skrifaði ég
Ég er kominn í nýtt djobb, svona að hluta til.
Á degi íslenskrar tungu sem haldinn var þann 16. nóvember síðastliðinn var m.a. opnaður aðgangur að nýrri útgáfu gagnagrunns sem nefnist “