Síðan 2006 hef ég gert mér að leik um áramót að skoða strauma og stefnur í tækniheiminum og spá fyrir um það sem er líklegt til að standa upp úr á komandi ári. Árangurinn hefur oft verið ágætur, en líka stundum alveg úti á túni. Hér skrifar til dæmis maðurinn sem spáði því árið 2014 að öpp í síma og spjaldtölvum myndu senn heyra sögunni til og virkni þeirra færast í vafra!
Í fyrra taldi ég upp þrjá hluti sem ég taldi að myndu verða áberandi árið 2023:
- Gervigreind
- Sýndarveruleika
- Persónulegri samfélagsmiðla
Allt eru þetta sannarlega hlutir sem vöktu athygli á árinu, Apple kynnti sýndarveruleikagræju sem mun hafa mikil áhrif þegar hún kemur á markað á næstu mánuðum. Notkun á samfélagsmiðlum heldur áfram að þróast í þá átt að fólk deili efni í smærri hópum frekar en að „allir tali við alla“, en gervigreindin var augljóslega sá punktur sem hitti rakleitt í mark. Reyndar svo mjög að það er ótrúlegt til þess að hugsa að þegar spáin var skrifuð í desember 2022 voru enn fjöldamargir sem höfðu aldrei heyrt um ChatGPT, OpenAI eða spunagreind (e. generative AI).
Ég held reyndar að gervigreindin sé upphafið að svo mikilli byltingu að ég ætla að tileinka tæknispá 2024 henni einni og velta frekar upp mismunandi hliðum hennar og spá í þá hluti sem við erum líkleg til að sjá á hennar sviði á árinu. En fyrst skulum við setja gervigreindina og umræðuna um hana í svolítið meira samhengi.
Vitlíkið rís
Ég rakst á það að frændur okkar Færeyingar hefðu valið „vitlíki“ orð ársins, en það er færeyskt nýyrði sem samsvarar okkar „gervigreind“. Þarna finnst mér frændum hafa tekist vel til og nota það hér eftir til jafns við gervigreind.
Þróun á sviði gervi- „greindar“ hefur alltaf kallað fram heimspekilegar umræður um hvað greind sé, hvort tölvur geti nokkurn tímann talist greindar, hvort þær muni tortíma okkur og ef ekki þá taka af okkur mennskuna, eða að minnsta kosti störfin. Þetta hefur átt við allt frá því tölvan kom fyrst fram, enda er Alan Turing – sem oftast er eignað að hafa smíðað fyrstu nútímatölvuna – einnig oft nefndur sem upphafsmaður gervigreindarinnar enda skrifaði hann heilmikið um það efni frá ýmsum sjónarhornum. Umræðan endurtók sig svo alloft á seinni hluta 20. aldar.
Þegar einkatölvan kom til sögunnar var talsvert talað um það hvernig fólk yrði óþarft á sífellt fleiri sviðum fyrir tilstilli hennar. Þessi umræða náði sannarlega til Íslands og í bókasafni mínu á ég meðal annars forláta bók sem gefin var út af Alþýðusambandi Íslands og heitir einfaldlega Tölva og vinna. Þar eru færð sannfærandi rök og myndrit sett fram sem sýna hvernig störfum muni fækka og fólk missa vinnuna í stórum stíl fyrir tilstilli einkatölvunnar.
Það er ekki tilviljun að fyrsta Terminator-myndin (1984) kom út á svipuðum tíma. Nýjungar hræða, sérstaklega þær sem við skiljum illa.
Þegar Deep Blue lagði heimsmeistarann Kasparov í skák árið 1997 þóttu tölvurnar heldur betur hafa ruðst inn á svið sem sannarlega þarfnaðist greindar.
Síðan þá hefur hugtakið gervigreind verið notað yfir ótal hluti, ekki síst í markaðssetningarskyni, en lítið virst gerast í eiginlegri þróun við að koma viti fyrir tölvurnar. Flest framfaraskrefin voru einfaldlega meiri vinnsluhraði og ódýrari örgjörvar, minniskubbar og geymslurými og byltingarnar urðu miklu frekar á öðrum sviðum, svo sem uppgangi Internetsins og tilkomu snjallsímans.
Það er svo árið 2017 að hópur sem meðal annars hafði unnið að þróun þýðingarlausnarinnar Google Translate gefur út vísindagreinina „Attention is all you need“. Þar er lýst nýjum arkitektúr tauganeta, svokölluðum „umbreytum“ (e. transformers), en þeir gera þjálfun slíkra neta auðveldari og breyta því hvernig þau „halda athygli“ á því sem þegar hefur verið sagt. Á þessu byggja allar þær gervigreindarlausnir sem við höfum séð líta dagsins ljós síðustu misserin á sviði spunagreindar, hvort heldur er textaspuni, myndspuni, spuni tónlistar eða spuni á enn öðrum miðlum. Flest okkar urðu ekki vör við þessa nýjung fyrr en með tilkomu ChatGPT í lok árs 2022, en nú er varla til það mannsbarn sem ekki hefur heyrt af þessari lausn, prófað hana og jafnvel tekið hana í reglulega notkun, enda hefur engin hugbúnaðarlausn í sögunni náð til jafnmargra notenda á jafnskömmum tíma.

Viðbrögðin hafa heldur aldrei verið jafn sterk. Sem fyrr vantar ekki hrakspárnar. Málsmetandi fólk hefur jafnvel kallað eftir því að frekari þróun þessara gervigreindarlausna verði stöðvuð meðan við áttum okkur betur á því hvað við erum með í höndunum. Það þarf enda ekki að eiga í samtali við ChatGPT nema skamma stund – jafnvel á íslensku – til að átta sig á að hér er eitthvað allt annað og meira á ferðinni en hugbúnaður sem getur skákað okkur á afmörkuðu sviði á borð við – jah – skák, greiningu röntgenmynda eða flokkun póstsendinga þar sem fyrri gervigreindarnálganir höfðu þegar tekið mannlegum sérfræðingum fram, heldur eitthvað sem líkist því miklu frekar að eiga í samskiptum við viti borna manneskju.
Endurtekur sagan sig, eða er þetta skiptið öðruvísi?
Eiga hrakspárnar þá rétt á sér í þetta skiptið? Já og nei. Fyrst skulum við leyfa fyrri hrakspám að njóta sannmælis. Þótt tölvurnar hafi ekki tekið af okkur öllum störfin, hafa auðvitað mörg störf, og jafnvel heilu starfsgreinarnar, breyst mikið, eða jafnvel horfið með öllu. Það vinna ekki margir við letursetningu í prentiðnaði í dag. Fjöldi starfsmanna í fiskvinnslu er um fimmtungur þess sem áður var og þau störf sem eftir eru aðeins að litlu leyti lík þeim sem áður voru mest áberandi. Þær leiðir sem tónlistarmenn, blaðamenn og margar aðrar skapandi stéttir nota til að afla sér tekna eru mjög breyttar og í sumum tilfellum stendur leitin að sjálfbærum tekjuleiðum enn yfir (allar þessar stéttir fara núna beint í annan hring í skilvindunni). Þegar grannt er skoðað er hlutfall þeirra starfa sem í dag eru unnin á svo að segja sama hátt og þau voru unnin fyrir 30–40 árum býsna lágt. Tölvurnar tóku störfin! Í sumum tilfellum var um sársaukafullar breytingar að ræða, en flestar þessar breytingar hafa orðið án þess að við höfum beinlínis tekið eftir þeim frá degi til dags, en gerbreyttu samt sem áður öllu.
Með tilkomu þróaðrar spunagreindar stöndum við núna frammi fyrir breytingum sem verða engu minni og líklega mun hraðari og það er auðvitað ástæðulaust að vaða út í þær án umhugsunar og undirbúnings. En meðan athyglin er ef til vill mest á stórkostlegum – og í flestum tilfellum allfjarstæðukenndum – hamfaraspám, er gervigreindin þegar farin að breyta heiminum. Og þær breytingar sem auðveldast er að spá fyrir um minna mjög á þær sem tilkoma einkatölvunnar hafði í för með sér: Meiri sjálfvirknivæðing sem sannarlega mun „taka“ og gerbreyta störfum okkar og lífi, en heilt yfir auka framleiðni og lífsgæði.
Meira, hraðar, ódýrara …
Í raun má draga öll þau margvíslegu áhrif sem spunagreindin mun hafa saman undir hatti stafrænnar framleiðniaukningu. Núna er einfaldlega hægt að framleiða allt efni sem hægt er að koma á stafrænt form hraðar og ódýrar en áður og án sömu sérhæfingar.
Hvert okkar hefur eignast stafræna og einstaklega fjölhæfa aðstoðar-„manneskju“. Eins konar „hugstoð“ sem er alltaf til staðar og við komum nær aldrei að tómum kofunum hjá. Þessi stoð getur skrifað samfelldan texta út frá stuttri lýsingu, teiknað frambærilegar myndir eftir okkar hugarflugi, sett saman forritskóða út frá forskrift, lýst því sem fyrir augu ber á myndum, dregið saman efni úr heilu skjalabunkunum á örskömmum tíma og unnið með okkur hugmyndavinnu á nánast öllum sviðum mannlegrar tilveru.
Þróunin er mjög hröð og mögulegum starfssviðum þessarar stoðtækni fer hratt fjölgandi. Nú þegar eru til sérhæfðar spunalausnir sem geta útbúið vídeómyndir, tónlist og þrívíddarlíkön. Þessir eiginleikar verða án efa byggðir inn í útbreiddustu lausnirnar á borð við ChatGPT og Bard frá Google á næstunni.
Þetta opnar ótrúlega möguleika, en rétt eins og í tilfelli raunverulegs aðstoðarfólks mun sá sem biður um vinnuna bera ábyrgð á henni. Notandinn er sérfræðingurinn, stoðin er „ódýra vinnuaflið“, enda er einn stærsti veikleiki spunagreindarinnar að hafa enga „tilfinningu“ fyrir því hvenær hún hefur rétt fyrir sér og hvenær hún er að bulla.
Fyrrgreind framleiðniaukning er það sem mun hafa stærstu breytingarnar í för með sér og þau sem munu tileinka sér þessa tækni munu verða margfalt afkastameiri og betri í sínum störfum.
En þrátt fyrir hraðann munu þessar breytingar taka mörg ár að ganga yfir og þróun tækninnar stendur auðvitað enn yfir. Við skulum takmarka sjóndeildarhringinn við árið sem nú er nýhafið og hvað það er líklegt að bera í skauti sér á sviði gervigreindarinnar.
Átta hlutir sem gervigreind mun gera árið 2024
- Framleiða (of) sannfærandi „ljósmyndir“: Við munum sjá spunnar myndir í glanstímaritum og öðru auglýsingaefni þar sem fyrirsæturnar eru ekki raunverulegt fólk, sviðsmyndin var aldrei sett upp og enginn ljósmyndari kom að verkinu. Það eru þegar heilu „áhrifavaldarnir“ á samfélagsmiðlum sem eru ekki til, heldur eru bæði myndirnar af þeim og textinn sem settur er fram með þeim spunninn af gervigreind. Þeim mun fjölga. Jafnvel myndir frá fólki sem sannarlega er til verður erfitt að meta hvort séu breyttar eða jafnvel spunnar frá grunni. Slíkar myndir munu rata í fréttamiðla og hneykslismál munu koma upp þar sem myndir sem „sýna“ hvað gerðist verða spunnar frá rótum. Sömuleiðis mun fólk sem verður uppvíst að einhverju misjöfnu halda því fram að myndirnar séu uppspunnar þegar svo er ekki. Jafnvel stutt myndskeið verða spunnin frá grunni. Í stuttu máli verður erfiðara en nokkru sinni að trúa neinu nema því sem maður sér með eigin augum.
- Skrifa tölvupósta: Næst þegar þú færð tölvupóst með alllöngu samfelldu máli skaltu velta fyrir þér hvort sendandinn hafi skrifað hann sjálfur eða hvaða kvaðning (e. prompt) hefði hugsanlega nægt til að fylla í eyðurnar: „Afþakkaðu afmælisboð Önnu kurteislega en semdu vísu til heiðurs henni sextugri“, „Skrifaðu starfsumsókn sem uppfyllir öll skilyrði þessarar atvinnuauglýsingar fullkomlega“, „Skrifaðu rökstuðning með lagafrumvarpi um áframhaldandi hvalveiðar við Ísland“, …
- Verða ávanabindandi: Ef þið hélduð að TikTok, Instagram og YouTube Shorts væru ávanabindandi, þá mun spunagreindin verða notuð til að spila á dópamínstöðvar heilans á alveg nýjum hæðum. Spjallbotta-„elskhugar“ eru þegar orðinn allstór iðnaður, enda alltaf til staðar, segja það sem viðmælandinn vill heyra og eru alltaf til í allt. Það þarf varla að taka fram að margar þessara „lausna“ spila röngum megin laganna og eru notaðar í fjár- og annarri svikastarfsemi. Sambærilegir „stafrænir félagar“ munu spretta upp á ótal fleiri sviðum og í auknum mæli verður ómögulegt að vita hvort „þau“ sem við eigum í samskiptum við með stafrænum hætti séu viti bornar manneskjur eða vitlíki.
- Fokka í lýðræðinu: Ofangreindar lausnir verða notaðar til að hafa áhrif á almenningsálit, afla fylgis við frambjóðendur og flokka, sérsníða skilaboð að viðkvæmum hópum og valda almennri upplýsingaóreiðu. Þetta er í raun alvarlegasta skammtímaógnin sem hin nýja gervigreindartækni ber með sér. Síðastliðin 15 ár hafa samfélagsmiðlar, netauglýsingar og margvíslegar stafrænar herferðir spilað sífellt stærri rullu í aðdraganda kosninga. Mikið hefur verið rætt um aðkomu rússneskra hakkara og óvandaðra stafrænna lukkuriddara á borð við Cambridge Analytica að forsetakosningunum í Bandaríkjunum 2016 og 2020 sem og öðrum kosningum, óeirðum og dreifingu samsæriskenninga um heim allan. Heimspekingurinn Yuval Noah Harari heldur því fram að þegar við vitum ekki lengur hvort við eigum í samskiptum við mann eða vél og vélar geta spunnið sögur og myndir sem séu óaðgreinanlegar frá raunveruleikanum falli lýðræðið með látum. Fram undan er bæði forval og kosningar til forseta í Bandaríkjunum á árinu í fyrsta sinn síðan þessi nýja tækni kom fram og hún verður notuð óspart. Ég spái því að aðkoma spunagreindar að þeim verði eitt stærsta fréttamál ársins.
- Semja tónlist í kvikmyndir: Ódýrari framleiðsla, svo sem framleiðsla á barnaefni, heimildamyndum og YouTube-efni mun taka því fegins hendi að geta gætt efnið sitt tónheimi án þess að hafa áhyggjur af stefgjöldum eða höfundarrétti. Sem fyrr er spunagreindin engin sérfræðingur – enginn Danny Elfman eða John Williams – en ástríðufullur kvikmyndagerðarmaður sem vinnur heimildamynd sína af litlum efnum getur engu að síður gætt lokasenu af bráðnandi jökulsporði tilfinningaþrunginni tónlist að sínum smekk.
- Myndskreyta glærur: Meirihluti glærukynninga sem þið sjáið á árinu verði með eina eða fleiri spunamynd.
- Þýða bækur og texta sjónvarpsefni: Storytel hefur tilkynnt að fyrirtækið stefni á stórfellda útgáfu vélþýddra bóka. Þau verða ekki ein um það. Og jafnvel þó hrein vélþýðing standi góðum mennskum þýðanda langt að baki, flýtir vélþýðingin engu að síður fyrir sérfræðingum hér sem annars staðar. Þýðingar á hvers kyns efni munu margfaldast, líka gæðaþýðingar. Þetta þýðir líka að sjónvarpsefni sem hingað til hefur ekki svarað kostnaði að texta getur nú farið að birtast á efnisveitum með íslenskum texta eins og lög gera ráð fyrir.
- Vara þig við vitleysu: Það er ef til vill kaldhæðnislegt en gervigreindarmódel eru líklega eina raunhæfa lausnin til að vara við vitleysunni, fölsununum, svindlinu og upplýsingaóreiðunni sem verður framleidd með gervigreind. Þar er þó rétt að muna að vitleysa, svindl og upplýsingaóreiða er ekki ný af nálinni þannig að ef vel tekst til mun slík tækni draga úr óreiðunni frekar en hitt. Þetta, auk annarra lagalegra, siðferðilegra og heimspekilegra úrlausnarefna verður mjög stórt viðfangsefni á árinu.
Gervigreindin mun ekki drepa okkur … hjálparlaust
Þrátt fyrir það hversu mögnuð hin nýja spunagreindartækni er, þá eignum við henni líklega meiri mannlega eiginleika en tilefni er til. Í grunninn eru þetta tölfræðilíkön sem eru ofsalega fær í að stinga upp á næsta orði í samhangandi texta eða gera mynd, hljóð eða annað efni smám saman aðeins líkara einhverju sem fyrir hana var lagt. Spunagreindin getur ekki gert áætlanir, getur ekki hugsað „fram í tímann“ og ekki tileinkað sér nýja færni með takmörkuðum fyrirmælum. Það sem meira er, gervigreindin hefur enga reynslu af heiminum. Hún er lokuð í „kassa“ sem einangrast við það stafræna efni sem hún hefur verið mötuð á.
Það sem blekkir okkur er viðmótið. Við getum í fyrsta sinn átt í samskiptum við tölvur á sama hátt og við annað fólk og viðbrögðin virka mannleg. Oft og tíðum raunar ofurmannleg. En meðan unglingur getur lært að aka bíl með 20 klukkustunda þjálfun og sett í uppþvottavél eftir að hafa séð það gert einu sinni (viljinn er annað mál), erum við langt frá því að þróa almennt vitlíki sem kemst nokkurs staðar nálægt sambærilegri hæfni í að umgangast heiminn.
Það er sennilega fyrirséð að á endanum verða tölvur greindari en við – jafnvel með ströngustu skilgreiningum á „greind“ – en flestir fræðimenn á sviðinu telja að tauganet með umbreytum eins og þau sem voru lykillinn að yfirstandandi byltingu séu í mesta lagi skref í þá átt og margir hallast raunar að því að almenn gervigreind (e. Artificial General Intelligence) verði byggð á allt öðrum forsendum þegar þar að kemur.
En jafnvel þegar sá dagur kemur að tölvurnar verða greindari en við er ekki ástæða til að ætla að greindin ein verði til þess að tölvurnar vilji tortíma mannkyninu. Í veraldarsögunni hefur það ekki verið greindasta fólkið sem hefur farið með heiminn næst hengifluginu. Oft þvert á móti. Það er frekar að óttast að illgjarnt og ef til vill miður greint fólk geti fengið meiru „áorkað“ þegar það hefur aðgang að vitlíki sem tekur þeirra eigin viti fram.
One comment