“Leiðrétt” stig í Scrabble

Ég get ekki neitað því að ég er nörd. Ein af annars ótal ótvíræðum sönnunum þess fylgir hér með.

Okkur hjónin hefur stundum grunað þegar við erum að spila Scrabble að stigin sem valin hafa verið þegar íslensk útgáfa spilsins var gerð endurspegli ekki endilega tíðni þeirra í íslensku máli.

Bara ein leið til að komast að því. Taflan hér að neðan er niðurstaða stafatalningar úr stórum íslenskum orðalista. Hún ætti því að endurspegla nokkuð vel tíðni þeirra í orðum sem löglega er hægt að setja fram í Scrabble.

Scrabble-fólki til ánægju ættu E-in – miðað við þessar niðurstöður – að vera einu færri og gefa tvö stig í stað eins. Þorn-ið ætti líka að gefa 8 stig í stað 4 og fleira, en þetta má allt sjá í eftirfarandi töflu.

Núverandi útgáfa “Leiðrétt” útgáfa
Stafur Staftíðni Stig Fjöldi Stig Fjöldi
a 216.728 1 10 1 10
n 208.844 1 8 1 8
r 200.548 1 7 1 8
i 168.023 1 8 1 7
s 145.558 1 6 1 6
u 128.589 1 6 1 6
l 126.598 2 3 1 6
t 112.659 1 5 1 5
e 91.175 1 6 2 5
g 88.555 2 4 2 4
k 82.294 2 3 2 3
m 77.741 2 3 2 3
ð 75.067 2 5 2 3
f 64.970 3 3 3 3
d 45.105 4 2 3 3
v 37.539 3 2 3 2
h 34.907 3 2 3 2
ó 33.795 6 1 4 2
j 32.632 5 1 4 2
b 29.558 6 1 4 2
á 27.931 4 2 4 1
o 27.027 3 3 5 1
p 25.064 8 1 5 1
ö 24.741 7 1 6 1
æ 23.151 5 1 6 1
y 21.647 7 1 6 1
í 20.030 4 2 7 1
ú 14.753 8 1 7 1
þ 9.123 4 1 8 1
ý 7.031 9 1 8 1
é 6.574 6 1 9 1
x 1.325 10 1 10 1

9 comments

  1. Frábært. Beðið lengi eftir þessu og haft grun um að ekki væri allt með felldu í stigatali í Skraflinu. Hinsvegar er kannski einn þáttur í jöfnunni sem þarf að taka tillit til, það er knippistilhneiging sumra stafa. Þannig hefur “þ” verið gjaldfellt, úr 8 í 5, en óverðskuldað að mínu mati. Flest tilfelli um “p” eru grunar mig í klasanum “pp” (hoppa, keppa, loppa o.s.frv.) sem gerir það að verkum að erfitt er að nota stafinn nema í “kippum”! Stakt “p” er t.d. mjög sjaldgæft fremst í orði. Ég fer þessvegna fram á endurtalningu atkvæða. Með nördakveðju

  2. Þetta er, eins og sjá má, bara beint út frá tölfræðinni – allar svona pælingar eins og þú kemur með krefjast einhvers konar huglægs mats. T.d. má segja á móti með Þ-ið að það er mjög auðvelt að koma því fyrir fremst í orðum (margar samsetningar), sem ekki er hægt að segja um alla stafi.

    Ég veit að menn hafa skoðað svona samsetningarmöguleika mismunandi stafa við skrif á stafsetningarleiðréttingarbúnaði, þar sem talin er fjöldi 2, 3 og 4 stafa combinationa í orðasöfnum þar sem viðkomandi stafir koma fyrir. Veit ekki hvort það er þess virði til að leiðrétta þessa töflu frekar, né þá hver reglan yrði.

    Það væri gaman að vita hvernig stigin í enska spilinu voru ákveðin á sínum tíma og hvort tekið var tillit til svona hluta þar.

  3. Já, úbbs, þetta átti að vera “p” en ekki “þ” hjá mér þar sem ég talaði um gjaldfellinguna. Svo efast ég um að í enskunni hafi verið tekið tillit til klasahegðunar, er þetta ekki eldgamalt spil? Spurning hvort skekkja þarf ekki að vera innbyggð í spilið til að það verði ekki of auðvelt?

  4. 1) Ég sé ekki hvernig þið skiptið væginu milli fjölda annars vegar og stiga fyrir stafinn hins vegar, né heldur hvernig þið tengið saman heildarvægi og tíðni.
    2) Ég sakna þess oft að geta ekki búið til orð t.d. með ‘pp’ eða ‘bb’. Svoleiðis mál mætti leysa með því að velja hverju sinni í ‘pokann’ úr miklu stærri poka, t.d. hundraðföldum, þannig að stundum væru tvö eða fleiri p í pokanum og stundum ekkert.
    3) Í framhaldi af þessu vaknar sú spurning hvort rétt sé eða nauðsynlegt að leikmaður viti eða geti vitað hvaða stafir eru eftir í poka leiksins.

    Með kærri kveðju frá gömlum nörd, ÞV

    1. Fyrst skal sagt að þetta er meira en 7 ára gömul færsla. Þar að auki byggði úrvinnslan á frekar bjöguðum orðalista, sem þá var samt það besta sem hægt var að fá undir opnu leyfi. Væri þetta gert aftur væri BÍN auðvitað safnið til að buggja þetta á.

      Það sem ég gerði hér var einfalt. Ég breytti ekkert fjölda þeirra stafa sem hafa hvert gildi, heldur aðeins röð þeirra m.v. tíðni. Best útskýrt með dæmi. Ég ákvað að halda 10 x 1 stigi fyrir algengasta stafinn (a), 8 x 1 stigi fyrir þá tvo næstu (n og i í spilinu, en n og r í “leiðréttu” útgáfunni) og svo koll af kolli.

      Þetta hefur þá kosti að heildarfjöldi stafa og stiga í pokanum breytist ekki neitt.

      Fyrr á þessu ári skapaðist svo heilmikil og nördaleg umræða um þessa færslu og þar kom m.a. hann Borgar með mjög merkilegar og skemmtilegar pælingar um hvernig mætti gera þetta miklu betur. Þær umræður eru því miður fallnar í Facebookar-innar dá þangað til þeir gera það einfaldara að grafa upp gamla statusa þar á bæ.

      Það sem uppúr stendur er samt: Núverandi stig eru meingölluð. Og “e” eru óþolandi.

  5. Ein einföld spurning um orðalistann: Voru þetta stofnorð, eða var þetta listi með öllum beygingarmyndum orðanna? Það getur talsverð áhrif á ákveðna stafi sem koma t.d. mikið fyrir í greini orða.

    1. Þetta var orðalisti unninn uppúr texta, þannig að beygingarmyndir voru þar á meðal. Þetta var hins vegar að mörgu leyti lélegur listi – og þessi greining mín var gerð fyrir tíma BÍN.

      Það sköpuðust áhugaverðar umræður um þetta í fyrra. Þar var Borgar búinn að gera áhugaverða hluti sem tóku þessa pælingu mun lengra:
      https://www.facebook.com/hjalli/posts/10152793553302506

      Nú virðist reyndar það sem hann gerði vera dautt líka. Kannski er hann til í að deila aftur.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s