Kristján Gauti Karlsson safnar hér saman öllum textum sem mynda fréttasafn Skessuhorns.

Skessuhorn notað til að kenna tölvum íslensku

Fréttir, viðtöl og aðrir textar sem birst hafa í Skessuhorni og öðrum blöðum hafa ekki endanlega lokið tilgangi sínum þó að blöðin hafi verið gefin út. Utan skylduskila á Landsbókasafnið er textum sömuleiðis safnað í Risamálheildina svokölluðu, sem er ein af málheildum Stofnunar Árna Magnússonar í íslenskum fræðum. Textarnir eru síðan meðhöndlaðir og gefnir út. Nýjasta útgáfa Risamálheildarinnar inniheldur um 1.390 milljón lesmálsorð á íslensku. Hluti þeirra eru opinberir textar, svo sem Alþingisræður frá 1907, lagatextar, dómar og fleira slíkt, en einnig inniheldur hún stór textasöfn frá ýmsum fjölmiðlum landsins, Skessuhorni þar á meðal.

Risamálheildin er ekki síst hugsuð til notkunar í máltækniverkefnum. Unnið er eftir sérstakri máltækniáætlun fyrir íslensku, en markmið hennar er að tryggja að hægt sé að nota íslensku sem samskiptamáta í tækniheiminum. Til þess þurfa maður og tölva að geta átt í samskiptum á íslensku og til að svo megi verða þarf að kenna tölvunum ekki aðeins að lesa og skrifa, heldur einnig að skilja og tala málið. Þegar sá dagur rennur upp að hægt verður að eiga alfarið í samskiptum við tölvur og tæki á íslensku munu textarnir úr Skessuhorni hafa verið lóð á vogarskál þeirrar vegferðar.

Máltæknifyrirtækið Grammatek á Akranesi annaðist söfnun textanna frá Skessuhorni fyrir Árnastofnun að þessu sinni. Það var Kristján Gauti Karlsson, starfsmaður Grammateks, sem tók að sér að safna textunum síðastliðinn föstudag. Að þessu sinni var textum frá undanförnum rúmlega fjórum árum safnað, eða allt frá því söfnun fór síðast fram. Þess má geta að Kristján Gauti er einmitt fyrrverandi blaðamaður Skessuhorns og því voru hæg heimatökin að fá hann til verksins.

Líkar þetta

Fleiri fréttir