Dessa är alltså nordiska språkmodeller tränade på LUMI (som finansierats av EU-medel). Jag har tyvärr inte koll på ägandestrukturen för Silo men dessa modeller är tränade med Horizonpengar (HPLT) så allt är offentligt finansierat av skattemedel. Finns på HuggingFace under LumiOpen.

  • frikretsA
    link
    fedilink
    Svenska
    arrow-up
    1
    ·
    9 months ago

    Silo AI, Europas största privata AI-labb, har släppt de första checkpoints för Viking, en öppen stor språkmodell (LLM) för nordiska språk, engelska och programmeringsspråk. Detta är ett samarbete med Universitetet i Åbo’s forskargrupp TurkuNLP och HPLT. Viking är en förbättrad version av Silo AI’s tidigare modell Poro och är utformad för att ge topprestanda i språk med låga resurser utan att kompromissa med engelska. Preliminära utvärderingar indikerar att Viking överträffar andra öppna LLM, särskilt i nordiska språk. Denna release är en del av Silo AI’s bredare strategi för att stärka språklig mångfald och förbättra LLM-förmågor i hela Europa. Målgruppen för dessa Viking checkpoints är akademisk och industriell forskning, inte produktionsimplementering.

    Skulle vara kul att se vad den har för specifikt nordisk träningsdata.

    Viking is being trained on a 2 trillion token mixed dataset of English, Finnish, Swedish, Danish, Norwegian, Icelandic and code. Full details will be published soon.