Silo AI, Europas största privata AI-labb, har släppt de första checkpoints för Viking, en öppen stor språkmodell (LLM) för nordiska språk, engelska och programmeringsspråk. Detta är ett samarbete med Universitetet i Åbo’s forskargrupp TurkuNLP och HPLT. Viking är en förbättrad version av Silo AI’s tidigare modell Poro och är utformad för att ge topprestanda i språk med låga resurser utan att kompromissa med engelska. Preliminära utvärderingar indikerar att Viking överträffar andra öppna LLM, särskilt i nordiska språk. Denna release är en del av Silo AI’s bredare strategi för att stärka språklig mångfald och förbättra LLM-förmågor i hela Europa. Målgruppen för dessa Viking checkpoints är akademisk och industriell forskning, inte produktionsimplementering.
Skulle vara kul att se vad den har för specifikt nordisk träningsdata.
Viking is being trained on a 2 trillion token mixed dataset of English, Finnish, Swedish, Danish, Norwegian, Icelandic and code. Full details will be published soon.