(Artikeln länkar till en blogg för ett företag som menar lansera en öppen modell. Kanske mest marknadssnack men bra att ha något som utgångspunkt för samtal).
Jag är verkligen inte en expert men när man pratar om AI så är det ju både datan som har viktningar (biljoner antal om jag fattat det rätt) och programvaran som kan dra nytta av det.
För att en AI-modell på allvar ska vara öppen så måste allt vara öppet: hur man får till träningsdatan och viktningar och programvaran som kan interagera med det.
Sen bör det i min mening vara ännu en sak: att man ska kunna generera egna viktningar med öppna verktyg. Nu sker det mesta med nvidias stängda system.
Värt att tänka på att det kostar otroligt mycket datorkraft (och därmed el för att driva datacenter och för att kyla). När alla/många företag/organisationer gör sina modeller själva så är det stort slöseri på energi.
Finns det några språkmodeller som är mer hållbara än andra? Finns det t.ex. universitet som utvecklar som kanske har mer krav på att inte slösa allt för mycket?
Jo det finns mem jag tänker att det lite vad /c/larandemaskiner har för mål att utforska och kanske inte passar bara i ett inlägg. Angående energianvändningen finns det alternativa sätt att bygga hårdvaran på för att göra djupinlärning mer energisnål och lik hur våra egna hjärnor opererar.
Jobbar du med sånt här till vardags eller är du bara intresserad?
Både hobby, jobb och mitt forskningsämne är inom domänen :)