Kaip ir kiekviena didelė šių dienų technologijų įmonė, „Meta“ turi savo pavyzdinį generuojantį AI modelį, vadinamą „Llama“. „Llama“ yra šiek tiek unikali tarp pagrindinių modelių, nes ji yra „atvira“, o tai reiškia, kad kūrėjai gali ją atsisiųsti ir naudoti, kaip nori (su tam tikrais apribojimais). Tai prieštarauja tokiems modeliams kaip Anthropic’s Claude, OpenAI GPT-4o (kuris palaiko ChatGPT) ir Google Gemini, kuriuos galima pasiekti tik per API.
Tačiau norėdama suteikti kūrėjams pasirinkimą, „Meta“ taip pat bendradarbiauja su tiekėjais, įskaitant AWS, „Google Cloud“ ir „Microsoft Azure“, kad būtų prieinamos debesyje priglobtos „Llama“ versijos. Be to, įmonė išleido įrankius, skirtus palengvinti modelio patikslinimą ir pritaikymą.
Štai viskas, ką reikia žinoti apie „Llama“ – nuo jos galimybių ir leidimų iki kur galite ją naudoti. Šį įrašą nuolat atnaujinsime, kai „Meta“ išleis naujinimus ir pristatys naujus kūrimo įrankius, palaikančius modelio naudojimą.
Kas yra Lama?
Lama yra modelių šeima – ne tik viena:
- Lama 8B
- Lama 70B
- Lama 405B
Naujausios versijos yra Lama 3.1 8B, Lama 3.1 70B ir Lama 3.1 405Bkuris buvo išleistas 2024 m. liepos mėn. Jie mokomi apie tinklalapius įvairiomis kalbomis, viešąjį kodą ir žiniatinklyje esančius failus, taip pat sintetinius duomenis (ty duomenis, sugeneruotus kitų AI modelių).
„Llama 3.1 8B“ ir „Llama 3.1 70B“ yra nedideli, kompaktiški modeliai, skirti veikti įvairiuose įrenginiuose – nuo nešiojamųjų kompiuterių iki serverių. Kita vertus, Llama 3.1 405B yra didelio masto modelis, kuriam reikalinga (be kai kurių modifikacijų) duomenų centro aparatinės įrangos. Llama 3.1 8B ir Llama 3.1 70B yra mažiau pajėgios nei Llama 3.1 405B, bet greitesnės. Tiesą sakant, tai yra „distiliuotos“ 405B versijos, optimizuotos mažoms saugojimo sąnaudoms ir delsai.
Visi Llama modeliai turi 128 000 žetonų kontekstinius langus. (Duomenų moksle prieigos raktai yra suskirstyti neapdorotų duomenų bitai, pvz., skiemenys „fan“, „tas“ ir „tic“ žodyje „fantastic“.) Modelio kontekstas arba konteksto langas nurodo įvesties duomenis (pvz., tekstą). ), į kuriuos modelis atsižvelgia prieš generuodamas išvestį (pvz., papildomą tekstą). Ilgas kontekstas gali neleisti modeliams „pamiršti“ naujausių dokumentų ir duomenų turinio, nukrypti nuo temos ir neteisingai ekstrapoliuoti.
Tie 128 000 žetonų išversti į maždaug 100 000 žodžių arba 300 puslapių, o tai yra maždaug „Wuthering Heights“, „Gulliverio kelionės“ ir „Haris Poteris ir Azkabano kalinys“ ilgis.
Ką gali padaryti Lama?
Kaip ir kiti generaciniai AI modeliai, Llama gali atlikti įvairias pagalbines užduotis, pavyzdžiui, koduoti ir atsakyti į pagrindinius matematikos klausimus, taip pat apibendrinti dokumentus aštuoniomis kalbomis (anglų, vokiečių, prancūzų, italų, portugalų, hindi, ispanų ir tajų). Dauguma tekstu pagrįstų darbo krūvių – manau, analizuoti failus, pvz., PDF ir skaičiuokles – priklauso jos kompetencijai; nė vienas iš Lamos modelių negali apdoroti ar generuoti vaizdų, nors artimiausiu metu tai gali pasikeisti.
Visus naujausius „Llama“ modelius galima sukonfigūruoti taip, kad būtų galima panaudoti trečiųjų šalių programas, įrankius ir API, kad būtų galima atlikti užduotis. Jie yra išmokyti naudoti „Brave Search“, kad atsakytų į klausimus apie naujausius įvykius, „Wolfram Alpha“ API su matematika ir mokslu susijusioms užklausoms ir „Python“ vertėjas kodui patvirtinti. Be to, Meta teigia, kad Llama 3.1 modeliai gali naudoti tam tikrus įrankius, kurių jie dar nematė (bet ar jie gali patikimai naudoti tas priemones yra kitas reikalas).
Kur galiu naudoti Lama?
Jei norite paprasčiausiai pabendrauti su Llama, tai sustiprina „Meta AI“ pokalbių roboto patirtį „Facebook Messenger“, „WhatsApp“, „Instagram“, „Oculus“ ir „Meta.ai“.
Kūrėjai, kuriantys su Llama, gali atsisiųsti, naudoti arba tiksliai suderinti modelį daugelyje populiarių debesų platformų. „Meta“ teigia, kad turi daugiau nei 25 „Llama“ partnerius, įskaitant „Nvidia“, „Databricks“, „Groq“, „Dell“ ir „Snowflake“.
Kai kurie iš šių partnerių sukūrė papildomus įrankius ir paslaugas, papildančius „Llama“, įskaitant įrankius, kurie leidžia modeliams remtis patentuotais duomenimis ir leidžia jiems veikti mažesniu delsos laiku.
„Meta“ siūlo naudoti mažesnius modelius „Llama 8B“ ir „Llama 70B“ bendrosios paskirties programoms, tokioms kaip pokalbių robotų maitinimas ir kodo generavimas. Bendrovė teigia, kad „Llama 405B“ yra geriau skirta modelių distiliavimui – žinių perkėlimo iš didelio modelio į mažesnį, efektyvesnį modelį – ir sintetinių duomenų generavimui alternatyviems modeliams apmokyti (arba koreguoti) procesui.
Svarbu tai, kad „Llama“ licencija riboja, kaip kūrėjai gali įdiegti modelį: programų kūrėjai, turintys daugiau nei 700 milijonų vartotojų per mėnesį, turi paprašyti specialios „Meta“ licencijos, kurią įmonė suteiks savo nuožiūra.
Kartu su Llama, Meta siūlo įrankius, skirtus modelio naudojimui „saugesniu“:
- Lamos sargas, moderavimo sistema
- Greitas sargybinis, priemonė, apsauganti nuo greitų injekcijų atakų
- „CyberSecEval“, kibernetinio saugumo rizikos vertinimo rinkinį
„Llama Guard“ bando aptikti potencialiai probleminį turinį, kuris tiekiamas arba sukurtas pagal „Lama“ modelį, įskaitant turinį, susijusį su nusikalstama veikla, vaikų išnaudojimu, autorių teisių pažeidimais, neapykanta, savęs žalojimu ir seksualine prievarta. Kūrėjai gali tinkinti užblokuoto turinio kategorijas ir taikyti blokus visoms kalboms, kurias palaiko Llama.
Kaip ir „Llama Guard“, „Prompt Guard“ gali blokuoti lamai skirtą tekstą, tačiau tik tekstą, skirtą „atakuoti“ modelį ir priversti jį elgtis nepageidaujamai. Meta teigia, kad „Llama Guard“ gali apsisaugoti nuo aiškiai kenkėjiškų raginimų (ty „jailbreak“, bandančių apeiti „Llama“ įmontuotus saugos filtrus), be raginimų, kuriuose yra „įvesties“.
Kalbant apie „CyberSecEval“, tai ne tik įrankis, o etalonų rinkinys modelio saugumui įvertinti. „CyberSecEval“ gali įvertinti riziką, kurią „Llama“ modelis kelia (bent jau pagal „Meta“ kriterijus) programų kūrėjams ir galutiniams vartotojams tokiose srityse kaip „automatizuota socialinė inžinerija“ ir „įžeidžiančių kibernetinių operacijų mastelis“.
Lamos apribojimai
„Llama“, kaip ir visi generaciniai AI modeliai, turi tam tikrų pavojų ir apribojimų.
Pavyzdžiui, neaišku, ar Meta mokė lamą apie autorių teisių saugomą turinį. Jei taip nutiktų, naudotojai gali būti atsakingi už pažeidimą, jei jie netyčia pasinaudos autorių teisių saugomu fragmentu, kurį modelis atgaivino.
Remiantis naujausiais „Reuters“ pranešimais, „Meta“ vienu metu naudojo autorių teisių saugomas elektronines knygas dirbtinio intelekto mokymams, nepaisydama savo teisininkų įspėjimų. Bendrovė prieštaringai treniruoja savo AI „Instagram“ ir „Facebook“ įrašuose, nuotraukose ir antraštėse, todėl vartotojams sunku atsisakyti. Be to, Meta kartu su OpenAI yra nuolatinio autorių, įskaitant komikė Sarah Silverman, byla dėl tariamo įmonių neteisėto autorių teisių saugomų duomenų naudojimo modelių mokymui.
Programavimas yra dar viena sritis, kurioje išmintinga žengti švelniai naudojant Lama. Taip yra todėl, kad „Llama“, kaip ir jos generatyvūs AI kolegos, gali sukurti klaidingą ar nesaugų kodą.
Kaip visada, geriausia, kad ekspertas peržiūrėtų bet kokį dirbtinio intelekto sukurtą kodą prieš įtraukiant jį į paslaugą ar programinę įrangą.