
„Google“ iš esmės pakeitė savo atvirojo dirbtinio intelekto strategiją, pristatydama... „Gemma 4“ – nauja atviro svorio modelių šeima Siekiama suderinti aukštą našumą, techninės įrangos efektyvumą ir tikrai atvirą licenciją komerciniam naudojimui. Sukurta remiantis tuo pačiu technologiniu pagrindu kaip ir „Gemini 3“, ši linija skirta tiek didelėms įmonėms, tiek kūrėjams, norintiems diegti pažangų dirbtinį intelektą, visiškai nepasikliaujant uždaromis debesijos paslaugomis.
„Gemma 4“ toli gražu nėra tiesiog dar vienas eksperimentinis modelis, jis pasirodo kaip pilnas keturių variantų pasiūlymas Šie sprendimai gali veikti mobiliuosiuose įrenginiuose, periferiniuose įrenginiuose, asmeniniuose kompiuteriuose ir serveriuose su didelio našumo GPU. „Google“ strategija orientuota į didesnio intelekto siūlymą kiekvienam parametrui, infrastruktūros sąnaudų mažinimą ir tuo pačiu metu bendruomenės bei įmonių lankstumo pritaikymą modeliams pagal savo poreikius suteikimą.
Keturių modelių šeima, sukurta aprėpti viską – nuo mobiliųjų įrenginių iki duomenų centrų
„Gemma 4“ šeima yra organizuota pagal keturi pagrindiniai dydžiai: E2B, E4B, 26B MoE ir 31B DensePirmieji du yra skirti periferiniam vykdymui, o 26.000 milijardo ir 31.000 milijardo parametrų modeliai skirti galingoms darbo stotims, įskaitant didelio našumo nešiojamieji kompiuteriai ir serverių aplinkose.
Variantai Efektyvus 2B (E2B) ir efektyvus 4B (E4B) Jie buvo specialiai sukurti ribotų išteklių įrenginiams, tokiems kaip „Android“ telefonai, daiktų interneto plokštės ir kt. įterptosios sistemos pavyzdžiui, „Raspberry Pi“ arba tokių gamintojų kaip „Qualcomm“ ir „MediaTek“ aparatinė įranga. Jų tikslas – išlaikyti gerą loginį mąstymą ir daugiamodalines galimybes, tuo pačiu sumažinant atminties, akumuliatoriaus ir delsos sąnaudas.
Viršuje, modelis 26B su mišrios ekspertų (MoE) architektūra Jis optimizuotas taip, kad sutrumpėtų atsako laikas: išvados metu aktyvuojama tik apie 3,8 milijardo parametrų, todėl kūrėjų įrangoje arba vartotojų GPU galima generuoti didelės spartos žetonus, įskaitant pritaikytos dirbtinio intelekto lustos, idealiai tinka vietiniams programavimo asistentams ir kūrimo įrankiams.
Viršutiniame gale yra Gemma 4 31B TankusTankus, į užduotis orientuotas variantas teikia pirmenybę kokybei ir nuoseklumui, o ne greičiui. Šis modelis jau užėmė vieną iš aukščiausių pozicijų atvirojo kodo modelių reitinguose, tokiuose kaip „Arena AI“ teksto lyderių lentelė, konkuruodamas su dvidešimt kartų didesnėmis sistemomis pagal parametrus.
Šis lengvų ir sunkių modelių derinys leidžia „Gemma 4“ aprėpti Nuo kasdienio mobiliojo naudojimo iki svarbių verslo darbo eigųsuteikiant sistemų architektams laisvę rinktis tarp išvadų darymo greičio arba analizės gylio, priklausomai nuo kiekvieno projekto.
Išplėstinis multimodalumas ir ilgi kontekstiniai langai
Vienas iš naujos šeimos privalumų yra gebėjimas dirbti su keli turinio tipai iš kartoVisi „Gemma 4“ modeliai gali apdoroti tekstą ir vaizdus, palaikydami skirtingas skiriamąsias gebas ir kraštinių santykius, o tai palengvina naudojimo atvejus, tokius kaip dokumentų nuskaitymo analizė, sąsajų vizualinis supratimas arba aprašymų generavimas.
Be to, versijos E2B ir E4B išplečia daugiamodalumą vaizdo ir garso srityjeTai leidžia jiems tiesiogiai įrenginyje atlikti mažo vėlavimo kalbos atpažinimo užduotis, vaizdo įrašų analizę ar papildytosios realybės programas. Mobiliųjų įrenginių ar daiktų interneto scenarijuose ši galimybė vykdyti vaizdo ir garso funkcijas nuolat nepasikliaujant debesimi sumažina ryšio problemas ir pagerina privatumą.
Kalbant apie didelių informacijos kiekių tvarkymą, „Gemma 4“ šeima pristato kontekstinius langus iki 256 000 žetonų didžiausiuose modeliuoseKraštinių įrenginių variantai siūlo 128 tūkst. kontekstų, o 26B ir 31B variantai – 256 tūkst. žetonų. Tai leidžia, pavyzdžiui, įkelti ištisas kodo saugyklas, dideles dokumentų duomenų bazes arba labai ilgas pokalbių istorijas viena užklausa.
Šis konteksto platumas yra ypač naudingas neprisijungus generuojamas kodas, automatizuota techninė pagalba arba teisinių dokumentų analizėŠios sritys ypač aktualios Europos įmonėms, kurioms taikomi griežti reglamentai ir kurios dažnai turi saugoti informaciją savo sistemose.
Kartu su multimodalumu ir išplėstiniu kontekstu „Google“ pabrėžia „Gemma 4“ palaikymą daugiau nei 140 kalbųDėl plataus kalbinio aprėpties tai yra patrauklus pasirinkimas pasaulinėms įmonėms, Europos viešojo administravimo įstaigoms ar startuoliams, norintiems pristatyti daugiakalbius produktus, nepriklausantiems nuo kelių skirtingų modelių.
Autonominiai agentai, JSON ir funkcijų iškvietimai: srautu pagrįsta agentinė kalba „Gemma 4“
„Gemma 4“ peržengia tradicinio teksto generavimo ribas. Visa šeima buvo sukurta aiškiai sutelkiant dėmesį į agentais pagrįsti darbo eigos, vis aktualesnė tendencija verslo ir programinės įrangos kūrimo aplinkoje.
Modeliai standartiškai apima vietinis funkcijų iškvietimo palaikymasTai leidžia sistemai kontroliuojamai iškviesti išorines API sąsajas arba konkrečius įrankius. Be to, jie siūlo struktūrizuotą JSON išvestį, palengvindami integraciją su programomis, kurioms reikalingi suformatuoti atsakymai, kad juos galėtų naudoti kitos paslaugos arba mikropaslaugos.
Kitas svarbus aspektas yra suderinamumas su gimtosios sistemos instrukcijosŠios funkcijos leidžia tiksliai apibrėžti sistemos vaidmenį ir nustatyti aiškias modelio elgseną reglamentuojančias taisykles. Ši galimybė ypač naudinga kuriant autonominius agentus, kurie valdo klientų aptarnavimą, automatizuoja vidinius procesus arba koordinuoja įvairius įmonės įrankius.
„Google Cloud“ vadovų teigimu, įmonių dirbtiniam intelektui reikalingi modeliai, galintys vykdyti sudėtingą logiką, tuo pačiu metu saugant duomenis saugioje aplinkojeŠia prasme „Gemma 4“ agentinis metodas derinamas su vietinio ir kontroliuojamo debesies diegimo galimybėmis, siekiant sumažinti riziką ir padidinti duomenų tvarkymo vietos ir būdo kontrolę.
Šiuos modelius bendrovė papildo Agento kūrimo rinkinys (ADK)– modulinė sistema, skirta agentų kūrimui paspartinti, ir palaikanti intensyvių darbo krūvių vykdymą be serverio debesies aplinkoje, naudojant NVIDIA RTX PRO 6000 GPU („Blackwell“), o tai sumažina pradines investicijas, reikalingas eksperimentuoti su sudėtingais agentais.
„Apache“ 2.0 licencija ir skaitmeninis suverenitetas: pasekmės Europai ir Ispanijai
Vienas reikšmingiausių pakeitimų, palyginti su ankstesnėmis „Gemma“ kartomis, yra licencijoje. Pirmą kartą... „Gemma 4“ platinama pagal „Apache 2.0“ – visiškai atvirą licenciją. kuris leidžia komercinį naudojimą be papildomų konkrečių „Google“ apribojimų.
Ankstesnėse versijose naudojimo sąlygose buvo sąlygų, kurios kėlė susirūpinimą įmonių teisininkų komandoms, ypač didelėse įmonėse ir viešojo administravimo įstaigose. „Apache 2.0“ versijoje „Google“ priskiria „Gemma 4“ tai pačiai licencijavimo kategorijai kaip ir... kiti atviri etaloniniai modeliai, tokie kaip „Llama“palengvinant jo pritaikymą gamybos projektuose be individualių derybų.
Šis sprendimas turi aiškią europinę interpretaciją. atviras modelis, suderinamumas su daugiau nei 140 kalbų ir nepriklausomos diegimo galimybės Tai atitinka duomenų saugojimo reglamentus ir diskusijas dėl Europos Sąjungos dirbtinio intelekto reglamento. Ispanijos ir Europos įmonės gali integruoti „Gemma 4“ į savo sprendimus, išlaikydamos didesnę duomenų saugojimo ir tvarkymo vietos kontrolę.
„Google“ tikisi, kad „Gemma 4“ bus galima įsigyti... Suverenios debesijos aplinkos ir konfigūracijos su oro tarpaistaip pat ir vietoje įrengtose sistemose. Reguliuojamiems sektoriams, pavyzdžiui, bankininkystės, sveikatos priežiūros, energetikos ar viešojo administravimo, tai atveria duris panaudoti pažangų dirbtinį intelektą nereikalaujant siųsti neskelbtinos informacijos į bendras infrastruktūras už Europos ribų.
Licencijos lankstumas taip pat skatina kurti vietiniai ir specializuoti variantaiPavyzdžių jau buvo matyti praeityje, pavyzdžiui, modeliai, pritaikyti konkrečioms kalboms ir kontekstams (pavyzdžiui, BgGPT Bulgarijoje arba medicinos taikymai Šiaurės Amerikos universitetuose), ir „Google“ tikisi, kad „Gemma 4“ sustiprins šią ekosistemą, kurią kai kurie vadina „Gemmavisata“ su dešimtimis tūkstančių bendruomenių variantų.
„Google Cloud“ integracija, vietinis vykdymas ir reikalinga aparatinė įranga
Be modelio atvėrimo, „Google“ parengė palaikymo infrastruktūrą, skirtą „Vertex AI“ ir „Google Kubernetes“ variklis (GKE)Naudodamosi šiomis paslaugomis organizacijos gali teikti pritaikytus išteklius, keisti išvadų darbo krūvius ir pritaikyti diegimą pagal savo saugumo ir atitikties reikalavimus.
„Vertex AI“ sistemoje „Gemma 4“ yra integruota kaip modelių katalogo dalis, leidžianti techninėms komandoms išbandyti, tiksliai suderinti ir įdiegti Tinkinti variantai, išlaikant skaičiavimo išteklių kontrolę. Derinys su GKE leidžia dinamiškai keisti mastelį, pritaikant išvados paslaugų replikų skaičių prie faktinio poreikio.
Svarbus faktas vidutinio dydžio įmonėms yra tai, kad 26B ir 31B modelių „bfloat16“ svoriai telpa į vieną 80 GB talpos „NVIDIA H100“ vaizdo plokštę.Tai žymiai sumažina minimalias investicijas, reikalingas norint įsigyti aukščiausios klasės modelius, palyginti su alternatyvomis, kurioms reikia kelių GPU lygiagrečiai.
Tuo pačiu metu „Gemma 4“ yra optimizuota veikti įvairi techninė įranga – nuo vartotojams skirtų GPU iki mobiliųjų sprendimų su 5G M2M ryšysE2B ir E4B modeliai naudoja tokias technologijas kaip įterpimas sluoksniui (PLE), kad maksimaliai padidintų efektyvumą kiekvienam parametrui ir galėtų veikti telefonuose, „Raspberry Pi“ arba periferiniuose įrenginiuose su labai mažu delsos laiku.
Suderinamumas taip pat apima ekosistemos, tokios kaip „Hugging Face“, „Ollama“, „vLLM“, „LM Studio“ arba „llama.cpp“taip pat „Google“ kūrimo platformas, tokias kaip „AI Studio“ ir „AICore“ (skirta „Android“ prototipų kūrimui). Tai leidžia tiek nepriklausomiems kūrėjams, tiek įmonių komandoms lengvai integruoti „Gemma 4“ į savo įprastus darbo procesus, nereikia pradėti nuo nulio.
Galimas panaudojimas versle, švietime ir viešajame sektoriuje
„Gemma 4“ galimybės leidžia diegti platus praktinių pritaikymų spektras kurie peržengia klasikinių pokalbių robotų ribas. Verslo aplinkoje šie modeliai gali būti naudojami kaip pagrindas vidiniams virtualiems asistentams, kurie atsako į klausimus apie įmonės dokumentaciją, generuoja santraukas arba automatizuoja pasikartojančias užduotis keliomis kalbomis.
Programavimo srityje derinys platūs kontekstiniai langai, kodo generavimas ir mažas delsos laikas Dėl to „Gemma 4“ tinka vietiniams kūrimo asistentams, automatizuotai kodo peržiūrai arba įrankiams, kurie vienu metu analizuoja visas saugyklas, o kodas lieka įmonės infrastruktūroje.
Švietimo srityje „Gemma 4“ galėtų būti naudojama sukurti suasmenintus mokytojus, kurie pritaikytų turinį Mokinių lygmeniu jie generuoja sudėtingų tekstų santraukas arba paaiškina paveikslėlius ir grafiką, o tai ypač naudinga mokiniams, turintiems specialiųjų pritaikymo neįgaliesiems poreikių.
Ispanijos ir Europos viešajam sektoriui ir administravimo įstaigoms šių modelių diegimo galimybė kontroliuojamoje aplinkoje, kai duomenys saugomi Europos teritorijojeTai atveria galimybes teikti piliečiams paslaugas, analizuoti bylas ar automatizuoti procedūras, jei jos integruojamos su reglamentuose reikalaujamomis skaidrumo ir žmogaus priežiūros garantijomis.
Tokiuose sektoriuose kaip gamyba, tikslioji žemdirbystė ar infrastruktūros valdymas vietinis vykdymas periferinių skaičiavimų įrenginiuose leidžia Analizuokite duomenis realiuoju laiku, nesiremdami nuolatiniu debesies ryšiuTai sumažina perdavimo išlaidas, pagerina reagavimo laiką ir sumažina jautrių duomenų patekimą į išorinius tinklus.
Vietinis dirbtinis intelektas, išlaidos ir skirtumas tarp atvirųjų ir patentuotų modelių
„Gemma 4“ pristatymas atspindi aiškią tendenciją pramonėje: prioritetas nebėra tik tai, kas turi didžiausią modelį, bet ir kas pasiekia geriausią pusiausvyrą tarp pajėgumų, kainos ir diegimo paprastumo„Google“ tvirtina, kad „parametrų intelekto“ idėja yra pagrindinis šios naujos kartos rodiklis.
Galimybė paleisti pažangius modelius vietoje, ne visada pasikliaujant didelėmis debesijos paslaugomis, rodo, kad produktų ir paslaugų dizaino pokyčiųDaugeliui kasdienių užduočių – teksto santraukai, priminimo kūrimui, paprasto vaizdo apdorojimui – nėra prasmės siųsti duomenis į nuotolinius masinius modelius, jei tai galima išspręsti pačiame įrenginyje.
Nepaisant to, „Gemma 4“ nėra skirta pakeisti „Google“ patentuotus modelius, bet... juos papildytiBendrovė „Gemini“ laiko pažangiausiu ir uždariausiu sluoksniu, skirtu tiems atvejams, kai svarbiausia yra maksimalus pajėgumas. „Gemma 4“ yra vienu žingsniu žemiau technologinio pranašumo atžvilgiu, tačiau laimi atvirumo, lankstumo ir sąnaudų kontrolės srityse.
IT skyriams tai suteikia vis labiau matomą pasirinkimą: Uždari modeliai, kuriuos lengviau naudoti, bet mažiau kontroliuoti, palyginti su atvirais modeliais kurie reikalauja aktyvesnio infrastruktūros valdymo mainais už visišką suverenitetą ir didesnį ekonominį optimizavimą vidutinės trukmės laikotarpiu.
Atsižvelgiant į tai, Ispanijos ir Europos įmonių konkurencingumas dirbtinio intelekto srityje gali labai priklausyti nuo jų gebėjimo integruoti atvirus modelius, tokius kaip „Gemma 4“, į savo svarbiausius procesusprireikus derinant jas su patentuotomis paslaugomis ir visada užtikrinant duomenų apsaugos reglamentų ir būsimų Europos dirbtinio intelekto reglamentų laikymąsi.
Kurdama „Gemma 4“, „Google“ įtvirtina tvirtą įsipareigojimą kurti efektyvius atvirus modelius, galinčius veikti prieinamoje aparatinėje įrangoje, prisitaikyti prie skirtingų reguliavimo sistemų ir būti naujos kartos vietinių agentų ir programų pagrindu; tie, kurie žino, kaip pasinaudoti šiuo atvirumo, našumo ir kontrolės deriniu, turės pranašumą kurdami tvarius dirbtinio intelekto sprendimus, atitinkančius Europos poreikius.


