
„Amazon Web Services“ pateikė savo dirbtinio intelekto strategija Paskelbusi keletą pranešimų, stiprinančių tiek savo lustų portfelį, tiek technologinį aljansą su „Nvidia“, bendrovė išsamiai aprašė, kaip integruos „Nvidia“ technologiją į būsimus dirbtinio intelekto procesorius, ir savo pagrindinėje metinėje debesų kompiuterijos konferencijoje Las Vegase pristatė naujus serverius, skirtus didelio masto dirbtinio intelekto modelių mokymui ir diegimui.
Šis žingsnis dar labiau sustiprina AWS poziciją dirbtinio intelekto skaičiavimo lenktynėse – srityje, kurioje ji tiesiogiai konkuruoja su tokiais milžinais kaip „Microsoft“, „Google“ ir „Meta“. „Amazon“ toli gražu ne tik perparduoda trečiųjų šalių GPU, bet ir stato ant savo lustų, specializuotų jungčių ir susitarimų su „Nvidia“ derinio, kad... pasiūlyti Europos ir pasaulio įmonėms daugiau našumo ir kainos galimybių.
„Trainium4“: kitas „Amazon“ lustas kalbės „Nvidia“ kalba
Vienas žymiausių pranešimų buvo patvirtinimas, kad bendrovės būsimas dirbtinio intelekto mokymo lustas, žinomas kaip Trainiumas4, bus integruota sujungimo technologija „Nvidia NVLink Fusion“Šis sprendimas leidžia itin greitai bendrauti tarp procesorių, o tai yra labai svarbu, kai tūkstančiai mašinų turi dirbti koordinuotai, kad apmokytų didelius kalbos modelius.
„NVLink“ laikomas vienu didžiausių „Nvidia“ privalumų didelio našumo duomenų centruose ir iki šiol buvo siejamas su konfigūracijomis, pagrįstomis vien tik bendrovės GPU. „Amazon“ sprendimas integruoti šią technologiją į „Trainium4“ reiškia, kad būsimi jos dirbtinio intelekto klasteriai galės derinti AWS lustus ir „Nvidia“ GPU toje pačioje infrastruktūroje, taip palengvindami darbą. hibridinės architektūros.
Nors AWS nenurodė konkrečių „Trainium4“ pasirodymo rinkoje datų, tikslas buvo aiškus: pasiūlyti platformą, kuri leistų klientams ir toliau naudotis „Nvidia“ programinės įrangos ekosistemos, ypač „CUDA“, privalumais, tuo pačiu metu dalį savo darbo krūvio perkeliant į „Amazon“ sukurtą įrangą, siekiant geresnio prieinamumo ir kainos.
Šis suderinamumas ypač aktualus Europos ir Ispanijos organizacijoms, kurios jau standartizavo „Nvidia“ GPU ir optimizavo bibliotekas, tačiau susiduria su... pajėgumų apribojimai arba didėjančios išlaidos kai jie plečia savo generatyvinio dirbtinio intelekto projektus.
Nauji serveriai su „Trainium3“: daugiau galios ir mažiau energijos
Nors „Trainium4“ kūrimas tęsiasi fone, AWS jau vieną iš jų įdiegė gamyboje. naujos kartos serveriai Sukurtas naudojant „Trainium3“ lustą. Šie įrenginiai, kuriuos galima įsigyti pačioje Las Vegaso konferencijoje, yra skirti didelių modelių mokymui ir didelio masto išvadų teikimui debesijos dirbtinio intelekto paslaugose.
Kiekvienas serveris integruoja 144 „Trainium3“ žetonai Be to, anot bendrovės, ji siūlo daugiau nei keturis kartus didesnę skaičiavimo galią nei ankstesnės kartos AWS dirbtinio intelekto įranga. Be to, tai daroma sunaudojant maždaug 40 % mažiau energijos, o tai yra pagrindinis veiksnys, kai elektros energijos sąnaudos ir tinklo apribojimai pradeda daryti įtaką duomenų centrų plėtrai.
Dave'as Brownas, AWS skaičiavimo ir mašininio mokymosi paslaugų viceprezidentas, pabrėžė, kad tikslas yra ne tik pasigirti neapdorota galia, bet ir parodyti klientams, kad ji egzistuoja. konkurencinga alternatyva kainos ir kokybės santykio atžvilgiu palyginti su tradiciniais GPU. Bendrovė vengia pateikti absoliučius skaičius, tačiau tvirtina, kad šuolis, palyginti su ankstesne karta, yra įspūdingas.
Šis efektyvumo didinimas ypač įdomus Europos operatoriams, kur nuolat didėja reguliavimo ir socialinis spaudimas skaitmeninės infrastruktūros energijos suvartojimui. Mažiau elektros energijos tam pačiam mokymo kiekiui reiškia tvaresnius duomenų centrus ir, potencialiai, glaustesnės sąskaitos faktūros verslo klientams.
„Amazon“ veiksmų plane „Trainium3“ siekia ne tik aplenkti „Nvidia“, bet ir sumažinti priklausomybę nuo išorinių tiekėjų bei sustiprinti patentuota dirbtinio intelekto lustų linija kuris gali vystytis pagal ciklus, kuriuos labiau kontroliuoja įmonė.
Dirbtinio intelekto gamyklos: speciali infrastruktūra mūsų pačių duomenų centruose
Dar vienas daug dėmesio sulaukęs pranešimas – vadinamojo paleidimas. Dirbtinio intelekto gamyklos iš AWS – produkto, skirto didelėms įmonėms ir viešojo administravimo įstaigoms, norinčioms savo kompiuteriuose naudoti pažangias dirbtinio intelekto sistemas. nuosavi duomenų centrai, neatsisakant integracijos su „Amazon“ debesija.
Modelis teoriškai paprastas: klientas suteikia fizinę erdvę ir energiją, o AWS rūpinasi dirbtinio intelekto sistemos diegimu, valdymu ir priežiūra, sujungdama ją su kitomis platformos paslaugomis. Tokiu būdu Europos įmonės, kurioms taikomi griežti reguliavimo reikalavimai, arba vyriausybės, susirūpinusios dėl duomenų suvereniteto, gali išlaikyti visiška neskelbtinos informacijos kontrolė neatskleidžiant jo išorinei infrastruktūrai.
Terminas „DI gamyklos“ nėra atsitiktinis. „Nvidia“ vartoja tą pačią sąvoką, kalbėdama apie savo aparatinės įrangos sistemas, optimizuotas dirbtiniam intelektui, ir šiuo atveju AWS sprendimas kuriamas būtent bendradarbiaujant su GPU gamintoju. „Amazon“ DI gamyklos sujungs... Blackwell lustai iš „Nvidia“ ir naujojo „Trainium3“, pasikliaujant AWS debesijos tinklais, saugykla ir saugumu.
Be aparatinės įrangos, šias patalpas galima integruoti su valdomomis paslaugomis, tokiomis kaip Amazonės pamatinė uoliena —sukurti ir diegti pagrindinius dirbtinio intelekto modelius— ir AWS SageMaker, skirta patentuotų modelių kūrimui ir mokymui. Įmonėms tai reiškia didelio našumo dirbtinio intelekto aplinką, tačiau diegiamą pagal hibridinę debesijos schemą, kuri geriau prisitaiko prie vietos duomenų reglamentų.
Tuo tarpu kiti dideli tiekėjai, tokie kaip „Microsoft“, taip pat juda ta pačia kryptimi, kurdami vietinius duomenų centrus ir sprendimus, skirtus duomenų suverenitetui užtikrinti. „Amazon“ įsipareigojimas savo dirbtinio intelekto gamykloms atspindi dirbtinio intelekto panaudojimo mastą. stumiančios debesijos gigantus link hibridinių modeliųnutolstant nuo grynai centralizuoto modelio, kuris buvo prieš dešimtmetį.
„Nova“ ir „Sonic“ modeliai ir AWS dirbtinio intelekto pasiūlymo postūmis
Be techninės įrangos inovacijų, „Amazon“ pasinaudojo konferencija, kad sustiprintų savo programinės įrangos pusę, pristatydama naujas dirbtinio intelekto modelių versijas, suskirstytas į prekės ženklą. NaujasĮmonė pristatė Nova 2, evoliucija, kuri žada didesnį greitį ir reagavimą, palyginti su ankstesne karta.
Vienas iš „Nova“ variantų gali bendrauti su vartotojais ne tik tekstinėmis žinutėmis, bet ir per vaizdai, balsas ir vaizdo įrašaiTai išplečia galimus naudojimo atvejus tokiuose sektoriuose kaip klientų aptarnavimas, internetinis švietimas ir turinio kūrimas. Šios multimodalinės galimybės prilygsta kitiems pirmaujantiems generatyvinio dirbtinio intelekto rinkos pasiūlymams.
Be to, AWS pristatė modelį, vadinamą Sonic, skirta balso sąveikai. Pasak „Amazon Web Services“ generalinio direktoriaus Matto Garmano, ši sistema gali reaguoti į ištartas komandas „žmogiško“ lygio balso išvestimi, atverdama duris natūralesnių pokalbių asistentų viešosioms ir privačioms paslaugoms.
Nors bendrovė pripažįsta, kad jos modeliams vis dar kyla iššūkis didinti rinkos dalį, palyginti su tokiais konkurentais kaip „ChatGPT“ („OpenAI“), Klodas (antropinis) o Dvyniai („Google“)AWS verslo rodikliai už pastarąjį ketvirtį rodo tvirtą augimą. Padalinio pardavimai išaugo apie 20 %, daugiausia dėl dirbtinio intelekto skaičiavimo ir infrastruktūros paklausos.
Europos įmonėms šis išplėstas katalogas reiškia daugiau galimybių renkantis dirbtinio intelekto platformą, tiek kalbant apie paruoštus naudoti modelius, tiek apie... infrastruktūra, kurioje galima apmokyti patentuotus sprendimus pritaikyta kiekvienam sektoriui ir vietos reglamentams.
Arši konkurencija dirbtinio intelekto lustų ir infrastruktūros lenktynėse
Visi šie leidimai atsiranda kontekste, kai intensyvi konkurencija rinkoje dirbtinio intelekto lustai„Nvidia“ išlaiko dominuojančią padėtį dėl savo GPU ir stiprios CUDA ekosistemos, tačiau tokios įmonės kaip „Amazon“, „Google“, „Microsoft“ ir net tradicinių procesorių gamintojai investuoja milijonus, kad neatsiliktų.
AWS atveju investicijos į „Trainium3“ ir būsimą „Trainium4“ yra dvigubos strategijos dalis. Viena vertus, siekiama sumažinti priklausomybę nuo išorinių tiekėjų ir geriau kontroliuoti savo infrastruktūros išlaidas bei prieinamumą. Kita vertus, ji nori pasiūlyti klientams techninės įrangos alternatyvas, kurios leistų jiems optimizuoti išlaidas neprarandant našumo ar suderinamumo su „Nvidia“ įrankiais.
Rinkos požiūriu, nuosavų lustų, bendradarbiavimo sutarčių su „Nvidia“ ir tokių produktų kaip „AI Factories“ derinys pozicionuoja „Amazon“ kaip žaidėją, galintį konkuruoti ne tik debesijos paslaugų, bet ir... pats aparatinės įrangos pagrindas kuri skatina naują dirbtinio intelekto taikymų bangą.
Ispanijos ir Europos įmonėms ir viešojo administravimo įstaigoms šis scenarijus reiškia platesnį galimų infrastruktūrų spektrą – nuo viešojo debesies iki vietinių ar hibridinių duomenų centrų – su galimybe rinktis iš skirtingų kainos, našumo ir duomenų suvereniteto konfigūracijų. Sektoriuje, kuriame technologiniai sprendimai... tiesioginis poveikis išlaidomsAtitiktis reglamentams ir inovacijų galimybės, „Trainium3“ atsiradimas, būsimos integracijos su „NVLink Fusion“ ir „AI Factory“ prideda naujų kortų, kurios, kaip numatoma, dar labiau paspartins didelio masto dirbtinio intelekto sprendimų diegimą.

