ЖИ жарысы – бәрі енді ғана басталып жатыр

Apple компаниясының дәстүрлі WWDC конференциясында көптен күткен, «ақылды» Siri-ді таныстырды. Бұл бағдарламаны негізі 2024 жылы шығару керек еді, бірақ екі жыл бойы кейінге шегеріп келді. Енді бұл ассистентті басынан бастап мүлдем жаңадан жасап шыққан: ол телефон экранында не тұрғанын түсінеді, сіздің жеке деректеріңізбен жұмыс істей алады және қолданбалардың ішінде әртүрлі бұйрықтарды орындай береді. Мысалы, құпия сөздерді сақтайтын Passwords деген қолданба сайттарды өзі аралап, сіздің ескі немесе қауіпті құпия сөздеріңізді автоматты түрде ауыстырып береді. Ал камерасы болса, алдында не тұрғанын бірден көріп, соған сай жауап қатады.

Жұрттың реакциясы да күткендей болды. «Әйтеуір» шықты-ау, «Енді өзгелерді қуып жетті» десті. Залдан біреу «Бұл жүйе өздігінен жұмыс істей беретін нағыз дербес көмекші ме?» деп тікелей сұрағанда, Apple шынын айтты: жүйе әлі де болса өз бетінше әрекет етуден гөрі, тек адамның берген сұранысын орындауға ғана бейімделген. Оның үстіне, бұл жүйенің ішкі моделдерін үйрету үшін олар Google Gemini-ді «мұғалім» ретінде пайдаланған. Ал ең мықты, ауыр функциялары Apple-дің өз телефонында емес, Google-дың бұлтында (интернеттегі базасында), NVIDIA компаниясының чиптерінде есептеледі. Сарапшылардың айтуынша, Apple бұл қызмет үшін Google-ға жылына шамамен 1 миллиард доллар төлейді екен.

Apple шынымен кешігіп қалды ма, жоқ па деген бүкіл талқылау бір ғана болжамға негізделген. Ол – жасанды интеллект саласындағы жеңістің қандай болатынын қазірдің өзінде білеміз деген болжам. Бұл мүлдем анық емес нәрсе

Нарық бағыт таңдауда сирек қателеседі, бірақ құндылықтың қайдан пайда болатынын жиі қате болжайды

Соңғы айларда жасанды интеллект жарысында кімнің жеңіп жатқанын талқылау сәнге айналды. Жеңімпаздар тізімі де болжамды көрінеді. Көпшілік модельдердің көлеміне, ассистенттердің сапасына, инвестиция көлеміне, GPU санына, деректер орталықтарына және компаниялардың нарықтық құнына қарайды. Осы көрсеткіштер бойынша Apple үнемі артта қалып қойған компаниялардың қатарында аталады. Apple-де GPT немесе Gemini деңгейіндегі өзіне тиесілі ашық ірі модель жоқ. Ең үздік деп саналатын ассистенті де жоқ. Apple Intelligence жүйесі көптеген жағдайда басқа компаниялардың модельдеріне сүйенеді. Сондықтан көпшілік бірден Apple жеңіліп жатыр деген қорытынды жасайды.

Бірақ мәселе бағалаудың бәрі өзіміз соңғы әрі шешуші деп белгілеп қойған көрсеткіштер бойынша санауда.

Технологиялар тарихы бір заңдылықты көрсетеді. Нарық көбіне жалпы бағытты дұрыс анықтайды. Қателіктер кейінірек негізгі құндылық нақты қай жерде жасалатынын және оны кім өз қолында сақтап қалатынын түсіну керек болған кезде басталады. Интернет бумы кезінде бәрі пайдаланушылар санына қарады. Бірақ ең көп табыс трафиктің үстінен инфрақұрылым құрған компанияларға бұйырды. Әлеуметтік желілер дәуірінде аудитория көлемін есептеді. Алайда сол аудиторияны қуатты жарнамалық механизмге айналдыра алғандар ұтты. Аралық көрсеткіштер әдетте маңызды болатын, бірақ негізгі құндылық адамдар ойлаған жерде емес еді. Бүгінде назар модельдерге, есептеу қуатына және GPU-ларға ауған. Енді басты сұрақ та сол күйінде қалып отыр. Бұлар шынымен құндылықтың негізгі көзі ме, әлде бұл тек ойынға кіру үшін қажет бастапқы шарттар ғана ма?

Әрине, қазіргі жарыстың бағыты дұрыс. Модельдің үлкендігі, есептеу қуаты және мықты инфрақұрылым – мұның бәрі өте маңызды. Бірақ «жай ғана маңызды фактор» болу мен «нарықта ұзақ уақыт бойы үстемдік ететін басымдыққа ие болудың» арасы жер мен көктей. Ең үлкен дата-орталығы бар компания міндетті түрде ең үздік бизнеске айналмайды. Ең алып модельді жасау жаңа экономика тудырды деген сөз емес. Тіпті ең ақылды ассистент те нарықтағы тұрақты жеңіске кепілдік бере алмайды.

Технологиялық жетістік пен одан түсетін пайда бір уақытта келмейді

Бұл жерде танымал экономист Дарон Аджемоглудың айтқандарын еске түсірген жөн. Жұрт көбіне оның сөздерін «жасанды интеллектіге сенбейді, скептик» деп тым қарабайыр түсінеді. Негізі мәселе басқада. Мәселе «ЖИ экономиканы өзгерте ме, жоқ па» дегенде емес. Мәселе «бұл өзгеріс қаншалықты тез және қандай ауқымда болады» деген сұрақта. Ал Аджемоглудың бұл тұрғыдағы болжамы нарықтағы қазіргі даңғаза әңгімелермен мүлдем жанаспайды. Өзінің «The Simple Macroeconomics of AI» атты еңбегінде таяу он жылда жасанды интеллект жалпы ішкі өнімнің (ЖІӨ) өсіміне тек 1,1 пайыз ғана үлес қосады, ал еңбек өнімділігінің өсімі жылына шамамен 0,05 пайызды ғана құрайтынын жазады. Бұл нөл емес, әрине, бірақ қазіргі таңда стартаптар инвесторлардан миллиардтаған ақша жинау үшін беріп жатқан «ғарыштық» уәделерінен өте алыс көрсеткіш. Аджемоглу алғашқы дербес ЖИ-агенттердің пайда болғанын көрсе де, бұл сандарды өзгерткен жоқ. Оның пікірінше, нарыққа қазір модельдердің қуаты жетіспей жатқан жоқ. Ең басты жетіспейтін нәрсе — жасанды интеллекті қолдануды барынша қарапайым ететін және оны кәдімгі күнделікті жұмыс құралына айналдыратын қолайлы бағдарламалар (қосымшалар). Кезінде қарапайым офистік бағдарламалар (мысалы, Word немесе Excel) пайда болып, компьютерді барлық үй мен кеңсеге қалай таратса, ЖИ-ге де дәл сондай қарапайым интерфейс керек болып тұр.

Бұл инвестор үшін жағымсыз ой. Ол технологияның мүмкіндіктеріне емес, оның қайтарымына қарауға мәжбүр етеді. Уолл-стриттегі риторика да біртіндеп өзгеріп жатыр. Жақында ғана әңгіме қарапайым болатын: есептеулер неғұрлым көп болса, соғұрлым жақсы, GPU неғұрлым көп болса, соғұрлым жақсы, инвестиция неғұрлым көп болса, соғұрлым жақсы. Ал қазір мүлдем басқа сұрақтар жиі қойылады: Өнімділік қайда? Пайданың өсімі қайда? Капиталдың қайтарымы қайда? Инфрақұрылымға салынған жүздеген миллиардтардың экономикалық тиімділігі қайда? Нарық ЖИ-ге сенуін тоқтатқан жоқ. Ол технологияға таңғалудан оның экономикасын бағалауға көшіп жатыр.

Біз әңгіме туралы тым көп айтамыз

Қазіргі уақытта индустрия негізінен жауаптардың сапасын талқылауда. Жүйенің қаншалықты жақсы жазатыны, контексті қалай сақтайтыны, қалай пайымдайтыны және диалогты қаншалықты шынайы жүргізетіні сөз болуда. Мұның бәрі маңызды, бірақ біз біртіндеп интеллектің өзін ол туралы әңгімемен шатастыра бастадық. Мысалы, чат-бот сізге хаттың жобасын жазып береді. Ал агенттің өзі қажетті хат алмасу тармағын тауып, күнтізбеден деректерді жүктейді де, хатты өзі жөнелтеді. Уақыт өте келе жүйенің қаншалықты жақсы жауап беретіні емес, оның қаншалықты жақсы әрекет ететіні басты орынға шығады.

Күрделілік ЖИ әрекет ете бастаған жерден басталады

ЖИ бір нәрсені өзі істей бастағанда, қателіктің құны өзгереді. Чат-боттың қателігі тек ашу тудырады. Ал агенттің қателігі ақшаны жоғалтуға, деректердің жылыстауына немесе бизнес-процестің бұзылуына әкеп соғады. Мәселе модельдің сапасында емес, оның сенімділігінде бола бастайды. Бұл – жүйенің белгісіздік жағдайында жаңа тәуекелдер тудырмай, әрекет ету қабілеті. Дәл осы себепті әзірге ешкімде нағыз сенімді, әмбебап агент жоқ. Google Android жүйесінің агенттік жаңартуын көрсетіп жатыр, Apple агенттік Siri-ді таныстыруда, OpenAI бұл жарысқа баяғыда-ақ қосылған. Талпыныстар көп. Бірақ сенімділіктің жоғарғы шегін әлі ешкім бағындыра алған жоқ.

Бұл жерде қазір танымалдылықтың шыңында тұрған Anthropic компаниясы айқын мысал бола алады. Claude қазірдің өзінде параллельді репозиторийлер арқылы код жазып, бір ғана пәрмен бойынша бірнеше күн бойы автономды түрде жұмыс істей алады. Бірақ іс пайдаланушының компьютеріндегі әрекеттерге келгенде, компанияның өзі бұл бөлімнің мәтінмен жұмыс істеуге қарағанда әлі шикі екенін, агенттің қателесетінін және тәуекелдердің уақыт өте келе өзгеріп отыратынын ашық жазды. Бұл жердегі шешім модельді бұдан да ақылдырақ етуде емес, оны клиент бақылайтын, оның инфрақұрылымының ішіндегі «құмсалғышқа» (оқшауланған ортаға) қамап қоюда болып отыр.

Жаңа Siri-дің архитектурасы ауырлық орталығының қайда ауысып жатқанын көрсетеді. Оның ішінде бір ғана үлкен нейрожелі емес, бес мамандандырылған модель және олардың үстінен қарайтын оркестратор бар. 3 миллиард параметрлі жеңіл модель күнделікті тұрмыстық тапсырмалар үшін құрылғының өз ішінде жұмыс істейді. 20 миллиард параметрлі модель сұранысқа қарай тек қажетті фрагменттерді ғана жүктейді. Бұлттық модельдер күрделі сценарийлер мен суреттерді генерациялау үшін сәл ауырлау нұсқасы. Ең қуатты модель: ұзақ логикалық тізбектерді құруға арналған. Бірақ бұл жерде ең бастысы модельдер емес, оркестратор. Ол – операциялық жүйенің ішіндегі сұранысты талдап, нені жергілікті түрде орындау керектігін, нені бұлтқа жіберу керектігін және қай қолданбаға жүгіну қажеттігін шешетін диспетчер. Ең күрделі және ең құнды бөлік жеке тұрған модель емес, оларды жүйедегі нақты әрекеттермен байланыстыратын қабат. Бұл қабатты Apple өз бақылауында ұстап отыр.

Басты актив сұраныстарда емес, әрекеттерде болуы мүмкін

Модельдердің көбісі адамдардың жазғанына, айтқанына және сұрағанына қарап үйренеді. Бірақ деректердің басқа түрі де бар. Ол адамдардың не істейтіні. Қандай шешім қабылдайды, нені ашып, нені жабады, нені тоқтатады, кейінге қалдырады немесе таңдайды. Бұл сөзбен білдірілген ниет емес, нақты мінез-құлық туралы деректер. Сондықтан Apple компаниясы дәл осындай деректер түрі бойынша ең ірі позициялардың біріне ие, өйткені миллиардтаған адам күн сайын оның құрылғыларының ішінде өмір сүреді. Тек алып массив Apple-де бар болғанымен, ол өз модельдерін үйрету үшін бұл деректерге қол жеткізу мүмкіндігін қалдырмаған және бұл саналы түрде жасалған қадам.

Apple өз архитектурасында пайдаланушы деректері негізінде модельдерді оқытуға заңды әрі техникалық тұрғыда тыйым салған. Ауыр сұраныстар өтетін Private Cloud Compute жүйесі stateless (күйді сақтамайтын) жүйе ретінде құрылған: деректер өңделеді де, бірден жойылады. Олар логтарға жазылмайды, болашақ модельдерді оқытуға жіберілмейді. Apple бұны тәуелсіз зерттеушілер тексере алуы үшін жүйенің бастапқы кодын ашық жариялап отырады. Тіпті ең ауыр тапсырмалар NVIDIA чиптері бар Google серверлерінде есептелген күннің өзінде, сұраныс криптографиялық тұрғыдан оқшауланған контейнерге түседі. Google-дің оған кіруге рұқсаты жоқ.Пайдаланушының мінез-құлқын оқу процесіне жинайтын бәсекелес компания миллиондаған адамның нақты әрекеттері арқылы өз моделін күшейте түседі. Apple бұл ресурстан өз еркімен бас тартты. «Ең жақсы оқытылған модель» көрсеткіші бойынша ол өз таңдауымен алдын ала жеңіліске жол беріп отыр.

Бірақ дәл осы архитектура басқа активті қалыптастырады. Сіздің хаттарыңызға, суреттеріңізге және хабарламаларыңызға кіріп, сіздің атыңыздан әрекет ететін агентке ең үлкен әрі қуатты модельдің қажеті шамалы. Оған ең алдымен деректеріңізді сыртқа шығарып жібермейтініне және оны жадында сақтап қалмайтынына деген кепілдік керек. Apple агенттің әрекеттерді орындайтын қабатының өзін толық бақылауда ұстап отыр. Ол –операциялық жүйе, чип, қолжетімділік құқықтары, «құмсалғыш» (оқшауланған орта) және қолданбалар арасындағы интерфейстер. Іс жүзінде Siri оркестраторының атқарып отырған рөлі де дәл осы. Сенімді агентке бұлтта сіз туралы бәрін білу міндетті емес, егер ол сіздің қолданбаларыңыз, файлдарыңыз бен рұқсаттарыңыз дайын тұрған жүйенің дәл ішінде жұмыс істесе, сол да жеткілікті. Жоғарыда айтылған бөлімде сенімділік индустрияның әлі шешілмеген басты мәселесі ретінде көрсетілген еді. Ал атқарушы қабатты бақылау сенімділікті жай ғана «модельдің қасиетінен» бүкіл «жүйенің қасиетіне» айналдыратын қуатты иінтірек. Бұл тұрғыда Apple-де басқа ешкімде жоқ дерлік өте тиімді позиция бар. Ендігі мәселе компания бұл артықшылықты пайдалана ала ма, әлде Siri-мен екі жылға бөгеліп қалғандай, бұл жолы да оны іс жүзіне асыруда тұрып қала ма, тек сонда ғана.

Apple-дің қалыптасқан стандартты соқпақпен жүрмегенінің өзі үлкен құрметке лайық. Құпиялылыққа қойылған шектеулерді алып тастаса, бәсекелестерін қуып жету әлдеқайда оңайырақ болар еді. Бірақ Apple бұл шектеуді алып тастаған жоқ.

Жеңімпазды мүлдем басқа көрсеткіштер анықтауы мүмкін

«Apple бұл жарыста жеңіліп жатыр» деген әңгіме тым үстірт әрі қарабайыр көрінеді. Модельдер жарысында ол, бәлкім, артта қалып жатқан шығар. Ассистенттер бәйгесінде де солай болуы мүмкін. Көздің жауын алатын тиімді демо-көрсетілімдер жарысынан да ұтылып жатқаны анық. Бірақ бұл тұжырымдардың барлығы дәл осы аталған жарыстар түпкілікті жеңімпазды анықтайды деген болжамға ғана сүйеніп тұр. Ал іс жүзінде бәрінің дәл солай болатыны әлі екіталай.

Бес немесе он жылдан кейін ең үлкен модель немесе ең әдемі интерфейс емес, ЖИ-ді миллиардтаған адамның нақты процестері мен күнделікті әрекеттеріне сенімді түрде кіріктіруқабілеті шешуші факторға айналуы мүмкін. Сұраныстар туралы деректер емес, адамның мінез-құлқы мен іс-әрекеті туралы деректер басты активке айналуы ғана ғажап емес. Ал жеңімпазды бүгінде ешкім талқыламайтын мүлдем басқа көрсеткіштер анықтауы әбден мүмкін. Қазіргі уақытта нарық жеңімпаздарды өте сенімді түрде атап үлгерді. Тек нарықтың бұл ойынның ережелерін толық түсініп отырған-отырмағаны әлі белгісіз.