Data Scientist деген қандай маман және түйіндемесінде қандай ақпараттар болуы керек?

Жарияланды
Data Scientist немен айналысады / shutterstock

 Көлемді деректерді ғылыми әдіске салып, қолданатын маман Data Scientist деп аталады. Ол математикалық модельдерді құрап, сынақтан өткізеді. Осылайша сол деректерден әлдебір заңдылықтарды тауып, болашақта болуы мүмкін мәндерге болжам жасайды. Көбіне бұл мамандықты бұрын-соңды IT-де істеп көрмеген, басқа саладан келгендер таңдайды. Сондықтан түйіндеме, портфолио дайындаған кезде ескеретін біраз дүние бар. Соларға шолу жасайық.

Түсініктірек болуы үшін мысал келтірейік. Сізде былтырдан бері тауарларға сұраныс қандай болғанын көрсететін көлемді дерек бар. Енді керегі — соған қарай отырып, келесі жылғы сұранысқа болжам жасау. Сол болжамды жасау үшін дата-сайентистер керек болады. Үйретілген машина алгоритмдері көмегімен модельдер құрастырылады да, SQL арқылы деректер базасымен жұмыс істейді. Қай жерде data болса, сол жерде дата-сайентист мамандар жүреді. Қазір бұл мамандық тіпті сұраныста. Өйткені ірі бизнеске де, стартаптарға да, ғылыми мекемелерге де аса қажет. Анализ жасау тәсілі әмбебап болғандықтан, барлық салаға енгізе беруге болады. Мейлі ол химия болсын, мейлі сауда-саттық болсын.

Ғылымда ашылған маңызды жаңалықтардың дені осы датаның арқасында. Өйткені соның көмегімен маңызды зерттеулер жасалады. Нейрон желілерін үйретіп, жасап шығарады. Олардың бір мысалы ретінде ДНҚ анализін, гамма-сәулелерін зерттеуді атап өтсе болады. Енді осы көлемді деректермен жұмыс істеп, өңдейтін Data Scientist маман кез келген бөлімге қажет. Маркетиң саласын алсақ, адалдық карталарының деректеріне анализ жасай отырып, кімге қандай жарнама жіберу керегін түсінуге болады. Ал логистикада GPS-трекерлердегі ақпаратты ала отырып, тасымалға ең ұтымды жол құрастыруға көмектеседі. HR-бөлімі қызметкерлердің жұмыста күнін қалай өткізетініне қарап, алдағы уақытта кімнің жұмыстан шығып кетуі мүмкін екеніне болжам жасай алады. Саудада маусымыа қарай қай тауарға сұраныс көп, қайсысына аз болатынын білуге жол ашады. Технологияның дамығаны сонша, мәтіндерді оптикалық тану арқылы құжаттарда не жазылғанын көрсетеді. Мұны заңгерлер жиі қолданады. Өндіріс саласында датчиктердегі ақпараттарды негізге ала отырып, құрылғылардың ішінде ескіргені болса, уақытылы ауыстырып отыруға мүмкіндік береді. Стартаптарда өнімді жаңа деңгейге шығаруға көмектесетін жаңа технологиялар жасауға болады. Мәселен көпшілікке ұнайтын TikTok желісінде машинаны үйрету технологиясы қолданылады. Байқасаңыз, сіз жиі көретін не ұнатқан контентті келесіде көбірек көрсетеді. Ал MSQRD — түрді танитын технологиялар мен жасанды интеллектіні пайдаланады.   

 Олай болса, Data Scientist мамандығы бойынша жұмысқа кіргісі келгендер түйіндемесін қалай сәндегені дұрыс? Нені көрсету керек? Ал керісінше, не нәрсені айтпаған абзал? Мысалы сіз «Junior деңгейдегі дата-сайентист керек» деген вакансияны көрдіңіз. Ондағы талаптар шамамен мынадай болады:             

  • Компания қай елдерде жұмыс істейтін болса, сол елдің бәріне арналған скориң карта жасай алуы керек. Яғни скориң модель құрастырып көрген болса, тіпті жақсы. Әрі көлемді деректермен жұмыс істеген тәжірибесі болса, құпталады;
  • Модельдер кітапханасын жасап, оған күнделікті мониториң жасап, жаңартып отыруы қажет;
  • Болжам жасауға, резервтерді есептеуге, портфельге анализ істеуге қолданатын скорды қайта есептеу функциясын жасап, жұмыс істей алуы керек;
  • Модельдердің сапасын одан бетер жақсартып отыру үшін жаңа дереккөздерге үнемі шолу жасап, анализдеп отыруға тиіс;
  • Басқа елдерде белгілі бір модельді қолдануға бола ма, жоқ па деп тексеру үшін бір елде жылдам анализ жасай алуға тиіс;
  • Заманауи құралдармен жақсы таныс болып, жұмыс істей білуі керек. Соның ішінде модельдеуге арналған R, Phyton секілді құралдарды білгені абзал;
  • Құжатталған фреймуорктерді жасай білу маңызды.
  • Анализ жасау қабілеті жоғары деңгейде болғаны жақсы. Сонымен бірге заңдылықтарды табуға, жан-жақы анализдеуге, гипотезаларды тексеріп көруге құштар адам болғаны жөн. 

Стандарт талаптар әдетте осындай болады. Әрине, әр компания осы талаптар тізімінен кейбір жерін алып тастауы не жаңа талаптар қосуы мүмкін. Ол енді спецификасына, бағытына байланысты. Ал Data Scientist маманға нендей мүмкіндік ұсынады? Соған да тоқталып өтейік. Көп жағдайда сипаттамасы мынадай болады:

  • Нарықтағы беделді компанияның командасында жұмыс істеп көресіз;
  • Өзіңізді дамытуға, ашыла түсуге мол мүмкіндік бар;
  • Жалақысы жақсы, уақытылы төленіп тұрады. Барлық тиісті төлемдер жасалады;
  • Жұмыс ұсынып отырған елдің Еңбек кодексіне сәйкес, барлығы заң аясында рәсімделеді;
  • Қызметкерлерге түрлі бонус қарастырылған. Оның ішінде фитнес залға абонемент, психолог кеңесі, медициналық сақтандыру, жайлы кеңсе, тіл курстары және т.б.

Бізден сізге 8 кеңес

  1. Түйіндеме дайындаған кезде өмірбаяныңызды бастан-аяқ жазуға құмар болмаңыз. «Неғұрлым көп ақпарат берсем, соғұрлым жақсы маман көрінемін» деген ойыңыз қате. Кейбірі бір бетке ғана сыйғызуға болатын дүниені көлдей қылып бірнеше бетке толтырып жатады. Рекрутерлер сіздің түйіндемеңізді әрі кетсе бірнеше секунд ішінде шолып шығады. 6-7 беттік «өмірбаяныңызды» қарап отыруға уақыты жоқ. Әсіресе, IT-саласында нақты әрі анық безендірілген түйіндемелер өтімді. Еңбек жолын 10 жылдан астам уақыт бұрын бастағандар әдетте бірнеше жұмыс орнын ауыстырған болса, сол жерге қашан кірді, қашан шықты — бәрін тізіп жатады. Мұның барлығы — бос ақпарат. Одан ешкімге келіп-кетер пайда жоқ. Қандай вакансияға тапсырып тұрсаңыз, соған сай бэкграунд көрсеткеніңіз дұрыс. Жалпы карьераңыз туралы бір топтастырып, қысқа-нұсқа көрсете кетсеңіз де жетіп жатыр. 
  2. Дайын шаблондарға үйір болмаған дұрыс. Әрине, барлығымыз белгілі бір стандарт бойынша жасап дағдыланғанбыз. Тіпті жұмыс орындарын жариялап тұратын хабарландыру сайттарындағы сұралатын дүниелерді көрсеткен дұрыс деп ойлауымыз мүмкін. Мысалы жасыңыз, қанша жалақы алғыңыз келетіні туралы ақпарат көрсету маңызды деп жүрсеңіз, бұл түсінік те қате. Неге олай дейміз? Өйткені қазір көбіне алғашқы іріктеуді адамдар емес, роботтар жасайды. Әсіресе, үлкен компанияларда жиі кездеседі. Ал боттарда үйретілген арнайы фильтр болады. Мұның бір жаманы сол — ботқа сіздің қандай мықты маман екеніңіз бәрібір. Ол өзіндегі сүзгіге сәйкес келмесе, тізімнен сызып тастай салады. Осылайша жасы сәл ғана асып тұрған кәсіби маман — тым жақсы вакансиядан, ал компания мықты қызметкерден қағылып қалуы мүмкін. Болмаса, жұмыс беруші ботқа жалақы деңгейі 500-600 мың теңге деп көрсеткен болып, ал қызметкер түйіндемеде 650 мың теңгеге келісетінін жазса, онда тағы да сұхбаттасу деңгейіне жетпей сызылып қалады. Ал шын мәнінде мұндай ақпараттарды бетпе-бет кездескен кезде талқылап, бір ортақ шешімге келуге болады. Бәлкім, компания сіз айтқан жалақыға келісіп қалар. Болмаса, олардың ұсынысын сіз қабылдап қаларсыз дегендей. Демек, түйіндеме дайындаған кезде сіздегі мақсат — көзбе-көз кездесуге дейін жету. Рекрутермен жолыққан кезде ол сіздің тәжірибеңізді, софт скилзді, қызметкер ретінде қаншалықты құнды екеніңізді бағалай алады. Сондықтан түйіндеме жасайтын конструкторларды пайдаланған кезде осыны да ескерген абзал.
  3. Data Science мамандығына басқа Саладан ауысып келетіндер көп екенін айттық. Демек, әңгіменің басын «мен бұған дейін Data Science саласында жұмыс істеп көрмегем. Бэкграундым мүлдем басқа» деп бастаудан аулақ болыңыз. Әрине, ешкім сізге өтірік айт деп тұрған жоқ. Бар болғаны ақпаратты дұрыс жеткізуіңіз керек. Иә, тікелей дата-сайентист болмаған шығарсыз. Бірақ алдыңғы жұмысыңызда деректермен көп жұмыс істеген боларсыз. Деректер базасын арагідік қолданған да болуыңыз мүмкін. Сол себепті алдымен жақсылап ойланып, атқарған функцияларыңызды електен өткізіп алыңыз. Содан соң топтастырып, оны Data Science «тіліне» аударып ұсыныңыз. Python, SQL немесе Machine Learning білмесеңіз де, деректерді өңдеуге, оларға анализ жасауға, оңтайландыруға ебіңіз болуы ғажап емес.  
  4. Кейс, портфолио маңызды екені белгілі. Әрине, енді бастаған маманда ауыз толтырып айтатындай тәжірибе, жоба болмауы мүмкін. Джуниор позициясына адам іздеп жатқан болса, рекрутер мұны жақсы біледі. Десе де, солай екен деп портфолиосыз жетіп барған жөн болмас. Бұл орынға таласып жатқан адам көп болуы әбден мүмкін. Сіздің мақсат — өзгелерден ерекшелену, оқ бойы озық тұру. Тағылымдамадан өтсеңіз, қызық жобаларға ат салыссаңыз, хакатондарға қатыссаңыз, өзіңіз жасаған pet-жобалар болса, оны міндетті түрде қосу керек. Тіпті вакансияға тапсырмас бұрын осындай тәжірибе жинақтап көрген де артық болмайды.  
  5. GitHub-тағы репозиторилеріңізге коммит жасап тұруды ұмытпаңыз. Егер адам өзіңіз GitHub кодын жиі өзгертіп тұратын болса, демек, ол жұмысын жақсы көретін, тиянақты, соңына дейін апаратын маман деген сөз. Мұны жұмыс беруші бағалайтыны сөзсіз. Сол себепті жеке жоба жасап қана қоймай, оны дамытып, жақсартып отыру қажет. 
  6. Хард скилдерді дұрыс сипаттай біліңіз. Қай тілді білетініңізді көрсеткен жеткіліксіз болуы мүмкін. Мысалы бағдарламалау туралы айтқанда нақты кітапханаларды көрсетіп, математикаға қатысты болса саланы нақтылап (сызықтық алгебра, ықтимал теориясы, статистика, интегралдар және т.б.), машинаны үйрету болса, қандай алгоритмдермен жұмыс істей аласыз — соларды айтыңыз. Бұл өзіңізге назар аудартуға көмектеседі.
  7. Барлық түйіндемеде жүретін софт скилдерді тізіп жаза бермеңіз. Шынайы болыңыз. Өзгерістерге икемді, тез бейімделіп кететін, уақытын дұрыс басқара алатын мамандар қазір қатты бағаланады. Мысалы дата-сайентиске керек скилз шамамен мынадай: күйбең тіршілікпен айналыса алса, нақты бизнес-тапсырмаларға жылдам кірісіп кете алса, өз саласындағы трендтерден хабардар болып отырса, гипотезаларды жасап, тексере алса, ойын тапсырыс берушіге, тыңдаушыға дұрыс жеткізе алса, керемет.  
  8. Білім алуға құштар адам кімге болсын ұнайды. Сондықтан оқыған курстың бәрін қосыңыз. Оның ішінде университет қана емес, шеберлік сағаттары, онлайн-курстар, трениңдер — бәрі бар. Бастысы, кәсіби маман ретінде сізді жақсы көрсететін болса болғаны. Әрине, бәрін тізу керек дегенге айдаладағы, датаға қатысы жоқ мастер-классты қоспайсыз. Дегенмен IT-ге қатысы бар, кейінгі 2-3 жылдықта қатысқан іс-шараларды көрсеткен артық болмайды.  
Сондай-ақ оқыңыз