PhD., Data Science Competency Manager у ELEKS, Тарас Фірман
Висновки вебінару

Тарас Фірман: «Інженерію вивчити легше, ніж набути теоретичних знать в моделюванні»

PhD., Data Science Competency Manager у ELEKS, Тарас Фірман поділився власною історією та підходами, розказав про тренди та порадив, з чого розпочати шлях дата-саєнтиста – на Data Talks #6: Introduction to Data Science (повне відео події).

Тарас Фірман – особиста історія в Data Science

Рішення прийти в Data Science було швидке і логічне, оскільки Тарас здобув освіту як математик в Львівському університеті імені Івана Франка.

 

Коли закінчував механіко-математичний факультет і пішов вчитися в аспірантурі, побачив, що хоче займатися прикладною математикою – такою, де щось можна попробувати, поміряти, змоделювати.

 

Паралельно з навчанням в аспірантурі працював як Computer Vision Engineer. Займався задачами машинного зору у мілітарі-компанії. Коли в Україні розпочалися події, взяв участь у двох мілітарі-проєктах. Після цього побачив, що досить цікаво займатися прикладною математикою, що є широке застосування в різних галузях.

 

Почав працювати автоматичним аналітиком. Посада називалася Math Analyst, але фактично це і був Data Scientist.

 

Вважає, що «Data Science» – сьогодні є більше buzz word (модне слово – ред.), оскільки і раніше працювали дуже багато інженерів, яких теж можна назвати «дата-саєнтистами». З даними працюють практично всі.

 

Згодом у структурі компанії ELEKS від офісу бізнес-аналізу відділився Data Science, у тому сенсі, як ми розуміємо науку про дані та пов’язані з нею функції зараз. Проте і тут Тарас Фірман не дуже любить називати це «Data Science», і віддає перевагу слову «моделювання». Говорить, що займається автоматичним моделюванням. Переглянути професійний профіль Тараса Фірмана.

Які задачі доводиться вирішувати?

Оскільки компанія ELEKS є аутсорсинговою, то і проєкти дуже різні. Це, відповідно, потребує досить широкої експертизи з різних напрямків як бізнес-індустрії, так і індустрії моделювання. Серед задач: e-commerce, retail, logistics, різні задачі з перевезення, з agriculture, healthcare та ін. Моделювання також охоплює весь спектр задач: починаючи від статистичних моделей прогнозування, задачі машинного бачення (computer vision), задачі обробки природньої мови (neural language)… – весь спектр, який можна віднести до Data Science.

Чим любить займатися?

Тарасу Фірману подобаються проєкти, де є наукова частина. Зокрема, на вебінарі Спікер згадав проєкт, пов’язаний із обробкою зображень. Навіть після його завершення Тарас продовжував працювати в цьому напрямі.

 

Ще одна звичка – коли з’являється нова технологія, новий напрям, нова архітектура – Тарас одразу хоче її попробувати, перевірити валідність. Завжди має долю скептицизму до результатів, які публікуються, і не тільки в Україні. Надає перевагу тому, щоб особисто перевірити:

 

«Якщо виходить щось нове, якийсь фреймворк, з яким раніше ніхто з мого оточення не працював, то цікаво розібратися, розказати, пошарити знання з іншими. – Це R&D – дослідження чогось нового. В такому напрямку іду».

Новинки, які надихають

Квантумний комп’ютінг. Зараз, зокрема, Azure (Microsoft – ред.) запустив Azure Quantum. Компанія хоче долучити це до свого повноцінного сервісу. Так ми будемо мати платформу, на якій можна запускати як звичайні алгоритми, так і якісь симуляції.

В якому напрямі Data Science найбільший прогрес?

Зараз всі кинулися у Deep Learning. Класичний ML (machine learning) вже дуже мало розвивається. Мало з’являється якихось класичних естиматорів. Якщо Ви якісно вивчите ML (машинне навчання), то Вам його вистачить ще на довгий час. Звичайно, там є якісь рухи, але вони набагато менші, порівняно з Deep Learning. Якщо подивитися на міжнародні конференції, то останні роки на них ідуть цілі окремі стріми, до прикладу, по трансформерах та інших темах, що стосуються нового у Deep Learning.

З чого почати кар’єру у Data Science?

Вчити математику і статистику. Це база, core всього. І поруч з математикою найбільшу увагу зверніть саме на оптимізації. Більшість навчання – це ми щось оптимізуємо.

 

Тим, хто тільки збирається розпочати у Data Science (до прикладу, хто ще навчається в школі), окремі фреймворки вчити не варто. Бо за 4 роки все може змінитися. Не бійтеся качати дані, public дата-сети. Пробуйте писати моделі на будь-якій мові програмування (особисто Тарасу подобається Python). Це дасть розуміння, чому модель краще працює з якимись певними даними, з зображеннями, з текстом.

 

Обов’язково вчіть англійську. Навіть якщо Ви бог у моделюванні, то маєте вміти пояснити свої результати або запитати у стейкхолдерів, які замовляють цей продукт, що їм потрібно.

 

Дивіться курс Andrew Ng по Machine Learning. Це базовий курс по темі.

 

Andrew Ng – 44 роки, американський бізнесмен, computer scientist, інвестор та письменник. Основний фокус – machine learning (машинне навчання) та АІ (штучний інтелект). Ng є співзасновником Google Brain, піонером онлайн-освіти (cofounder Coursera та deeplearning.ai). У 2018 році Ng запустив та до цього часу очолює AI Fund – інвестиційний фонд для розвитку стартапів у напрямі штучного інтелекту.

 

Де тренуватися початківцям? – На Google Colab.

 

Google Colab – це безкоштовний сервіс на основі Jupyter Notebook. Google Colab надає все необхідне для машинного навчання (Machine Learning) прямо у браузері, дає безкоштовний доступ до досить швидких GPU та TPU. У сервіса є певні обмеження, тому використовувати його для production не вийде.

 

Як влаштуватися у компанію ELEKS молодшим дата-саєнтистом? У чому суть проєктів: ELEKS Data Science Platform та ELEKS Doctor?… та відповіді на інші питання – дивіться відео-запис вебінару на каналі SQL.ua Data Academy у YouTube: Data Talks #6.

Щиро дякуємо Тарасу Фірману за час та досвід!

SQL.ua Data Academy

Advanced Data Teaching and Learning! 💎