Олена Винокурова Data Scientist / Machine Learning Engineer у GeoGuard
Висновки вебінару

Олена Винокурова: «Мають бути знання, щоб підкріпити функцію програмування»

Шлях у напрямі штучного інтелекту починався з теоретичного – університет, кандидатська, докторська. Сьогодні Олена Винокурова є Data Scientist / Machine Learning Engineer у GeoGuard (професійний профіль). Олена виступила Спікером на нашому вебінарі Data Talks #6 та поділилася досвідом, як стати дата-саєнтистом.

Data Science – початок

Олена закінчила Харківський національний університет радіоелектроніки. Коли поступала, тільки перший чи другий рік відкрилася нова спеціальність – інтелектуальні системи. Олену туди потягнуло, це було щось нове і цікаве, і ніхто там не вчився. Вирішила спробувати, поступила, а далі вже пішло «сніжним комом» – кандидатська дисертація по штучному інтелекту, потім докторська (теж АІ), і це все було пов’язане із Data Science, обробкою даних, нейронними мережами.

 

Потім настав час, коли захотілося практичних задач, яких в університеті дуже мало. І Олену потягнуло в ІТ. Спочатку були маленькі проєкти.

Проєкти Олени Винокурової сьогодні

Останні 7 років практичний дата-саєнс ввійшов вже глобально в життя Олени.

 

Зараз Спікерка виконує проєкти, пов’язані з розкриттям шахрайства на основі геолокації юзерів (захист цифрового контенту, випадки підміни, спуфінгу геолокації, тощо). Технологія використовується для вирішення задач банків, платіжних систем, деяких ігрових сервісів, які зараз увійшли в наше життя.

 

Сьогодні є два проєкти, де компанія GeoGuard впроваджує для вирішення цих задач machine learning на базі різних алгоритмів. Олені подобається будувати алгоритми і виявляти цікаві взаємозв’язки в даних.

Що буде найскладнішим у проєктах дата-саєнс?

Сьогодні наявних методів для обробки даних цілком вистачає. А от левова частина часу іде на те, щоб з баз витягнути дані і зробити фічі. Коли місяці три ти формуєш дата-сет, потім ще 100 разів переробляєш його, … а потім застосовуєш персептрон, і все дуже супер виходить.

Де Artificial Intelligence міг би застосовуватися більше?

Можливо, в медичній сфері штучний інтелект міг би допомогти у винаході топових ліків або інших завданнях. Медицина в нашій країні сьогодні застрягла на статистиці.

Що вчити джуніорам Data Science?

Олена Винокурова багато років викладає для студентів дисципліни, пов’язані з дата-саєнс. На додаток до того, що відзначили на вебінарі колеги (відео тут), Спікерка підкреслила важливість тестування.

 

До прикладу, на ресурсі Kaggle (kaggle.com) є різні дата-сети, і можна спробувати той чи інший інструмент Machine Learning відразу на даних.

 

Найчастіше буває, що студенти знають якісь параметри та функції, а от що під капотом конкретної функції (яка математика є всередині) – не уявляють. У Вас мають бути знання, які би підкріпляли ту чи іншу функцію програмування.

Щиро дякуємо Олені Винокуровій за час та досвід!​

SQL.ua Data Academy

Advanced Data Teaching and Learning! 💎