Андрій Босий Founder та CEO у MindCraft.ai SQLua Data Acedemy Speaker
Success Story Висновки вебінару

Андрій Босий: «Потрібно просунути людство на дюйм вперед»

Andy Bosyi, Founder та CEO у MindCraft.ai – про власну історію в аналітиці даних, про улюблений пет-проєкт, про менторство, навчання, філософію розвитку… – Тези Андрія з Data Talks #4. «Artificial Intelligence and Machine Learning». Дивіться відеозапис: YouTube – SQL ua.

Коли і як Андрій Босий потрапив в ІТ:

  • Сьогодні Андрій є засновником та Tech Lead компанії, яка поставила собі за мету займатися виключно питаннями аналітики даних.
  • Шлях у галузі штучного інтелекту та аналітиці почав в дитинстві, коли читав книжки про математику, які давав батько. Разом робили цікаві експерименти, і геометричні, і математичні, вирішували задачі.
  • Потім з’явився калькулятор, програмування на калькуляторі, великі ЕО машини, де можна було писати ігри, маленькі програми та курсові, що «було важливо для лінивих заочників», і на чому можна було непогано заробити в той час.
  • Коли Андрій закінчував школу і почав писати віруси, з’явилися складніші комерційні проєкти в галузі ІТ.
  • Artificial Intelligence, думки про те, що можна змоделювати думку, зробити хоч якусь когнітивну систему – завжди займали Андрія. Приблизно років в 16 Андрій відчув, що це є його місія.
  • І відтоді у всіх software проєктах, у яких брав участь і як девелопер, і як РМ, техлід, R&D і навіть як sales – намагався обрати для себе ті, які стосувалися аналітики даних. «Crazy проєкти», які були неможливі.
  • 10 років тому практичніше познайомився із технологіями AІ та ML.
  • 5 років тому вирішив змінити діяльність – перейти від галузі розробки ПО до аналітики даних.

Проєкт, у якому «все, що можна, було зроблено неправильно»:

В ролі архітектора або виконавця бачив сотні проєктів. Для розповіді на Data Talks обрав такий проєкт, щоб людям було цікаво. Проєкт, який не вдався, і де все, що можна було зробити неправильно, було зроблено неправильно:

 

10 років тому був потенційний клієнт, який захотів робити досить багато Google-аналітики, і робити це, використовуючи Google Analytics Engine. Але для цього треба було мати дуже багато людей… І клієнт вирішив зробити пет-проєкт. І я вирішив за нього взятися. І вирішили ми зламати капчу, спосіб введення в гуглі цих хитрих буквочок.

 

Помилка №1 була в тому, що ми взагалі вирішили цим зайнятися. Помилка №2 – ми не розуміли, як це робити, у нас був просто ентузіазм. Засновуючись на інтуїції, вирішили придумати ML-фреймворк. Стало зрозуміло, що треба якимось чином створити якийсь фреймворк, який дозволить зробити оптимізацію, застосувати машинне навчання. Щоб цим займатися, треба мати хоч якийсь алгоритм, який буде вирішувати задачу.

 

Ми робили координатний спуск. Це є стохастичний підхід, коли ви пробуєте оптимізувати якийсь один параметр, і якщо добре йде, то можете оптимізувати його далі. Це робилося хорошим програмістом… В результаті, ми створили симплекс метод, створили фреймворк, який дозволяв застосовувати цей метод для будь-яких даних. Створили пайплайн… Створивши це все, ми зрозуміли, що здолаємо задачу капчі, але на кожну букву довелося потратити 15 хвилин.

 

Із позитивного про проєкт. – В результаті, коли я почав вивчати тему далі, мені було дуже приємно, що довелося вивчати лише нові назви, бо все це ми вже проробили на практиці самі.

«Ідеальний проєкт». Який пет-проєкт Андрій Босий робить з 2002 року?

Мій лозунг – потрібно просунути людство на дюйм вперед.

 

Те, що ти професійно вмієш і вмієш, як хобі – може разом скласти дуже цікаві комбінації, коли ти можеш зробити досить цікаву річ. При цьому зламається правило, що серйозні речі робляться тільки спільним зусиллям. Можна зробити і одному. А двоє-троє ще допоможуть. Рухаючись у цьому напрямі, я маю пет-проєкт, який роблю з 2002 року.

 

Я пробую зробити акомпаніатор музичних інструментів. Уявіть собі, що є система, яка по тому, як Ви співаєте або граєте на музичному інструменті, може спрогнозувати те, що Ви будете грати через одну секунду. Вона може забезпечити, що навіть на відстані, незважаючи на затримку в часі, те, що Ви будете співати, почують синхронно.

 

Коли я почав працювати зі своїм пет-проєктом, то спробував перевинайти розклад Фур’є (з математики, Ряд Фур’є – спосіб представлення довільної складної функції сумою простіших, – ред.), тому що він не влаштував абсолютно.

 

Коли Ви чуєте звук, як певну ноту, який має певний домінуючий тон, то він може бути закодований двома тонами, які йдуть паралельно. Наприклад, людське вухо чує ноту Сі, а насправді Вам Фур’є «розкаже» про дві інші ноти. Разом вони будуть накладатися так, що складуть те, що потім почується Вам. Тобто наш мозок дуже часто домислює те, чого він не чує, і чого насправді не існує. Так само, наше око домальовує те, чого насправді не існує. Є такі експерименти.

 

Я пробував створити більш правильний спосіб вилучення елементарних частинок звуку, земулювавши людське вухо (емуляція, emulation – відтворення програмними засобами інших пристроїв, в даному випадку – людського вуха, ред.). Створивши ряд звукових маятників, які будуть розгойдуватися, коли вони чують звук. І певні маятники будуть входити в резонанс. Так дуже примітивно емулюється людське вухо з його молоточками… І воно в деяких випадках дало мені кращий результат, ніж розклад Фур’є. Сам не знаю, чому, але експериментально це було так.

Чи зможе штучний інтелект створювати музику на рівні людини?

Будь-яку річ (музикальний твір – ред.) потрібно слухати багато разів. Кожна річ відкривається шар за шаром. Це стосується будь-якого твору людини. Тому що гарний твір мистецтва людини відкривається шарами. Ви спочатку чуєте один шар, потім другий…

 

В мене є таке переконання, що штучний інтелект не здатен створити такого багатошарового глибокого контенту. Напевно, він зможе усереднити і дати щось гарне, що легко сподобається швидко, але щоб воно було глибоке, щоб я захотів це послухати завтра і післязавтра… – я сумніваюся.

 

Це (музика, що створюється штучним інтелектом, – ред.) посередність. Likelihood. Звичайно, є системи генеративні, які можуть створити щось нове. Але щоб з’явилася творчість, спочатку потрібно, щоб був хаос.

Про освіту:

Андрія три рази виганяли з університету. Вчився сумарно 12 років і закінчив заочно. За словами Спікера, йому було не цікаво, скучно. На той момент Андрій вже працював, мав сім’ю. І було зовсім не цікаво слухати викладачів, які конкретно в тій темі знали менше, ніж Андрій. Зараз вважає, що базову освіту необхідно мати.

 

«Настав час, коли треба вчитися заново. Основний здобуток зараз – вміння вчитися постійно. Завести себе в режим постійних змін. Це, власне, як ми обираємо людей у компанію. Ми їх дуже довго перевіряємо.

 

Це як катер з пробитим дном. В нього спереду здоровенна діра, і якщо він не рухається, то тоне. Він мусить постійно летіти вперед, до фінішу.

 

Стосовно класичної освіти. Вона у нас, здається, ще від Пруссії. Це така кліпова освіта, коли нам дають фрагменти, та ми навіть не можемо зв’язати їх докупи. Все це треба трансформувати.

 

Вчитися потрібно на всьому, що можна – книжках, сайтах, Coursera, Andrew Ng, кому що ближче. Але головне – просто завести себе в режим. Дорога з’явиться перед тим, хто буде по ній йти, сама».

Про Менторство:

Ментор – це не обов’язково той, хто дає знання. Часто це той, хто мотивує і є прикладом. Можна не знати все до кінця, щоб це викласти, але можна заразити людей бажанням прожовувати далі самим. 

Які задачі дають на співбесіді для Data Scientist або ML Engineer:

Це точно практична задача, чітко детермінована. Але зробити потрібно буде від початку до кінця – пройти стадії: бізнес-аналізу, побудови, імплементації, тестування, евалюації, викладення результатів, аналіз даних… – показати це як скомпонований документ, вміти його виразити та представити.

Про книги:

Читайте книги. Якщо Ви прочитаєте першу книгу, вона дасть Вам шлях, яку читати другу. І так буде вічно.

Щиро дякуємо Андрію за час та досвід!

Приєднуйтеся! 🔥

 

#SQLua_DataAcademy

Advanced Data Teaching and Learning! 💎