Вступ
Термін машинне навчання зараз можна почути буквально на кожному кроці. Поняття Machine Learning (ML) міцно зайняло своє місце як у трендах новин, так і на ринку праці у сфері автоматизації. Звідусіль долинають історії успішного впровадження “Штучного Інтелекту” в процеси компаній, а професія data scientist отримує звання “The Sexiest Job of the 21st Century”.
Проте, незважаючи на величезну популярність, ML залишається досить складною для розуміння темою через свою всеосяжність, новизну та високі темпи розвитку (що породжує купу міфів), і залишає безліч питань без відповіді для людей, які намагаються розібратися в цій темі.
Основна мета цієї серії статей – доступною мовою розповісти про те, що таке ML, де і як воно застосовується, які завдання вирішує, та розвіяти кілька міфів, пов’язаних із цим поняттям, але найголовніше – познайомити Вас з базовими поняттями та концепціями, необхідними для реалізації власного ML проекту. У цій статті ми розглянемо, що таке Машинне навчання, дамо основні визначення Machine Learning, дізнаємось з яких етапів складається реалізація ML проекту, та які завдання можна вирішувати за допомогою Machine Learning.
Ми розпочнемо з базових понять і поступово будемо заглиблюватися в сутність теми, але спочатку – розглянемо простий приклад.
Припустимо, що ми маємо агенцію, яка перепродає автомобілі, та існує потреба в інструменті, який дозволив би на основі доступної інформації про автомобіль передбачити його вартість на вторинному ринку (за скільки його можна буде перепродати). Компанії потрібно аналізувати велику кількість оголошень з різних сайтів оголошень, та першою реагувати на вигідні пропозиції (менше ніж за секунду після того, як вони з’являться). Але щодня з’являється безліч оголошень на різних ресурсах, і відстежити їх вручну практично неможливо.
Для задоволення цієї потреби ми плануємо розробити програмного помічника, який за нас перебирав би оголошення і знаходив релевантні. Він би передбачав ціни на авто на вторинному ринку, і, якщо його прогнозована ціна вища, ніж та, за яку ми можемо це авто купити, оголошення відправляється експерту на розгляд.(Читати детальніше про кейс).
Тоді для вирішення завдання нам знадобиться:
1) Чітко сформулювати завдання (побудувати алгоритм прогнозування ціни автомобіля на вторинному ринку на основі його властивостей).
2) Зібрати дані про автомобілі, що зберігаються на сайтах оголошеннь. На основі цих даних ми навчатимемо алгоритм і будуватимемо прогнози.
3) Зробити попередню обробку даних (привести дані у табличний вигляд, очистити, збагатити дані, обробити пропуски).
4) Побудувати предиктивну модель.
5) Розробити програмну інфраструктуру під цю задачу та інтегрувати в неї наш алгоритм із пункту 4.
Реалізувавши ці кроки, ми отримаємо програму, яка сама збирає оголошення про продаж автомобілів з сайтів оголошень, аналізує їх та передає експерту лише ті, що з великою ймовірністю є фінансово вигідними.
Як бачимо, ML – це не чарівна паличка, яка сама по собі вирішує будь-яке завдання, а комплексний інструмент, який потрібно правильно інтегрувати, а ефективному результату завжди передує процес дослідження та розробки власне ML алгоритмів.
Наш приклад демонструє, як можна використовувати Машинне навчання (ML) для автоматизації бізнес-процесів, а також, що важливіше, ознайомлює нас з основними пунктами (1-5) розробки ML проекту. Слід враховувати, що реалізація ML проекту – це комплексне і досить складне завдання. Щоб отримати більше уявлення про те, що таке Машинне Навчання, – пропоную ознайомитись з наступною статтею “Що таке AI, ML та Data Science?“
А поки що, можете ознайомитися з ML кейсами, реалізованими нашою командою: https://am-bits.com/solutions/analytics-projects