Анотація. Машина опорних векторів (SVM) є потужним методом класифікації даних. Незважаючи на хороші теоретичні основи та високу точність класифікації, звичайна SVM не підходить для класифікації великих наборів даних, оскільки складність навчання SVM сильно залежить від розміру набору даних.
1) SVM не підходять для великі набори даних Відомо, що оригінальна реалізація SVM має конкретну теоретичну основу, але вона не підходить для класифікації у великих наборах даних з однієї простої причини — складність навчання алгоритму сильно залежить від розміру набору даних.
Недоліки SVM Тривалий час навчання для великих наборів даних. Важко зрозуміти та інтерпретувати остаточну модель, змінні ваги та індивідуальний вплив. Оскільки остаточну модель не так легко побачити, ми не можемо робити невеликі калібрування моделі, тому її важко включити в нашу бізнес-логіку.
Після того, як навчальні дані розділені запропонованим методом кластеризації, центри кластерів використовуються вперше за класифікацією SVM. Потім ми використовуємо кластери, центри яких є опорними векторами, або ті кластери, які мають різні класи, для виконання другої класифікації SVM.
На відміну від інших алгоритмів машинного навчання, які можуть мати проблеми з великою кількістю функцій, SVM здатні ефективно працювати з великомірними даними. Це пов’язано з концепцією опорних векторів, які є точками даних, що лежать найближче до границі прийняття рішень або гіперплощини максимального запасу.
Машина опорних векторів (SVM) є потужним методом класифікації даних. Незважаючи на хороші теоретичні основи та високу точність класифікації, звичайна SVM не підходить для класифікації великих наборів даних, оскільки складність навчання SVM сильно залежить від розміру набору даних.