Задание: Участие в Kaggle-соревновании "Getting Started"

Цель

Применить полученные знания на практике, участвуя в одном из начальных соревнований Kaggle. Это позволит вам получить опыт работы с реальными данными и познакомиться с платформой Kaggle.

Выбор соревнования

Выберите одно из соревнований из категории "Getting Started":

Требования

  1. Исследовательский анализ данных — загрузите данные, проверьте на пропуски и выбросы, исследуйте распределения и корреляции

  2. Подготовка данных — обработайте пропуски, закодируйте категориальные переменные, масштабируйте признаки

  3. Обучение моделей — обучите минимум 2 разные модели (например, логистическую регрессию и Random Forest для классификации)

  4. Прогнозирование — сделайте предсказания на тестовом наборе и отправьте результаты на Kaggle

  5. Анализ результатов — сравните качество моделей, выявите важные признаки, напишите выводы

Оформление

Создайте Jupyter-ноутбук со всеми этапами работы, кодом и выводами.

Полезные ресурсы

Ссылка на репозиторий