B Задание №2. Кластеризация системы расселения

Цель задания — освоение методов кластеризации и регионизации точек, построения центроидов и оценки качества кластеризации. В качестве методов кластеризации предлагается использовать DBSCAN, К средних и иерархическую. В качестве метода построения региона — альфа-оболочку.

Исходные данные: точки населенных пунктов из Самостоятельной работы №1.

Используемые библиотеки: geopandas, sklearn.cluster

Подсказка по функциям:

Кластеризация системы расселения субъекта

  1. Трансформируйте исходные данные в проекцию, оптимальную для выбранного региона.
  2. Подготовьте данные для использования в sklearn. Для это необходимо координаты точек выгрузить в numpy array.
  3. Используя метод DBSCAN, постройте серию из 5 кластеризаций населенных пунктов выбранного вами субъекта. Количество точек в кластере оставьте постоянным (3), но меняйте значение расстояния кластеризации. Расстояния подберите таким образом, чтобы различия в кластеризации были очевидны и помогали выявлять пространственные группировки разного масштаба.
  4. Используя методы К-средних и иерархической кластеризации (расстояние Уорда), постройте аналогичные серии из 5 кластеризаций. Количество кластеров задавайте то же, что вы получали в методе DBSCAN для соответствующих расстояний. Т.е. если вы в методе DBSCAN для разных расстояний получили 100, 70, 40, 20 и 5 кластеров, то именно столько же надо получить другими методами.
  5. Для всех полученных кластеризаций постройте альфа-оболочки кластеров.
  6. Рассчитайте для каждой кластеризации меру качества — коэффициент силуэта. Сведите ее в единую таблицу, где по столбцам идут методы кластеризации, а по строкам — количество кластеров.
  7. Для каждого уровня кластеризации и каждого метода подготовьте изображение, включающее: а) исходные точки, б) регионы кластеров, в) центроиды кластеров. Точки и регионы должны быть помечены разными цветами по номерам кластеров. Центроиды должны быть показаны окружностями радиуса, пропорционального количеству входящих точек.
Пример изображения кластеров:
Пример оформления результатов работы

Рис. B.1: Пример оформления результатов работы

Перед вставкой данных карт в отчет добавьте на них элементы географической основы или используйте карту-подложку из картографического веб-сервиса.

Отчет

Напишите отчет о проделанной работе, включающий:

  1. Цель и задачи работы.
  2. Описание используемых алгоритмов кластеризации и регионизации.
  3. Описание процесса создания скриптов для решения поставленных задач.
  4. Серию из 15 карт кластерной структуры системы расселения региона, полученную по результатам кластеризации тремя алгоритмами (по 5 изображений на каждый метод).
  5. Анализ качества кластеризации (согласно коэффцициенту силуэта).
  6. Географический анализ результатов. Насколько реалистично выглядят кластеры, полученные разными методами к чему они привязаны? Можно ли выявить полимасштабность организации системы расселения на основе полученных изображений?