Помощь. Помощь А что такое геостатистика

Пространственно-временная статистика

Возможности и преимущества ГИС-статистики

Методы и процедуры статистического анализа и моделирования широко используются в географических исследованиях в силу стохастической природы многих географических явлений, как природных, так и социально-экономических. Наряду с использованием стандартных непространственных статистических алгоритмов и процедур, в настоящее время в географии получают широкое распространение методы нового раздела математической статистики - Пространственной статистики или Геостатистики .

Какие особенности имеет и что нового дает статистическое моделирование и анализ в среде ГИС?

Одним из главных преимуществ ГИС-статистики являются богатые возможности визуализации процесса статистического моделирования на всех его этапах, начиная с отбора необходимых для анализа географических объектов, интерактивного графического представления промежуточных результатов в виде различных компьютерных диаграмм и динамически связанных "окон", и кончая сложными 3-х мерными изображениями геостатистических поверхностей и объемов. Таким образом, создается информационная среда, в которой исследователю намного легче принимать решения в процессе статистического моделирования и анализа географических явлений.

Следует отметить, что. в настоящее время существует определенный дефицит средств статистического моделирования в ГИС. Так, например, популярные коммерческие ГИС-пакеты ARC/INFO, SPANS и GENAMAP обеспечивают довольно ограниченный круг статистического анализа низшего уровня (дескриптивная статистика), включая расчет базовых статистических показателей, преобразование данных и простейшую статграфику. С другой стороны, в этих пакетах реализованы макроязыки, позволяющие пользователю разрабатывать собственные статистические модули. К сожалению, отсутствие интерфейса высокого уровня для доступа к базе данных ГИС и статистической графике делает эти языки недостаточно эффективными. Исключением является модуль статистического анализа SAM, состоящий из комплекса программ, написанных на языке С. Этот модуль функционирует в среде ARC/INFO и предполагает использование макроязыка AML.

Особого внимания заслуживает язык статистического программирования S-Plus, использование которого в ГИС значительно расширяет возможности геостатистического моделирования благодаря применению динамического "оконного" интерфейса и компьютерной графики.

Другим направлением развития ГИС-статистики является разработка интерфейса, обеспечивающего возможность более тесного соединения коммерческих ГИС-пакетов со стандартными статистическими пакетами, например MINITAB, SPSS, SAS и другими. При этом для экспорта необходимых файлов из ГИС используется, как правило, формат ASCII.

Альтернативным к перечисленным выше представляется подход, при котором в стандартные статистические пакеты добавляются функции ГИС. Например, современные версии пакета SPSS обладают способностью строить тематические карты, хотя до реализации полноценных пространственных функций ГИС дело здесь пока не дошло.

Пространственно-временная статистика в IDRISI

В качестве примера ГИС-реализации методов пространственно-временной статистики рассмотрим статистический блок пакета IDRISI. Следует отметить, что в этом популярном растровом ГИС-пакете, пожалуй, наиболее полно представлен спектр методов статистического моделирования, что, наряду с доступностью и простотой освоения, делает его в некотором смысле уникальным.

Всю совокупность методов, включенных в статистический блок IDRISI, условно можно разделить на две группы: непространственной и пространственной статистики. Основное различие между ними состоит в том, что методы и процедуры пространственной статистики учитывают в явном виде пространственные отношения объектов геоизображения (соседство и близость растровых ячеек), в то время как непространственная статистика этих отношений не рассматривает, ограничиваясь простыми группировками атрибутивных данных, привязанных к растровым ячейкам.

В группу Непространственной статистики пакета IDRISI входят следующие процедуры:

HISTO-построение гистограммы частотного распределения числовых величин ячеек геоизображения. Данная процедура включает расчет ряда статистических параметров распределения: математического ожидания и стандартного отклонения значений атрибутивного признака в пределах всего изображения. Итоговая информация может быть представлена в графической и числовой форме. В первом случае на экран выводится общий график гистограммы, а во втором - числовая (частотная) характеристика каждого класса (интервала) значений в кумулятивной, пропорциональной и кумулятивно-пропорциональной формах представления частот распределения.

EXTRACT-процедура, обеспечивающая получение суммарных статистических характеристик выбранных объектов (совокупности ячеек определенного типа) геоизображения. При этом итоговые статистические показатели могут быть представлены на экране в виде таблицы, либо сохранены в виде отдельного файла. В число рассчитываемых параметров входят: минимум, максимум, общая сумма, среднее арифметическое, стандартное отклонение и другие.

REGRESS-регрессионный анализ двух геоизображений (или двух соответствующих атрибутивных файлов). В результате процедуры на экран выводится диаграмма распределения (корреляционное поле), график линии тренда, а также таблица статистических характеристик регрессии: уравнение регрессии, коэффициент корреляции и соответствующие показатели значимости.

CROSSTAB-качественный аналог регрессионного анализа, позволяющий выявить статистическую зависимость двух геоизображений, атрибутивные признаки которых измерены в качественных шкалах (порядковой или номинальной). Главным результатом этой процедуры является таблица сопряженности, отражающая частоту встречаемости парных комбинаций различных категорий (значений качественных признаков) сравниваемых геоизображений. Одновременно рассчитываются качественные аналоги показателей статистической зависимости и соответствующие им параметры: показатели "ху-квадрат" Крамера, число степеней свободы и другие. Кроме того, CROSSTAB обеспечивает возможность создания нового результативного (комбинированного) геоизображения, категории которого представляют собой парные комбинации категорий исходных совмещенных геоизображений (как результат выполнения логической функции AND).

RANDOM-генерирование и построение случайных гипотетических геоизображений на основе статистических моделей распределения (нормального и прямолинейного) с заданными параметрами распределения (математическим ожиданием и стандартным отклонением). Данная процедура может быть использована для построения стохастической поверхности с целью оценки вероятности появления определенных событий.

Группа процедур пространственной статистики пакета IDRISI включает:

TREND-процедура, представляющая собой пространственный аналог процедуры REGRESS. С ее помощью определяется и строится трендовая регрессионная поверхность в X-Y координатах, заданных на растровом геоизображении. Возможна реализация трех видов регрессионного полинома: линейного, квадратического и кубического. Данная процедура используется в сдучае, когда необходимо выявить наличие сколько-нибудь существенного пространственного тренда в распределении значений атрибутивного признака в пределах данного геоизображения с целью интерполяции и объяснения.

AUTOCORR-расчет коэффициента пространственной автокорреляции с использованием "I" статистики Морана. При этом в автокорреляционный анализ может быть включено все геоизображение целиком, либо его отдельные части. Данная процедура позволяет выявить наличие пространственной зависимости в распределении значений атрибутивного признака растрового геоизображения.

CENTER-расчет среднего центра (взвешенного или невзвешенного) и стандартного радиуса для множества точек геоизображения. Средний центр может рассматриваться как "центр тяжести" данной группы точек, в то время как стандартный радиус является прямой аналогией стандартного отклонения для непространственных данных и используется в качестве показателя пространственной дисперсии (разброса) точек от их наиболее вероятного положения.

QUADRAT-процедура, используемая для определения характера размещения точек, т. н. "точечного образа". Последний может быть регулярным, случайным или кластеризующимся. Одним из результатов данной процедуры является расчет отношения показателя вариации к математическому ожиданию, что может служить критерием выбора одного из 3-х перечисленных вариантов. Кроме того, QUADRAT рассчитывает плотность размещения точек геоизображения.

PATTERN-процедура, расширяющая возможности предыдущей с помощью расчета различных количественных мер на основе сравнения фиксированной ячейки с соседними. В число этих мер входят показатели относительной доступности, распространенности, доминирования, фрагментации и некоторые другие. Все они оказываются полезными, например, в исследовании морфологической структуры ландшафта.

CRATIO-расчет степени компактности выделенного полигона. При этом отношение "площадь/периметр", рассчитанное для данного полигона, сравнивается с таким же отношением для круга, как наиболее компактной геометрической фигуры.

PROFILE-расчет и построение пространственных и временных профилей. В результате получается графический образ профиля, который может быть сохранен для дальнейшего анализа в виде отдельного файла.

SAMPLE-генерирование векторного файла точек в соответствии с выбранной схемой пространственного отбора: систематической, случайной или стратифицированно-случайной. Эта процедура может быть использована при решении задачи оценки точности измерений, а также в процессе пространственного отбора точек для дальнейшего исследования.

Версия 4.1 пакета IDRISI содержит модуль Пространственно-временной статистики TSA, который реализует один из методов факторного анализа - метод главных компонент, - в процессе изучения динамики изменения растровых геоизображений, рассматриваемых в качестве элементов временного ряда. В результате работы модуля TSA пользователь получает "сжатую" пространственно-временную информацию о тенденциях и аномалиях изменения геоизображения в течение определенного промежутка времени. При этом рассматриваются, как правило, длинные временные ряды (более 20 наблюдений), так как собственно "факторизация" осуществляется на множестве разновременных геоизображений. Путем расчета компонент ("факторов") разного порядка и построения соответствующих им геоизображений, .удается выявить тонкие закономерности и аномалии пространственно-временной динамики географических явлений.

ГИС-статистика - 5.0 out of 5 based on 1 vote

«Статистика 2ГИС» предназначена для широкой аудитории, но в первую очередь будет интересна тем, кому для работы необходимы объективные данные о городах. Например, журналистам, готовящим материалы об инфраструктуре города, предпринимателям, изучающим развитость конкретной отрасли экономики в регионе, студентам, готовящим исследовательскую работу и т.д. Статистика формируется на основе справочников 2ГИС, которые уточняются и обновляются специалистами компании ежемесячно, а в ряде городов – ежедневно.

Компания 2ГИС

Российская компания 2ГИС выпускает одноименные электронные справочники с картами городов. Первый выпуск 2ГИС вышел в 1999 году, сегодня продукт охватывает более 180 городов в России, а также несколько городов за рубежом (в Италии, Украине и Казахстане). Справочник 2ГИС доступен в трех версиях: для ПК, мобильных устройств с операционными системами iOS, Android, Windows Mobile, Symbian и в виде онлайн-сервиса на maps.2gis.ru. Все продукты 2ГИС бесплатны для пользователей и в каждом городе обновляются ежемесячно (онлайн-версия – ежедневно в ряде крупных городов). Аудитория пользователей ПК-версии 2ГИС составляет более 13 млн человек, мобильной версии – 2,5 млн человек, онлайн-версии – 1,5 млн уникальных посетителей ежемесячно.

Пользоваться сервисом очень просто. Нужно лишь указать интересующие сферы деятельности и города. В результате можно будет увидеть сравнение этих городов по общему количеству организаций (с учетом филиалов) в указанной сфере, а также по их числу в пересчете на 100 тыс. жителей – так проще сравнивать города разных масштабов. Всего «Статистика 2ГИС» содержит данные более чем о 80 сферах деятельности в 70 городах России (многие крупные города учтены со спутниками). В ближайшей перспективе на stat.2gis.ru появится возможность проследить развитие интересующих сфер в городах в помесячной динамике.

Например, по данным 2ГИС, самый обеспеченный банкоматами город России – это Сочи. В столице ближайшей Олимпиады 159 банкоматов на 100 тыс. жителей . Москва в этом рейтинге лишь на 54 месте – 81 банкомат на 100 тыс. жителей. А среди городов-миллионников по этому показателю на первом месте Казань (136).

Впрочем, если рассматривать абсолютное количество фирм, то Москва, как крупнейший город России, лидирует практически везде. В частности, столица не знает равных по числу бизнес-центров (здесь их 908). На втором месте Санкт-Петербург (513), а далее в первой пятерке, но с большим отрывом от лидеров, следуют Нижний Новгород (86), Новосибирск (82) и Екатеринбург (70). Зато в пересчете на население самым обеспеченным бизнес-центрами городом страны является Санкт-Петербург – в северной столице 11 бизнес-центров на 100 тыс. жителей.

Пользоваться « » можно совершенно бесплатно, при публикации данных сервиса в СМИ или в интернете необходима ссылка на 2ГИС.

Сервис статистики создан и работает на API 2ГИС , с помощью этого инструмента любой интернет-ресурс может бесплатно использовать карты и справочные данные 2ГИС.

Материал предоставлен пресс-службой 2ГИС.


С 2011 года 2ГИС публикует исследования различных сфер экономики городов России. Основу аналитики составляет обширная актуальная информация справочников 2ГИС о количестве всевозможных организаций, заведений, объектов в городах. Анализ этих данных приводит к интересным выводам.

Что Сургут, Ижевск и Нижневартовск — самые «безналичные» города России, а Норильск — лидер по доступности общественного транспорта.

Хотите больше сенсаций, неожиданных открытий?

Либо, наоборот, мечтаете подтвердить ваши предположения с помощью объективных данных, которые ежемесячно собирают и проверяют сотни специалистов 2ГИС?

Если да — то этот сайт специально для вас. Здесь есть наглядные ответы на все подобные вопросы.

Посмотрите, как выглядит ваш город на фоне остальных — цифры и графики на основе статистики 2ГИС помогут сделать интересные сравнения.

Все просто! Чтобы составить свой рейтинг, вам потребуется несколько кликов. Достаточно выбрать города и сферы деятельности, и 2ГИС подсчитает, сколько сейчас в них интересующих вас организаций. В абсолютном количестве или в расчете на население города — как вам удобнее. При использовании информации сайта необходима ссылка на источник данных («по данным 2ГИС»).

Статистика

в поле «что?»

Введите интересующую вас сферу деятельности. Сферы соответствуют рубрикам из справочника 2ГИС.

статистика

Начинайте вводить название рубрики и выберите интересующую вас в появляющихся подсказках.

Добавить для сравнения можно не более 5 рубрик.

Выбор города осуществляется так же, как и выбор рубрики.

2ГИС представляет новый онлайн-сервис stat.2 gis.ru , который позволяет сравнивать города по развитию более 80 сфер экономики. В его основе - данные о количестве предприятий из регулярно обновляемых справочников 2ГИС.

"Статистика 2ГИС" предназначена для широкой аудитории, но в первую очередь будет интересна тем, кому для работы необходимы объективные данные о городах. Например, журналистам, готовящим материалы об инфраструктуре города, предпринимателям, изучающим развитость конкретной отрасли экономики в регионе, студентам, готовящим исследовательскую работу и т.д. Статистика формируется на основе справочников 2ГИС, которые уточняются и обновляются специалистами компании ежемесячно, а в ряде городов - ежедневно.

Пользоваться сервисом очень просто. Нужно лишь указать интересующие сферы деятельности и города. В результате можно будет увидеть сравнение этих городов по общему количеству организаций (с учетом филиалов) в указанной сфере, а также по их числу в пересчете на 100 тыс. жителей - так проще сравнивать города разных масштабов. Всего "Статистика 2ГИС" содержит данные более чем о 80 сферах деятельности в 70 городах России (многие крупные города учтены со спутниками). В ближайшей перспективе на stat.2gis.ru появится возможность проследить развитие интересующих сфер в городах в помесячной динамике.

Например, по данным 2ГИС, самый обеспеченный банкоматами город России - это Сочи. В столице ближайшей Олимпиады 159 банкоматов на 100 тыс. жителей . Москва в этом рейтинге лишь на 54 месте - 81 банкомат на 100 тыс. жителей. А среди городов-миллионников по этому показателю на первом месте Казань (136).

Впрочем, если рассматривать абсолютное количество фирм, то Москва, как крупнейший город России, лидирует практически везде. В частности, столица не знает равных по числу бизнес-центров (здесь их 908). На втором месте Санкт-Петербург (513), а далее в первой пятерке, но с большим отрывом от лидеров, следуют Нижний Новгород (86), Новосибирск (82) и Екатеринбург (70). Зато в пересчете на население самым обеспеченным бизнес-центрами городом страны является Санкт-Петербург - в северной столице 11 бизнес-центров на 100 тыс. жителей.

Пользоваться "Статистикой 2ГИС " можно совершенно бесплатно, при публикации данных сервиса в СМИ или в интернете необходима ссылка на 2ГИС.

Сервис статистики создан и работает на API 2ГИС , с помощью этого инструмента любой интернет-ресурс может бесплатно использовать карты и справочные данные 2ГИС.

По материалам Esri

Understanding Spatial Statistics and Geostatistics

Как применяются статистика, пространственная статистика и геостатистика в ГИС-проектах? Этому и некоторым другим связанным с этой тематикой вопросам посвящена беседа сотрудников Esri Мэтта Артца (Matt Artz), менеджера по применению ГИС для научных целей, и д-ра Лорен Скотт (Dr. Lauren Scott), специалиста по разработке инструментов геообработки для ArcGIS и использованию статистических методов в геопространственном контексте. Ниже она представлена в виде вопросов/ответов.

Чем отличаются традиционная статистика, пространственная статистика и геостатистика?

Традиционная или непространственная статистика используется, как правило, в двух случаях. В первом мы имеем большой набор числовых данных, которые хотим изучить, и используем описательную статистику, чтобы их систематизировать и обобщить. Во втором случае у нас есть выборка данных, и мы хотим понять, насколько хорошо она отражает генеральную совокупность.

Когда возникает потребность в пространственной статистике?

Методы пространственной статистики разработаны специально для пространственных, географических данных. Для них характерны такие понятия, как пространство-площадь, длина, близость, направление, ориентация или какое-либо взаимодействие объектов в наборе данных, выраженное математическим языком. Именно этим методы пространственной статистики отличаются от традиционных статистических методов.

Какие имеются разновидности пространственной статистики?

Их довольно много. Есть описательная пространственная статистика, схожая с традиционной описательной статистикой. Например, если на карте есть множество точек, мы можем найти центр координат этих точек. (В традиционной статистике ему соответствует среднее значение набора значений данных). Мы можем также определить степень разброса этих точек относительно центра (что примерно соответствует традиционному стандартному отклонению для набора значений).

В других статистических методах анализируются пространственные закономерности: мы выясняем, как структурированы изучаемые данные. Например, объединены ли пространственные объекты в кластеры или они более или менее равномерно рассеяны? Сосредоточены ли большие значения в одном месте? Есть ли в данных «горячие пятна»? Инструменты анализа пространственных закономерностей помогают выявить нетипичные картины распределения потребительских расходов: найти области с аномально высоким процентом заболеваемости, преступности или пожаров или отследить распространение загрязнителей окружающей среды. Для этих методов существует множество прикладных и научных применений.

Есть также разновидность пространственной статистики, связанная с идентификацией и количественной оценкой пространственных отношений. Представим, что перед нами карта «горячих пятен» звонков в службу 911, и мы хотим понять, почему из таких мест поступило большое число звонков. Мы можем использовать регрессию и пространственный регрессионный анализ для изучения отношений и идентификации факторов, отвечающих за пространственное распределение, которое мы наблюдаем - факторов, которые могут объяснить, почему число звонков в службу 911 так велико.

А что такое геостатистика?

Геостатистика - это разновидность пространственной статистики. В качестве примера можно привести кригинг, мощный геостатистический метод, расширяющий возможности обычной интерполяции. В нем для создания эффективных и точных прогнозов в областях, где отсутствуют данные измерений или наблюдений, используются не только близлежащие пространственные объекты, но и пространственные отношения.

Традиционно, геостатистика используется для анализа геологических данных и данных об окружающей среде, например, данных о дождевых осадках или рельефе. Целью является создание поверхности из набора точек. Методы геостатистики широко используются в нефтегазовой отрасли и горном деле. Но на самом деле геостатистика идеально подходит для анализа и прогнозирования данных, относящихся практически к любому типу пространственно непрерывных или пространственно протяженных явлений.

Какие инструменты геостатистики и пространственной статистики есть в продуктах Esri?

Многие наверное слышали о дополнительном модуле ArcGIS Geostatistical Analyst, содержащем набор инструментов геостатистики. Он наиболее полезен для работы с выборкой данных о пространственно-непрерывном явлении, таком как дождевые осадки, температура, геология или почвы, и там, где целью является создание поверхности - поверхности вероятности, поверхности прогноза или поверхности ошибки. Этот программный продукт совершенствуется на протяжении много лет, и теперь его возможности уже далеко превосходят функцию создания поверхностей. Инструменты этого модуля можно использовать для решения широкого круга научно-исследовательских и прикладных задач.

В ядре ArcGIS любого уровня лицензии в числе прочего имеется также набор инструментов пространственной статистики (Spatial Statistics Toolbox) с инструментами для анализа пространственных распределений, закономерностей, процессов и отношений. Эти статистические инструменты позволяют решать ряд задач, в том числе определять основную тенденцию или идентифицировать общее направление изменений, горячие и холодные пятна или пространственные выбросы, оценивать совокупные картины кластеризации или рассеяния и моделировать пространственные отношения. И этими инструментами уже пользуется много людей, они широко востребованы!

Доступны ли пользователям ArcGIS другие статистические инструменты?

Конечно. В модуле Esri Business Analyst есть инструменты, использующие статистические методы для идентификации доли рынка, зон обслуживания, территорий продаж и потенциальных клиентов. И вместе с модулем поставляется множество данных для этих инструментов. Дополнительный модуль ArcGIS Spatial Analyst включает статистические инструменты, помогающие классифицировать растровые данные, в том числе данные дистанционного зондирования. Кроме того, статистические инструменты имеются и в других продуктах ArcGIS. И среда геообработки в ArcGIS может быть легко расширена путем подключения к традиционным статистическим пакетам. Вы также можете создавать ваши собственные инструменты; эти пользовательские инструменты будут работать так же, как и любой другой готовый инструмент геообработки.

Тем, кто использует программное обеспечение SAS, предлагается совместный продукт компаний SAS и Esri под названием SAS Bridge, который позволяет c легкостью работать одновременно в двух программных средах. Есть также примеры скриптов, которые можно загрузить с сайта ресурсов Esri (), например, для использования R, статистического пакета с открытым исходным кодом, в среде ArcGIS.

Какое преимущество дает использование пространственной статистики и геостатистики?

Когда вы анализируете ваши данные вне их пространственного контекста, то из рассмотрения теряются такие их важные составляющие как пространство и время. В результате вы видите лишь половину всей истории. Ведь всё происходит в пространстве и во времени, и если мы это игнорируем, наш анализ становится неполным. Это важное отличие традиционной статистики от пространственной: в традиционной статистике часто делается допущение, что данные не имеют так называемой пространственной автокорреляции.

Что такое пространственная автокорреляция?

Несмотря на мудреное название, ее концепция очень проста: пространственная автокорреляция означает, что в ваших данных есть пространственная структура. Этой структурой могут быть кластеры, какой-либо тип рассеяния и другие особенности. Но в любом случае она означает, что распределение ваших пространственных объектов или значений данных, связанных с вашими пространственными объектами, не является случайным. Вакансии, дома, производство, покупки, автодороги или скважины распределяются на местности не случайным образом; они группируются в кластеры в городах, округах и различных зонах землепользования. Данные, имеющие пространственную автокорреляцию, не соответствуют допущениям, принятым в некоторых традиционных статистических методах, и поэтому часто рассматриваются традиционными статистиками как помеха для анализа.

ГИС-аналитики и пространственные статистики, напротив, оживляются, когда видят пространственную автокорреляцию в их данных, когда они наблюдают кластеризацию данных на местности, поскольку она свидетельствует об активных пространственных процессах. И это замечательно! Что-то является причиной этой кластеризации или структуры, что-то порождает различные типы отношений и пространственных закономерностей; и это «что-то» часто является как раз тем, что нас больше всего интересует и что помогает их полнее анализировать. Почему люди умирают раньше в этой части страны? Какими факторами можно объяснить то, что дети в данном школьном округе постоянно показывают высокие результаты на экзаменах?

Пространственные процессы часто не видны «невооруженным» глазом, однако используя инструменты из наборов пространственной статистики (Spatial Statistics Toolbox) для измерения их силы и масштаба результатов - пространственной кластеризации или рассеяния, горячих пятен или пространственных выбросов - мы узнаем о них значительно больше и начинаем лучше понимать наши данные.

Какое заблуждение в отношении пространственной статистики чаще всего присуще людям в ГИС-сообществе?

Чаще всего в ГИС-сообществе бытует заблуждение о ее сложности! Люди слышат слово «статистика», и у них сразу же возникают неприятные воспоминания, связанные с университетским курсом, после чего они просто теряют интерес к теме. И это вызывает большое сожаление потому, что, по мнению многих специалистов, в том числе и практиков, традиционная статистика интересна, а пространственная статистика так и просто увлекательна! И они не так сложны, как кажутся вначале. Некоторые разделы пространственной статистики оперируют очень простыми понятиями, но, тем не менее, дают мощные результаты и являются важным подспорьем при проведении анализа.

Можно привести пример простого, но мощного статистического инструмента?

Простейшим инструментом в Spatial Statistics Toolbox является инструмент Усредненный центр. Он вычисляет среднее значение всех X-координат и затем среднее значение всех Y-координат. Усредненным центром является точка с этими средними X- и Y-координатами. Что может быть проще? Но с помощью этого инструмента можно получить очень значимые результаты. Например, мы изучали данные о численности населения штата Калифорния по округам за последние 100 лет. Мы хотели найти центр численности населения и посмотреть, менялся ли он со временем. Поэтому мы вычислили взвешенный усредненный центр. В начале столетия центр численности населения находился рядом с г. Сан-Франциско, отражая развитие банковской отрасли. С каждым последующим десятилетием центр численности населения смещался на юг. Сначала это смещение происходило очень быстро, благодаря экономическому росту Южной Калифорнии, связанному с нефтедобычей, Голливудом, аэрокосмической промышленностью и пр. Однако к концу столетия процесс замедлился.

То есть даже такой простейший инструмент позволяет визуализировать сложную пространственную тенденцию; скорость и направление перемещения усредненного центра дает интересную информацию о пространственных процессах, лежащих, в данном случае, в основе этого перемещения населения на юг.

Но некоторые инструменты все же не так просты, как усредненный центр?

Да, это так. Большинство ГИС-инструментов очень просты. Вы просто вводите параметры и запускаете инструмент. Однако, некоторые инструменты пространственной статистики сложнее: перед тем, как их использовать, необходимо подумать о пространственных отношениях, масштабе анализа, границах изучаемой области и т.д. Поэтому Esri проводит большую работу по включению в документацию ArcGIS хороших описаний, объясняющих, как правильно использовать инструменты и выбирать подходящие параметры для той или иной аналитической задачи.

Где можно получить больше информации об использовании статистики в ГИС-проектах?

В книге The Esri Guide to GIS Analysis, Volume 2: Spatial Measurements and Statistics (Руководство ESRI по ГИС анализу. Том 2: Пространственные измерения и статистика; автор Энди Митчелл) каждая глава посвящена одному из инструментов Spatial Statistics Toolbox. Это отличный ресурс для тех, кто пока мало знаком с пространственной статистикой, ее методами и преимуществами.

Книга Spatial Statistical Data Analysis for GIS Users (Анализ данных с помощью пространственной статистики для пользователей ГИС; автор Константин Криворучко, один из основных разработчиков модуля ArcGIS Geostatistical Analyst). Эта книга выпущена в электронном виде на компакт-диске. В ней не только объясняются методы и инструменты пространственного статистического анализа, но и представлены примеры реальных мест и обстоятельств их применения в разных районах мира. Поскольку наборы пространственных данных для рассматриваемых случаев доступны на том же диске, читатели могут их загрузить в ArcGIS и следовать изложению, выполняя все описанные в примерах шаги и представляя полученные результаты посредством карт. Автор объясняет связь между неопределенностью в данных и неопределенностью в модели, обсуждает возможные источники неопределенности и ошибок, проводит наглядную проверку типичных статистических распределений, представляет методы проведения анализа чувствительности и неопределенности. Также в книге рассматриваются различия между непрерывными, региональными и дискретными данными, преимущества и недостатки детерминированных и статистических моделей. Первая (вводная) часть книги Statistical approach to GIS data Analysis (Статистический подход к анализу данных ГИС) с массой поясняющих иллюстраций и ее содержание доступны в виде отдельных PDF-файлов.

Обе книги выпущены издательством Esri Press. Кроме того, несколько бесплатных вэбинаров и учебных руководств доступны в учебном центре Esri (Esri Virtual Campus: www.esri.com/training/main), на сайте ресурсов по ArcGIS (). В блоге GISandScience.com также есть несколько познавательных ресурсов, дающих общее представление о пространственной статистике и пространственном анализе.


Книга «Анализ данных с помощью пространственной статистики для пользователей ГИС» Константина Криворучко, до Esri работавшего зав. лабораторией в Международном экологическом университете (ранее институт радиоэкологии) им. А.Д. Сахарова (Минск, Беларусь)