Использование информационных технологий в климатологических исследованиях

Е.И. Шаврак
Волгодонский инженерно-технический институт НИЯУ «МИФИ»,
г. Волгодонск


Одной из наиболее актуальных проблем настоящего времени, обусловленной климатическими изменениями на глобальном уровне, является изучение особенностей их формирования. Современный уровень развития информационных технологий позволяет поднять климатологические исследования на новый уровень, обеспечивая, с одной стороны, широкий доступ через Интернет к метеоинформации о любой точке земного шара, с другой – предоставляя высокоэффективные технологии обработки этой информации.

В данной работе представлены результаты исследования временных рядов средних температур воздуха в г. Ростове-на Дону за период 1912-2008 гг. Исходные данные были почерпнуты через сеть Интернет из архивов Государственного фонда данных о состоянии природной среды с помощью Web технологии “Аисори – Удаленный доступ к ЯОД-архивам”, разработанной в Лаборатории автоматизированной информационной системы ГУ ВНИИГМИ-МЦД Росгидромета и обеспечивающей удаленный доступ пользователей к ЯОД-архивам для получения из них любых выборок табличной структуры [1]. Границы временного интервала, взятого для исследования, и полнота выборок определялись наличествующей в Госфонде информацией.

Для анализа использовались выборки среднемесячных и среднесуточных температур воздуха за 98 лет.

Целью исследования было изучение структуры временных рядов, выраженности и детерминированности температурных изменений для каждого отдельно взятого месяца как в течение всего рассматриваемого периода, так и на отдельных его этапах. В соответствии с этим были сформированы 144 временных последовательности, включающие в себя 12 рядов среднемесячных температур за 98 лет (январь – декабрь, по 95-98 значений), по 12 рядов среднемесячных температур за периоды 1912-1930, 1931-1951, 1952-1970, 1971-1989, 1990-2008 гг. (январь – декабрь, в среднем по 19-20 значений), 12 рядов среднесуточных температур за 98 лет (январь – декабрь, в среднем по 2700-2900 значений), по 12 рядов температур за периоды 1912-1930, 1931-1951, 1952-1970, 1971-1989, 1990-2008 гг. (январь – декабрь, в среднем по 540-580 значений).

Изучение свойств вышеуказанных временных последовательностей проводилось с использованием совокупности трех методов: метода SSA (Singular Spectrum Analysis, "Гусеница") – для определения структуры ряда, регрессионного анализа - для сравнения выраженности температурных изменений, фрактального R/S анализа - для идентификации их детерминированности.

1. Исследование структуры рядов с помощью метода SSA

Целью исследования является разложение временного ряда на интерпретируемые аддитивные составляющие. Метод SSA [2,3] не требует стационарности ряда, знания модели тренда, а также сведений о наличии в ряде периодических составляющих и их периодах. На первом этапе анализа выбирается параметр L, называемый длиной окна. На основе исследуемого ряда строится траекторная матрица, столбцами которой являются скользящие отрезки ряда длиною L. Следующий шаг – разложение матрицы по ортогональным составляющим (главным компонентам, ГК). На заключительном этапе проводится восстановление ряда по выбранным ГК. Визуальное и аналитическое изучение ГК, полученных в результате преобразования ряда позволяет выделить относящиеся к тренду (медленно меняющиеся), периодические и шумовые ГК.

В нашей работе с помощью метода SSA исследованы структуры 72 рядов, включающих в себя среднесуточные температуры воздуха для каждого месяца за разные промежутки времени. Длина окна соответствовала 10-летнему периоду и включала в себя 280-310 значений (в зависимости от конкретного месяца). В качестве характеристики структуры ряда были выбраны следующие показатели: количество ГК, описывающее не менее 96 % дисперсии значений; и доля дисперсии, описываемой первой ГК. Результаты исследований приведены в таблице 1.

Таблица 1

Характеристики ГК временных рядов

месяц

количество ГК, описывающее не менее 96% дисперсии значений, единиц

доля дисперсии, описываемой первой ГК, %

1912-1930

1931-1951

1952-1970

1971-1989

1990-2008

1912-2008

1912-1930

1931-1951

1952-1970

1971-1989

1990-2008

1912-2008

январь

74

72

76

70

72

74

37

44

34

38

27

38

Февраль

56

58

56

54

52

56

53

31

29

30

31

35

Март

76

78

80

74

74

72

7

7

11

18

30

17

Апрель

18

20

18

22

18

18

82

81

83

88

89

84

Май

1

1

1

1

1

1

96

96

96

96

96

96

Июнь

1

1

1

1

1

1

97

98

97

97

97

97

Июль

1

1

1

1

1

1

98

98

98

98

98

98

Август

1

1

1

1

1

1

98

98

98

98

98

98

Сентябрь

1

1

1

1

1

1

96

96

96

96

96

96

Октябрь

36

38

40

38

36

38

83

75

83

83

81

82

Ноябрь

68

66

64

62

66

68

32

33

44

39

25

30

декабрь

76

78

86

76

78

80

19

18

5

10

13

18

Данные таблицы 1 свидетельствуют о различиях структур рассматриваемых временных рядов. Можно выделить три их типа: «простые», «переходные» и «сложные». Под «простыми» (май – сентябрь) будем понимать структуры, в которых не менее 96 % дисперсии характеризуется одной ГК. Визуальная интерпретация позволяет отнести эту ГК к трендовой составляющей. Периодика и шум в таких временных рядах выражены минимально. «Сложные» структуры характеризуются сложным составом тренда, включающего не менее 16 различных ГК, а также набором значимых ГК, характеризующих шум и периодику. К ним относятся январь, февраль, март, ноябрь и декабрь. «Простые» ряды отделяются от «сложных» «переходными» (апрель, октябрь), в которых тренд характеризуется преимущественно 4-6 различными ГК.

2. Определение выраженности температурных изменений

На данном этапе использовался корреляционно-регрессионный анализ с использованием компьютерного пакета Statistica-7 [4]. Исследовались все 144 ряда. Независимой переменной был порядковый номер года в соответствующей временной последовательности, в качестве зависимой переменной выступала средняя температура воздуха (среднемесячная или среднесуточная). Анализ проводили при уровне значимости р, равном 0,05. При обсуждении предпочтение отдавалось статистически значимым результатам (р≤0,05). Коэффициент регрессии (°С/год), соответствующий углу наклона температурного тренда, отражал направленность и интенсивность температурных изменений в соответствующем ряду. Полученные результаты приведены в таблице 2.

Таблица 2.

Углы наклона температурных трендов (коэффициенты регрессии)

месяц

Зависимая переменная –среднемесячная температура

Зависимая переменная –среднесуточная температура

1912-1930

1931-1951

1952-1970

1971-1989

1990-2008

1912-2008

1912-1930

1931-1951

1952-1970

1971-1989

1990-2008

1912-2008

январь

-0,16

0,11

0,19

0,26

0,03

0,02

-0,21?

0

-0,08

0,29

0,16

0,02

февраль

-0,27

0,23

0,12

-0,15

0,02

0,05?

-0,12

-0,2

-0,11

0,11

0,11

0,00

март

-0,2

0,06

0,16

-0,17

0,04

0,03

-0,11

0,1

0,23

-0,08

0,23

0,03

апрель

-0,09

0,01

-0,04

-0,13

0,01

0,02

-0,08

0,085

0,08

-0,06

0,12

0,02

Май

0,24

0,02

0,04

0,05

0,11

0,01

0,25

0,07

0,09

0,07

0,07

0,01

Июнь

0,03

0,11

0,01

-0,03

0,00

0,01

0,01

0,02

-0,08

-0,09

0,04

0,01

Июль

0,08

-0,02

0,03

-0,06

0,03

0,01

0,00

-0,13

-0,03

-0,06

-0,12

0,00

Август

0,11

0,01

-0,02

-0,02

0,13

0,01

0,11

-0,03

-0,05

0,00

0,22

0,01

Сентябрь

0,00

0,00

-0,01

-0,02

0,11

0,01

0,09

-0,02

0,13

0,04

0,08

0,01

Октябрь

0,14

-0,23

0,07

0,02

0,04

0,01

0,12

-0,1

-0,02

0,05

0,09

0,01

Ноябрь

0,13

0,08

0,18

-0,17

0,11

0,00

0,05

-0,08

0,33

-0,21

0,17

-0,00

декабрь

-0,18

0,03

0,06

-0,03

0,04

0,02

-0,15

0,04

0,04

-0,15

0,15

0,02

? - Полужирным шрифтом выделены статистически значимые результаты

При анализе сведений, представленных в таблице 2, мы опирались преимущественно на статистически значимые результаты. А именно - при рассмотрении векового тренда (1912-2008 гг.) использовались данные анализа среднемесячных температур, в случае отдельных временных промежутков - углы наклона трендов среднесуточных температур. В целом за 98 лет произошло увеличение температур воздуха во все месяцы, что подтверждается информацией о повсеместном увеличении среднегодовой температуры воздуха на территории Ростовской области в среднем на 1,7º за 70 лет [5]. Согласно данным таблицы 2, в большей степени увеличение температур характерно для января, февраля, марта, апреля и декабря, то есть, в основном, для месяцев со «сложной» и «переходной» структурами временного ряда. В меньшей степени изменения проявляются в месяцы с мая до ноября, т.е. в промежутки времени, характеризующиеся, преимущественно, «простой» структурой трендов. Характер трендов в отдельные периоды столетия нестабилен. Так, если в начале века отмечается значительное понижение температур весной и зимой, то на протяжении всей второй половины столетия этот процесс становится характерен для летних месяцев, особенно июля. В последние 20 лет отмечено статистически значимое повышение температуры воздуха практически во все месяцы, кроме июля.

3. Определение фрактальных свойств рядов

В последнее время широкое распространение получил метод фрактального анализа временных рядов, в основе которого лежит утверждение о самоподобии временного ряда на неком интервале масштабов. В его основе лежит так называемый R /S –анализ, основанный на зависимости нормированного размаха параметра от величины приращения времени [6]. Значение нормированного размаха изменяет масштаб по мере увеличения приращения времени согласно значению степенной зависимости, равному Н, которое обычно называют показателем Херста. Временные ряды, для которых Н равно0,5 – имеют независимое распределение данных, находятся в броуновском движении, характеризуются нулевым средним и дисперсией, равной 1. Временные последовательности, для которых Н больше 0,5, относятся к классу персистентных, сохраняющих эффект долговременной памяти. Чем больше значение Н, тем устойчивее наблюдаемая тенденция. Случай Н < 0.5 характеризуется антиперсистентностью. Антиперсистентная система должна меняться чаще, чем вероятностный процесс [7]. Нами были исследованы R /S – траектории 72 временных рядов среднесуточных температур, включающих в себя как весь период 1912-2008 гг, так и отдельные его этапы. Работа проводилась с использованием программы Fractan -4,4, реализующей алгоритм анализа Херста [8]. Полученные результаты приведены в таблице 3.

Таблица 3

Характеристика фрактальных свойств временных рядов (показатели Херста)

Месяц

Значение показателя Херста, Н

1912-1930

1931-1951

1952-1970

1971-1989

1990-2008

1912-2008

январь

0,64

0,53

0,7

0,76

0,73

0,72

февраль

0,72

0,58

0,55

0,83

0,72

0,64

март

0,64

0,62

0,71

0,63

0,66

0,64

апрель

0,674?

0,46

0,6

0,67

0,67

0,7

Май

0,94

0,67

0,6

0,6

0,72

0,63

Июнь

0,78

0,67

0,45

0,55

0,82

0,63

Июль

0,59

0,85

0,69

0,48

0,77

0,67

Август

0,73

0,82

0,53

0,67

0,63

0,66

Сентябрь

0,74

0,54

0,72

0,5

0,66

0,57

Октябрь

0,51

0,84

0,66

0,66

0,47

0,7

Ноябрь

0,52

0,62

0,85

0,74

0,69

0,63

декабрь

0,58

0,71

0,63

0,77

0,62

0,78

? - Полужирным шрифтом выделены характеристики рядов с «переходной» структурой.

Как видно из таблицы 3, подавляющее большинство рассматриваемых рядов является персистентными, т. е. характеризуется долговременной памятью, детерминированностью. Анализ взаимосвязей между структурой временных рядов, показателями их фрактальных свойств и выраженностью температурных изменений позволяет предположить существование соответствующей зависимости. В январе-марте («сложные» структуры рядов) происходит снижение фрактальных свойств, сопровождающееся уменьшением угла наклона температурных трендов. Апрель (месяц с «переходной» структурой) отмечен скачкообразным увеличением показателя Херста. Период с мая по сентябрь («простые» структуры) характеризуется относительно небольшими фрактальностью и углами наклона трендов. В октябре («переходная» структура) снова наблюдается рост фрактальности, сопровождающийся резким изменением тренда. На наш взгляд, именно изменение фрактальности (силы детерминирующего воздействия) в «переходные» апрель и октябрь может являться одной из основных причин усложнения температурных трендов временных рядов со всеми вытекающими последствиями. Сезонная стабильность этого воздействия позволяет предположить наличие комплекса факторов, активизирующихся именно в этот период и определяющих в конечном счете наблюдаемые в настоящее время долговременные температурные изменения.

Выводы.

Использование существующих возможностей информационных технологий позволило провести комплексный анализ большого количества фактической информации о температуре воздуха в Ростове-на Дону за 98 лет (144 временных ряда). Установлены особенности структур временных рядов как для всего периода 1912-2008 гг., так и для отдельных его этапов. Обнаружена связь структуры ряда с выраженностью температурных изменений. В большей степени межгодовое увеличение температур характерно для января, февраля, марта, апреля и декабря, то есть, в основном, для месяцев со «сложной» и «переходной» структурами временного ряда. Показана предположительная первопричина формирования различий в степени сложности структур, а именно – устойчивое направленное изменение фрактальных свойств рядов в апреле и октябре.

Список литературы

1. www.meteo.ru/tech/aisori

2. Д.Л.Данилов, А.А.Жиглявский. Главные компоненты временных рядов: метод "Гусеница". - Санкт- Петербургский университет, 1997. – 120 с.

3. Голяндина Н.Э. Метод «Гусеница SSA: анализ временных рядов». - Санкт-Петербургский университет, 2004.- 76 с.

4. Вараксин А.Н. Статистические модели регрессионного типа в экологии и медицине. - Екатеринбург: изд-во «Гощицкий», 2006. – 256 с.

5. Экологический вестник Дона « О состоянии окружающей среды и природных ресурсов Ростовской области в 2009 году». - Ростов-на-Дону, 2010. – 370 с.

6. Hurst H.E., Black R.P., Simaika Y.M. Long-termstorage: An experimental study /L.: Constable, 1965.

7. Петерс Э.Э. Фрактальный анализ финансовых рынков/ Интернет-трейдинг, М., 2004.- 285.

8. Мусалимов В.М., Резников С.С., Чан Нгок Чау. Специальные разделы высшей математики. - СПбГУ ИТМО, 2006. – 120 с. 


Назад к списку