29.03.2024

Практикум

М.В. Горшков
Экологический мониторинг

Учебное пособие. – Владивосток: Изд-во ТГЭУ, 2010. – 313 с.

Предыдущая

Практикум

Тема 4. Информационные технологии для экологического мониторинга

4.2. Редактор электронных таблиц MS Excel

Из неспециализированных программных продуктов выделим редактор электронных таблиц, входящий в состав офисного пакета MS Office. Это очень распространённая и простая программа, обладающая неплохим графическим представлением и вычислительными возможностями. Кроме того, в последних версиях появилась надстройка Анализ данных, которая содержит такие статистические методы как – корреляционный анализ, дисперсионный анализ, описательная статистика, регрессионный анализ и др.

Знакомство с интерфейсом программы. Интерфейс программы стандартный для любых приложений Windows и хорошо знаком широкой аудитории. Основные файлы программы имеют расширение *.xls (или для MS Excel 2007 – *.xlsx). Для иллюстрации методов мы будем использовать те же примеры, что и для пакета Statistica.

Для работы со статистическими процедурами требуется подключить надстройку Анализ данных (Сервис/Надстройки/Пакет анализа). Теперь обратимся к самой надстройке: Сервис/Анализ данных:

Описательная статистика. Для вышеприведённой таблицы (для переменной «Уровень») рассчитаем ряд аналогичных описательных статистик. Для этого выбираем модуль «Описательная статистика».

Входной интервал – значения переменной «Уровень». «Метки в первой строке» выбираем если хотим чтобы первый элемент строки был воспринят как заголовок переменной. Параметры «Итоговая статистика», «Уровень надёжности» установить в активное состояние. Нажмите ОК. Получим ряд статистик в месте выходного интервала.

Не стоит также забывать о Мастере функций, который также содержит немало статистических функций: ДИСП (рассчитывает дисперсию), КВАРТИЛЬ (рассчитывает заданный квартиль), МАКС (определяет максимальное значение), МИН (определяет минимальное значение), МЕДИАНА (рассчитывает медиану выборки), МОДА (определяет моду выборки), СРЗНАЧ (рассчитывает среднее значений выборки), СТАНДОТКЛОН (рассчитывает стандартное отклонение выборки).

Графическое представление данных. Графики в MS Excel строятся посредством Мастера диаграмм и должны быть хорошо известны студенту из курса информатики.

 

Параметрические непараметрические критерии. Рассчитаем критерий Стьюдента. Для этого вызываем модуль «Парный двухвыборочный тест t-тест для средних».

В окнах «Интервал переменной 1» и «Интервал переменной 2» задаем значения сравниваемых выборок. Диапазон должен состоять из одного столбца или одной строки, содержащих одинаковое со вторым диапазоном количество данных. Параметр «альфа» оставляем без изменений. Выбираем место для выходного интервала. И нажимаем ОК.

Также существует целый ряд функций, связанный с расчётом t-критерия, а также с расчётом F-критерия Фишера. Непараметрические критерии почти отсутствуют в Excel. Частично представлены вычисления для коэффициентов ранговой корреляции в модуле «Ранг и персентиль». Возможно вычисление коэффициентов корреляции Пирсона в модуле «Корреляция» или с помощью функции ПИРСОН.

Дисперсионный анализ. Для выяснения факта влияния контролируемого фактора на результативный признак на основе выборочных данных используется модуль «Однофакторный дисперсионный анализ»:

В модуле присутствуют типичные для Анализа данных параметры. Это «Входной интервал». Первичные данные здесь представляются не так как в Statistica, немного проще. Также здесь имеются типичные пункты «Группирование» и «Метки в первой строке/столбце». Показатель «альфа» оставляем без изменений. Рассмотрим конкретный пример:

 

Объём выполненной работы

Номер смены

Бригада 1

Бригада 2

Бригада 3

Бригада 4

1

140

150

148

150

2

144

149

149

155

3

142

152

146

154

4

145

150

147

152

При уровне значимости α = 0,05 требуется выяснить, зависит ли объём выполненных работ от работающей бригады. Запускаем модуль и заполняем окна. Далее нажимаем ОК:

Обозначения те же, что и в пакете Statistica. Аналогично для таблицы из лабораторной работы №2 проведите анализ и сравните с ранее полученными вами результатами.

Регрессионный анализ. Представлен модулем «Регрессия». Для вышеприведённого примера проведём регрессионный анализ.

В окне «Входной интервал Y» выберем диапазон значений для октанового числа, а в окне «Входной интервал X» – диапазон значений для примесей. Параметр «Уровень надёжности» сделайте активным. Параметр «Константа-ноль» также сделайте активным, чтобы линия прошла через начало координат (b0 = 0).

Анализ временных рядов. Отдельного модуля для анализа временных рядов в Excel нет (есть только отдельные компоненты в модуле Анализ данных для расчёта скользящих средних и рядов Фурье).

Среди списка функций Мастера функций имеются отдельные функции по работе со значениями временного ряда: ПРЕДСКАЗ, ТЕНДЕНЦИЯ, но они узко специализированы и ограничивают пользователя.

Некоторые возможности предоставляет Мастер диаграмм или (если быть точным) настройки графика. Построим линейный график для переменной «Октановое число» из предыдущего примера и откорректируем его (см. рисунок) через функцию «Параметры диаграммы» и другие дополнительные функции.

Затем щёлкаем по линии графика правой кнопкой мыши выбираем функцию «Добавить линию тренда». В появившемся окне выбираем тип тренда (если выберем полиномиальный тренд появится возможность задать степень сглаживания). В дополнительной вкладке можно задать появление уравнения сглаживания на тренде. Тренд появляется на фоне основного графика.

Предыдущая

Добавить комментарий