Прикладная аналитика с применением SAS Enterprise Miner (часть 1)
(AAEM1)
Длительность: 2 дня. Уровень: 3. Версия ПО: 7.1
Этот курс охватывает все необходимые навыки для анализа данных с использованием широкого круга инструментов, которые имеются в SAS Enterprise Miner. В курсе рассматриваются задачи прогнозного моделирования (деревья решений, регрессия).
В этом курсе изучается как:
- Создать проект для SAS Enterprise Miner и исследовать исходные данные графически
- Изменить данные для получения лучших результатов анализа
- Построить и интерпретировать статистические модели (такие как деревья решений и регрессионные модели)
- Сравнивать и объяснять сложные модели
- Создавать и использовать код для скоринга
Для изучения материалов курса необходимо предварительное знакомство с основами математической статистики и статистического моделирования. Опыт работы с системой SAS не требуется, хотя будет желателен.
Желательно, чтобы слушатели имели представление о работе в среде SAS, в частности:
- Имели представление об организации данных SAS и об основных процедурах SAS.
- Умели работать с библиотеками и наборами данных SAS.
- Понимали логику процессов выполнения шага данных (DATA step).
Аудитория
Аналитики данных, эксперты по качеству и другие специалисты, которые используют SAS Enterprise Miner в своей работе.
Введение в SAS Enterprise Miner
Доступ и первичное использование подготовленных данных
- создание проекта, библиотеки и диаграммы в SAS Enterprise Miner
- как задать источник данных
- исследование источника данных
Введение в прогнозные модели: деревья решений
- Построение деревьев решений
- Оптимизация сложности дерева решений
- дополнительные инструменты диагностики
- параметры для автономного построения дерева решений
Введение в прогнозные модели: регрессия
- Выбор входных переменных регрессии
- Оптимизация сложности регрессии
- Интерпретация регрессии
- Преобразование входных переменных
- Категориальные входные переменные
- Полиномиальная регрессия
Оценка моделей
- Статистики подгонки модели
- Статистические графики
- Поправка для раздельных выборок
- Матрицы прибыли
Применение модели. Скоринг
- Наборы данных с внутренним скорингом
- Модули скорингового кода