Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Первый шаг заключается в создании новой структуры Data mining модели при помощи Mining Model Wizard. При этом также создаётся начальная модель, основанная на алгоритме Microsoft Decision Trees.
Для того чтобы создать структуру модели:
Age |
YearlyIncome |
Region |
CommuteDistance |
HouseOwnerFlag |
TotalChildren |
EnglishEducation |
LastName |
|
EnglishOccupation |
MaritalStatus |
|
FirstName |
NumberCarsOwned |
|
Gender |
NumberChildrenAtHome |
Вы можете выбрать несколько столбцов, удерживая клавишу SHIFT.
Нажмите Next.
В поле Specify Columns' Content and Data Type нажмите Detect. При этом автоматически определяется, содержат ли столбцы с численными данными дискретные, либо непрерывные значения. Например, столбец может содержать информацию о заработной плате с непосредственными значениями сумм (непрерывные значения) или в нём могут содержаться целые числа, отвечающие неким диапазонам значений (1 = <$25,000; 2 = от $25,000 до $50000 и так далее), то есть дискретные значения.
В поле Structure Name введите Targeted Mailing и нажмите Finish
Нажмите Finish. При этом откроется редактор Data mining, отображающий структуру Targeted Mailing, которую вы только что создали, см. Рисунок 5.
Рисунок 5 Страница структуры Targeted Mailing
После того как модели обработаны, вы можете просмотреть их, используя закладку Mining Model Viewer в редакторе Data Mining. При помощи выпадающего списка Mining Model в верхней части закладки можно исследовать модели, входящие в структуру.
Модель Microsoft Decision Trees
Mining Model Viewer по умолчанию открывает модель Targeted Mailing первой в структуре. Tree viewer содержит две закладки, Decision Tree (дерево решений) и Dependency Network (сеть зависимостей).
Decision Tree (Дерево решений)
На странице Decision Tree вы можете просмотреть все модели деревьев, составляющие модель Targeted_Mailing. Для каждого прогнозируемого атрибута модели существует одно дерево, если только не задействовано feature selection. Так как ваша модель содержит всего один прогнозируемый атрибут, Bike Buyer, то и дерево тоже одно. Если бы их было несколько, можно было бы выбрать нужное при помощи Tree box.
Tree viewer по умолчанию показывает только первые три уровня дерева. Чтобы увидеть больше используйте Show Level slider или Default Expansion box. Для более подробной информации по настройке Tree viewer, обратитесь к разделу "Viewing with Tree Viewer" в SQL Server Books Online.
Чтобы создать дерево, показанное на рисунке 6
Рисунок 6 Страница Decision Tree для модели Targeted Mailing
Каждый узел в дереве решений несёт в себе следующую информацию:
Если включен режим drillthrough ("проваливание" в исходные данные), вы можете просмотреть варианты для узла, кликнув по нему правой кнопкой мыши и выбрав Drillthrough.
Сеть зависимостей (Dependency Network)
На странице Dependency Network показаны отношения между атрибутами, влияющими на прогнозирующую способность модели. Сеть зависимостей для модели Targeted Mailing представлена на рисунке 7.
Рисунок 7 Страница Dependency Network модели Targeted Mailing.
Центральный узел на рисунке 7, Bike Buyer, представляет прогнозируемый атрибут модели. Каждый из узлов вокруг него отображает атрибут, влияющий на прогнозируемый. При помощи ползунка на левой стороне страницы можно указать силу показываемых связей. При перемещении ползунка вниз будут показываться только сильные связи.
По легенде цветов внизу окна можно узнать, какой узел является прогнозируемым и какие узлы его определяют.