У вас вопросы?
У нас ответы:) SamZan.net

Лабораторна робота 3 Побудувати дерево рішень для однії з моделей Dt Mining Педставити результати граф

Работа добавлена на сайт samzan.net: 2015-07-05

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 3.2.2025

Лабораторна робота №3

  1.  Побудувати дерево рішень для однії з моделей Data Mining
  2.  Педставити результати графічно засобами ВІ
  3.  сформулювати  задачу й отримані правила природною мовою.

Описание структуры модели Data Mining

Первый шаг заключается в создании новой структуры Data mining модели при помощи Mining Model Wizard. При этом также создаётся начальная модель, основанная на алгоритме Microsoft Decision Trees.

Для того чтобы создать структуру модели:

  1.  В Solution Explorer кликните правой кнопкой мыши на Mining Models, выберите New Mining Model. Откроется Mining Model Wizard.
  2.  Нажмите Next на странице приветствия.
  3.  Выберите From existing relational database or data warehouse, затем Next.
  4.  В разделе Which data mining technique do you want to use? выберите Microsoft Decision Trees. Вы создадите несколько моделей, опирающихся на эту начальную структуру, в основе которой лежит алгоритм Microsoft Decision Trees.
  5.  Нажмите Next. По умолчанию в качестве источника данных здесь выбран Adventure Works DW.
  6.  Нажмите Next.
  7.  Пометьте флагом Case таблицу vTargetMail, затем нажмите Next.
  8.  Пометьте флагом Key столбец CustomerKey. Если в исходной таблице присутствует ключевое поле, Mining Model Wizard автоматически выберет его в качестве ключевого для модели.
  9.  Пометьте флагом Input и Predictable столбец BikeBuyer. В результате столбец становится доступным для прогнозирования в новых наборах данных. После того как вы помечаете столбец подобным образом, становится доступной кнопка Suggest. Нажатие на эту кнопку вызывает диалоговое окно со списком наиболее связанных с данным полем столбцов, расположенных в порядке корреляции с прогнозируемым. Столбцы со значением больше 0.05 автоматически добавляются в модель. Если вы согласны с предлагаемым вариантом, нажмите кнопку OK или определите нужные поля вручную.
  10.  Пометьте флагом Input столбцы, перечисленные в таблице.

Age

YearlyIncome

Region

CommuteDistance

HouseOwnerFlag

TotalChildren

EnglishEducation

LastName

EnglishOccupation

MaritalStatus

FirstName

NumberCarsOwned

Gender

NumberChildrenAtHome

Вы можете выбрать несколько столбцов, удерживая клавишу SHIFT.

Нажмите Next.

В поле Specify Columns' Content and Data Type нажмите Detect. При этом автоматически определяется, содержат ли столбцы с численными данными дискретные, либо непрерывные значения. Например, столбец может содержать информацию о заработной плате с непосредственными значениями сумм (непрерывные значения) или в нём могут содержаться целые числа, отвечающие неким диапазонам значений (1 = <$25,000; 2 = от $25,000 до $50000 и так далее), то есть дискретные значения.

В поле Structure Name введите Targeted Mailing и нажмите Finish

Нажмите Finish. При этом откроется редактор Data mining, отображающий структуру Targeted Mailing, которую вы только что создали, см. Рисунок 5.

Рисунок 5 Страница структуры Targeted Mailing

  •  

Исследование моделей

После того как модели обработаны, вы можете просмотреть их, используя закладку Mining Model Viewer в редакторе Data Mining. При помощи выпадающего списка Mining Model в верхней части закладки можно исследовать модели, входящие в структуру.

Модель Microsoft Decision Trees

Mining Model Viewer по умолчанию открывает модель Targeted Mailing первой в структуре. Tree viewer содержит две закладки, Decision Tree (дерево решений) и Dependency Network (сеть зависимостей).

Decision Tree (Дерево решений)

На странице Decision Tree вы можете просмотреть все модели деревьев, составляющие модель Targeted_Mailing. Для каждого прогнозируемого атрибута модели существует одно дерево, если только не задействовано feature selection. Так как ваша модель содержит всего один прогнозируемый атрибут, Bike Buyer, то и дерево тоже одно. Если бы их было несколько, можно было бы выбрать нужное при помощи Tree box.

Tree viewer по умолчанию показывает только первые три уровня дерева. Чтобы увидеть больше используйте Show Level slider или Default Expansion box. Для более подробной информации по настройке Tree viewer, обратитесь к разделу "Viewing with Tree Viewer" в SQL Server Books Online.

Чтобы создать дерево, показанное на рисунке 6

  1.  Установите Show Level 5
  2.  В списке Background нажмите 1.
    Здесь задаётся состояние прогнозируемого атрибута. Изменяя это свойство, вы можете быстро узнать число случаев попадания покупателя велосипеда в каждый узел. Чем темнее узел, тем больше случаев попадания он содержит.

 

Рисунок 6 Страница Decision Tree для модели Targeted Mailing

Каждый узел в дереве решений несёт в себе следующую информацию:

  •  Условие, по которому попадаем в этот узел из предыдущего. Полный путь к узлу можно узнать из легенды или из подсказки.
  •  Гистограмма, описывающая распределение состояний для прогнозируемого столбца. Число состояний, отображаемых на гистограмме, регулируется при помощи Histogram control.
  •  Концетрацию случаев попадания, если состояние предсказываемого значения определено в контроле Background.

Если включен режим drillthrough ("проваливание" в исходные данные), вы можете просмотреть варианты для узла, кликнув по нему правой кнопкой мыши и выбрав Drillthrough.

Сеть зависимостей (Dependency Network)

На странице Dependency Network показаны отношения между атрибутами, влияющими на прогнозирующую способность модели. Сеть зависимостей для модели Targeted Mailing представлена на рисунке 7.

 

Рисунок 7 Страница Dependency Network модели Targeted Mailing.

Центральный узел на рисунке 7, Bike Buyer, представляет прогнозируемый атрибут модели. Каждый из узлов вокруг него отображает атрибут, влияющий на прогнозируемый. При помощи ползунка на левой стороне страницы можно указать силу показываемых связей. При перемещении ползунка вниз будут показываться только сильные связи.

По легенде цветов внизу окна можно узнать, какой узел является прогнозируемым и какие узлы его определяют.




1. тема Web ~ страница Рецензия Реферат Если к нашему сожалению Вы не нашли здесь необходимого Ва
2. по теме Проектирование моделей стрижек и причесок Выполнение женской стрижки Каскад с окрашиванием вол
3. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ Тема-Электронное правительство
4. ЛАБОРАТОРНАЯ РАБОТА 2 Статические и динамические массивы
5. показатели пищевой ценности какао порошка
6.  ОБЩИЕ ПОЛОЖЕНИЯ Биохимический метод применяют для очистки хозяйственнобытовых и промышленных сточных в
7. практикум является продолжением практикума ldquo;Аналоговые и цифровые интегральные микросхемы и микропроцес
8. Реферат- Социальный педагог- цели, функции, задачи деятельности
9. Расчёт технико-экономической эффективности инвестиций
10. Стратегия развития ИТ