Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Dt Mining пока не имеет устоявшегося перевода на русский язык

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 9.11.2024

25.Понятие data mining

Data Mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пятецким-Шапиро в 1989 году[1][2][3].

Английское словосочетание «Data Mining» пока не имеет устоявшегося перевода на русский язык. При передаче на русском языке используются следующие словосочетания[4]: просев информации, добыча данных, извлечение данных, а, также,интеллектуальный анализ данных[5][6][7]. Более полным и точным является словосочетание «обнаружение знаний в базах данных» (англ. knowledge discovering in databases, KDD).

Основу методов Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решенийискусственных нейронных сетейгенетических алгоритмовэволюционного программированияассоциативной памятинечёткой логики. К методам Data Mining нередко относят статистические методы(дескриптивный анализкорреляционный и регрессионный анализфакторный анализдисперсионный анализкомпонентный анализдискриминантный анализанализ временных рядованализ выживаемостианализ связей). Такие методы, однако, предполагают некоторые априорные представления об анализируемых данных, что несколько расходится с целями Data Mining(обнаружение ранее неизвестных нетривиальных и практически полезных знаний).

Одно из важнейших назначений методов Data Mining состоит в наглядном представлении результатов вычислений (визуализация), что позволяет использовать инструментарий Data Mining людьми, не имеющими специальной математической подготовки. В то же время, применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой.


26. Области применения data mining

Постановка задачи[править | править исходный текст]

Первоначально задача ставится следующим образом:

  1.  имеется достаточно крупная база данных;
  2.  предполагается, что в базе данных находятся некие «скрытые знания».

Необходимо разработать методы обнаружения знаний, скрытых в больших объёмах исходных «сырых» данных. В текущих условия глобальной конкуренции именно найденные закономерности (знания) могут быть источником дополнительного конкурентного преимущества.

Что означает «скрытые знания»? Это должны быть обязательно знания:

  1.  ранее не известные — то есть такие знания, которые должны быть новыми (а не подтверждающими какие-то ранее полученные сведения);
  2.  нетривиальные — то есть такие, которые нельзя просто так увидеть (при непосредственном визуальном анализе данных или при вычислении простых статистических характеристик);
  3.  практически полезные — то есть такие знания, которые представляют ценность для исследователя или потребителя;
  4.  доступные для интерпретации — то есть такие знания, которые легко представить в наглядной для пользователя форме и легко объяснить в терминах предметной области.

Эти требования во многом определяют суть методов Data mining и то, в каком виде и в каком соотношении в технологии Data mining используются системы управления базами данных, статистические методы анализа и методы искусственного интеллекта.

Data mining и базы данных[править | править исходный текст]

Методы Data mining имеет смысл применять только для достаточно больших баз данных. В каждой конкретной области исследований существует свой критерий «великости» базы данных.

Развитие технологий баз данных сначала привело к созданию специализированного языка — языка запросов к базам данных. Для реляционных баз данных — это язык SQL, который предоставил широкие возможности для создания, изменения и извлечения хранимых данных. Затем возникла необходимость в получении аналитической информации (например, информации о деятельности предприятия за определённый период), и тут оказалось, что традиционные реляционные базы данных, хорошо приспособленные, например, для ведения оперативного учёта на предприятии, плохо приспособлены для проведения анализа. Это привело, в свою очередь, к созданию т. н. «хранилищ данных», сама структура которых наилучшим способом соответствует проведению всестороннего математического анализа.

Data mining и искусственный интеллект[править | править исходный текст]

Знания, добываемые методами Data mining, принято представлять в виде закономерностей (паттернов). В качестве таких выступают:

  1.  ассоциативные правила;
  2.  деревья решений;
  3.  кластеры;
  4.  математические функции.

Алгоритмы поиска таких закономерностей находятся на пересечении областей: Искусственный интеллект, Математическая статистика, Математическое программирование, Визуализация, OLAP.

Задачи[править | править исходный текст]

Задачи, решаемые методами Data Mining, принято разделять на описательные (англ. descriptive) и предсказательные (англ. predictive).

В описательных задачах самое главное — это дать наглядное описание имеющихся скрытых закономерностей, в то время как в предсказательных задачах на первом плане стоит вопрос о предсказании для тех случаев, для которых данных ещё нет.

К описательным задачам относятся:

  1.  поиск ассоциативных правил или паттернов (образцов);
  2.  группировка объектов, кластерный анализ;
  3.  построение регрессионной модели.

К предсказательным задачам относятся:

  1.  классификация объектов (для заранее заданных классов);
  2.  регрессионный анализ, анализ временны́х рядов.

Алгоритмы обучения[править | править исходный текст]

Для задач классификации характерно «обучение с учителем», при котором построение (обучение) модели производится по выборке, содержащей входные и выходные векторы.

Для задач кластеризации и ассоциации применяется «обучение без учителя», при котором построение модели производится по выборке, в которой нет выходного параметра. Значение выходного параметра («относится к кластеру …», «похож на вектор …») подбирается автоматически в процессе обучения.

Для задач сокращения описания характерно отсутствие разделения на входные и выходные векторы. Начиная с классических работ К. Пирсона по методу главных компонент, основное внимание уделяется аппроксимации данных.

Этапы обучения[править | править исходный текст]

Выделяется[где?] типичный ряд этапов решения задач методами Data Mining:

  1.  постановка задачи анализа;
  2.  Сбор данных;
  3.  Подготовка данных (фильтрация, дополнение, кодирование);
  4.  Выбор модели (алгоритма анализа данных);
  5.  Подбор параметров модели и алгоритма обучения;
  6.  Обучение модели (автоматический поиск остальных параметров модели);
  7.  Анализ качества обучения, если неудовлетворительный переход на п. 5 или п. 4;
  8.  Анализ выявленных закономерностей, если неудовлетворительный переход на п. 1, 4 или 5.

Подготовка данных[править | править исходный текст]

Перед использованием алгоритмов Data Mining необходимо произвести подготовку набора анализируемых данных. Так как ИАД может обнаружить только присутствующие в данных закономерности, исходные данные с одной стороны должны иметь достаточный объем, чтобы эти закономерности в них присутствовали, а с другой — быть достаточно компактными, чтобы анализ занял приемлемое время. Чаще всего в качестве исходных данных выступают хранилища или витрины данных. Подготовка необходима для анализа многомерных данных до кластеризации или интеллектуального анализа данных.

Далее данные очищаются. Очистка удаляет выборки с шумами и пропущенными данными.

Очищенные данные сводятся к наборам признаков (или векторам, если алгоритм может работать только с векторами фиксированной размерности), один набор признаков на наблюдение. Набор признаков формируется в соответствии с гипотезами о том, какие признаки сырых данных имеют высокую прогнозную силу в расчете на требуемую вычислительную мощность для обработки. Например, черно-белое изображение лица размером 100×100 пикселей содержит 10 тыс. бит сырых данных. Они могут быть преобразованы в вектор признаков путем обнаружения в изображении глаз и рта. В итоге происходит уменьшение объема данных с 10 тыс. бит до списка кодов положения, значительно уменьшая объем анализируемых данных, а значит и время анализа.

Ряд алгоритмов умеют обрабатывать пропущенные данные, имеющие прогностическую силу (например, отсутствие у клиента покупок определенного вида). Скажем, при использовании метода ассоциативных правил (англ.)русск. обрабатываются не векторы признаков, а наборы переменной размерности.

Выбор целевой функции будет зависеть от того, что является целью анализа; выбор «правильной» функции имеет основополагающее значение для успешного интеллектуального анализа данных.

Наблюдения делятся на две категории — обучающий набор и тестовый набор. Обучающий набор используется для «обучения» алгоритма Data Mining, а тестовый набор — для проверки найденных закономерностей.


27. Неспециализированные программные пакеты экономического анализа

К неспециализированному программному обеспечению относят текстовые редакторы и электронные таблицы, как в рамках офисных пакетов, так и отдельных, самостоятельных программ. К первым относятся Microsoft Office, а так же офисные пакеты от Sun Microsystems – Star Office, офисный пакет от канадской фирмы Corel Corp. - WordPerfect Office, пакет офисных программ OpenOffice.org (распространяется на бесплатной основе), созданный в рамках проекта Open Source Projects и другие.

Ко второй группе универсального программного обеспечения относят независимые текстовые редакторы и электронные таблицы. Наиболее популярными программными продуктами среди текстовых редакторов являются PolyEdit, AbiWord, PatriotXP, CryptEdit. Для подготовки финансовой части бизнес-плана можно использовать – Formula One, Tabad, SuperCalc и др.

Необходимо отметить, что если бизнес-план создается в офисном пакете, то нет необходимости в какой-либо дополнительной программе. Текстовая часть создается в текстовом редакторе пакета, а расчетно-аналитическая – в электронных таблицах того же офисного пакета. При этом данные из электронных таблиц могут быть свободно импортированы в текстовый редактор. В случае использования независимых программных продуктов необходимо либо обеспечить или совместимость между приложениями, либо расчетно-аналитическую часть бизнес-плана создавать отдельно (без импортирования расчетно-аналитических данных в текстовый редактор).

Как показала практика, в большинстве случаев разработка бизнес-плана с использованием универсального программного обеспечения ведется в офисном пакете Microsoft Office. Этот обстоятельство говорит о том, что пользователи считают его наиболее удобным как для подготовки текстовой, так и расчетно-аналитической составляющих бизнес-плана. В некоторых случаях в нем же разрабатываются и презентации (для привлечения и первичного ознакомления инвесторов и партнеров).

Для подготовки расчетно-аналитической части бизнес-плана могут быть использованы и специальное программное обеспечение для статистических вычислений и анализа, такое как SPSS, StatSoft Statistica, Statit Professional и др.. Статистические программы обладают мощным аппаратом статистических процедур, благодаря которому, можно быстро обработать исходные данные и получить информацию, необходимую при бизнес-планировании, принятии решений и подготовки финансовой части бизнес-плана


28.Специализированные программные пакеты экономического анализа

Работа со специализированными программными продуктами, как правило, осуществляется в четыре этапа. На первом этапе производится анализ условий разработки и осуществления проекта, формирование и ввод необходимых исходных данных для проведения расчетов, анализа и если позволяет программное обеспечение, то и текстовой составляющей бизнес-плана. На втором этапе с помощью инструментария программного обеспечения осуществляется автоматический расчет финансово-экономических показателей, формируются инвестиционно-финансовая отчетность проекта. Затем проводится финансово-экономический анализ привлекательности инвестиционного проекта, анализ его чувствительности к колебаниям конъюнктуры рынка и изменениям макроэкономических условий деятельности. На заключительном этапе программное обеспечение позволяет автоматически подготовить или финансовую часть бизнес-плана, или ТЭО, или бизнес-план целиком в зависимости от возможностей программы.

На данный момент на российском рынке специализированного программного обеспечения для расчета и анализа финансово-инвестиционной части бизнес-плана и бизнес-плана целиком существует более десятка как отечественных, так и зарубежных программных продуктов.

Среди отечественных можно выделить следующие:

 - Project Expert консалтинговой фирмы «Про-Инвест Консалтинг»;

- Инэк-Аналитик консалтинговой фирмы «Инэк»;

- ТЭО-Инвест Института проблем управления РАН;

- Альт-Инвест исследовательско-консультационной фирмы «Альт»;

- Business Plan PL консалтинговой фирмы ЗАО «Общество финансового и экономического развития предприятий РОФЭР»;

- «Мастерская бизнес-планирования» фирмы ООО «Корпоративный Менеджмент»;

- «Мастер проектов» консалтинговой фирмы «Консультационная группа "Воронов и Максимов"»;

и другие.

Среди наиболее известных зарубежных программ можно выделить:

- COMFAR (Computer Model for Feasibility Analysis and Reporting), разработчиком которой является Комитет по промышленному развитию при ООН (UNIDO).

Представленные программные продукты позволяют:

- детально описать и провести финансово-экономический анализ проекта;

- разрабатывать различные варианты, схемы финансирования и привлечения инвестиций и выбрать наиболее оптимальный вариант;

- проводить анализ коммерческой эффективности инвестиционного проекта в целом;

- смоделировать различные сценарии развития инвестиционного проекта, варьируя значения параметров, влияющих на его финансовые результаты;

- сформировать бюджет инвестиционного проекта с учетом изменений внешний среды организации (инфляции, налогового окружения, ставки рефинансирования ЦБ РФ);

- произвести анализ чувствительности к изменению различных исходных параметров на эффективность проекта;

- в зависимости от возможности конкретной программы подготовить к печати документацию - инвестиционно-финансовую часть бизнес-плана, ТЭО или бизнес план целиком.

Кроме указанных характеристик, у представленных программных продуктов имеются и другие специальные возможности.

Рассмотрим общие достоинства, недостатки и возможности универсального, специального и специализированного программного обеспечения для разработки бизнес-плана.

29.Целевые аналитические программные пакеты

Компьютерное моделирование наряду с естественным экспериментом прочно заняло свои позиции как метод изучения сложных или опасных объектов, процессов и явлений в природе, технике и естественных науках. Бурное создание и развитие в последней четверти XX века систем компьютерной математики (СКМ) – Maple, Mathcad, Mathematica, MATLAB и другие, которые явились новым типом программного обеспечения, дало возможность проводить моделирование объектов, изучаемых в математике – понятий, теорем, методов решения задач.
В ВЗФЭИ ведется планомерная работа по повышению качества подготовки выпускников с высшим образованием по экономическим специальностям на основе применения информационно-коммуникационных технологий (ИКТ) и аналитических (экономико-математических, статистических, эконометрических и др.) методов. Для компьютерной поддержки экономического анализа используется ряд специализированных информационных систем. Это, например, информационные системы бухгалтерского учета, анализа и аудита (1С:Бухгалтерия, Парус, БЭСТ и др.), целевые аналитические программные пакеты, реализующие конкретные методики анализа (ОЛИМП:ФинЭксперт, ОЛИМП:СтатЭксперт, Audit Expert, Project Expert и др.), встроенные в интегрированные экономические информационные системы аналитические модули (Финансовый анализ, Управление финансами и др.).
А в целом одной из главных становится задача выработки осознанных умений и навыков по рациональному применению вычислительной мощи компьютеров. При этом достигаются как дидактические, так и воспитательные цели, повышается уровень математической подготовки, ознакомления с современными ИКТ и увеличивается профессиональная направленность математического и информатического обучения будущих экономистов.


30. Информационные системы имеющие встроенные аналитические подсистемы

Внедрение информационно-аналитических систем (ИАС) обеспечивает решение ключевой для руководителя задачи – осуществления эффективного управления в масштабах предприятий, холдингов, отраслей на основе стратегически целостного анализа бизнеса. В рамках управления система обеспечивает решение задач динамического финансового планирования, прогнозирования, бюджетирования и получения консолидированной отчетности. ИАС позволяет осуществлять среднесрочный и стратегический анализ деятельности предприятий на основе определения ключевых индикаторов эффективности бизнеса (KPI/KeyPerformanceIndicator) и сбалансированной системы показателей (BSC/BalancedScorecard). Внедрение ИАС вносит реальный вклад в процесс возврата инвестиций (ROI/ReturnofInvestments). Использование в работе современных технологий поддержки принятия решений позволяет снизить риски, связанные с принятием необоснованных решений, корректировать тактику и стратегию поведения на рынке в условиях быстро меняющейся ситуации.

Информационно-аналитические системы призваны на основе данных, получаемых в режиме реального времени, помогать в принятии стратегических решений. Комплекс информационно-аналитических систем затрагивает всю управленческую вертикаль: корпоративную отчетность, финансово-экономическое планирование и стратегическое планирование.

Информационно-аналитические системы являются надстройкой над уже функционирующими на предприятии информационными приложениями и не требуют их замены; эти системы аккумулируют данные по всем видам деятельности компании - от состояния складов до финансовой и бухгалтерской отчетности.

Информационно аналитические системы верхнего уровня служат для принятия стратегических решений. Они позволяют руководителю решать следующие задачи:

  1.  составление консолидированной отчетности и предоставление сводной информации о деятельности предприятия (финансовые, производственные и другие показатели, динамика их изменений и тенденции)
  2.  анализ деятельности дочерних предприятий, филиалов и подразделений компании (анализ доходности, затрат, выполнения плана)
  3.  анализ финансовой деятельности (основные финансовые показатели, тенденции, взаиморасчеты), оптимизация финансовых потоков, реальная оценка себестоимости продукции
  4.  проведение комплексной оценки деятельности предприятия, основанной на постоянном контроле четырех наиболее существенных ее аспектов (финансы, отношения с внешним миром, внутреннее состояние компании, инновации)
  5.  анализ сбытовых процессов (составление плана, контроль исполнения распоряжений, расчеты за отгруженную продукцию, прогноз поступления средств, прогноз спроса)

Информационно-аналитические системы подразделений предполагают большую детализацию и более сложную аналитическую обработку. Эти системы помогают подготовить информацию для принятия решений в области сбыта, продуктового предложения, финансового планирования.




1. Война 1812 года в стихотворениях В Жуковского Певец во стане русских воинов и К Батюшкова К Дашкову
2. Прививк
3. Детская хореографическая школа г
4. .Ал~ы с~з 2
5. Реферат на тему- МІСЯЦЬ ПРИРОДНИЙ СУПУТНИК ЗЕМЛІ 1
6. Статья посвящена анализу структуры специфики аудитории механизма формирования контента интернетпорталов
7. Акустоэлектрические преобразователи. Принципы работы. Особенности конструкции и использования
8. Лабораторная работа 9
9. В останні роки в розвинених країнах був введений і розповсюджений подібно терміну оінженерія мате
10. Личная продажа в комплексе маркетинговых коммуникаций туристского предприятия.html
11. Психология формирования показаний
12. тема является актуальной так как до конца XIX века экономика в целом и ее наиболее продвинутая часть ~ промышл
13. Анализ экономической деятельности предприятия
14. ТЕМАТИКИ КАКАЯТО РАБОТА по дисциплине Базы данных и экспертные системы на тему Экс
15. Расы и их происхождение
16. тема. Графический интерфейс пользователя
17. Тема ВКР Кредитоспособность заёмщика и методы её оценки Специальность 080110
18. Тоска по весне
19. ну Тернопільської обл
20. методическое пособие для студентов заочного отделения юридического факультета и факультета управления