Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

экономической и социальной информации на подмножества по их сходству или различию в соответствии с принятым

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 2.11.2024

72 билет. Методы классификации.

Классификация — это разделение множества объектов технико-экономической и социальной информации на подмножества по их сходству или различию в соответствии с принятыми методами, подразделяемыми на иерархический и фасетный.

Иерархический метод классификации — это последовательное разделение множества объектов на подчиненные классификационные группировки. При этом деление производится сначала по выбранному признаку на крупные классификационные группировки, а затем каждая из них делится по другому признаку на ряд последующих группировок, конкретизируя объект классификации. Таким образом, между классификационными группировками устанавливается подчиненность (иерархия).

Фасетный метод классификации — это параллельное разделение множества объектов на независимые классификационные группировки. В этом случае множество объектов информации описывается набором независимых фасетов (списков), не имеющих жесткой взаимосвязи друг с другом, которые можно использовать отдельно для решения различных задач.

Для формализованного описания заданного множества объектов осуществляется кодирование — присвоение кода классификационной группировке или объекту классификации для обеспечения их однозначной идентификации в классификациях в соответствии с выбранным методом кодирования с помощью знаков (символов). Код — это знак или совокупность знаков, принятых для обозначения классификационной группировки или объекта классификации. Кодирование позволяет производить эффективную автоматизированную обработку информации.

73 билет. Канонические корреляции и  ковариационный анализ.

Классический корреляционный анализ позволяет найти статистические зависимости между двумя переменными, так называемые ду двумя множествами переменных используют методы канонического анализа. Канонический анализ являясь обобщением множественной корреляции как меры связи между одной случайной величиной и множеством других случайных величин, рассматривает связи между множествами случайных величин. При этом ограничивается рассмотрением небольшого числа наиболее коррелированных линейных комбинаций из каждого множества.

В основе анализа канонической корреляции лежит использование канонических корней или канонических переменных, которые рассматриваются как «скрытые» переменные, характеризующие наблюдаемые явления. Число канонических корней равно числу переменных в меньшем множестве.

Практически при определении канонической корреляции строится отдельная матрица корреляций, представляющая собой произведение стандартных корреляционных матриц, характеризующих зависимости между двумя отдельными переменными. Затем вычисляется столько собственных значений полученной матрицы, сколько имеется канонических корней. Если извлечь квадратный корень из полученных собственных значений , получим набор чисел, который можно проинтерпретировать как коэффициенты корреляции. Поскольку они относятся к каноническим переменным, их также называют каноническими корреляциями.

Работу дискриминантного, кластерного и канонического анализа целесообразно оценивать с помощью специальных статистических пакетов, реализующих эти алгоритмы на ЭВМ.

КАНОНИЧЕСКАЯ КОРРЕЛЯЦИЯ

- корреляция между линейными функциями двух множеств случайных величин, характеризуемая максимально возможными значениями коэффициентов корреляции. В теории К. к. случайные величины X1, . .., Xs и Xs+1, . . ., Xs+t,   линейно преобразуются в так наз. канонические случайные величины Y1, ..., Ys и Ys+1, ..., Ys+t- такие, что: а) все величиям Yимеют нулевое математич. ожидание и единичную дисперсию, б) внутри каждого из двух множеств величины Yнекоррелированы, в) любая величина Y из 1-го множества коррелирована лишь с одной величиной из 2-го множества, г) ненулевые коэффициенты корреляции между величинами У из разных множеств имеют максимальное значение.

В частном случае s=l К. к. представляет собой множественную корреляцию между Х 1 и Х 2, ..., X1+t. Преобразование к каноническим случайным величинам соответствует алгебраич. задаче приведения квадратичных форм к канонич. виду. В многомерном статистич. анализе с помощью метода К. к. при изучении взаимосвязи двух множеств компонент вектора наблюдений осуществляется переход к новой системе координат, в к-рой корреляция между Х 1,. .., Xs и Xs+1, . .., Xs+tпроявляется наиболее отчетливо. В результате анализа К. к. может оказаться, что взаимосвязь между двумя множествами полностью описывается корреляцией между несколькими каноническими случайными величинами.

КОВАРИАЦИОННЫЙ АНАЛИЗ

- совокупность методов математич. статистики, относящихся к анализу моделей зависимости среднего значения нек-рой случайной величины У от набора неколичественных факторов Fи, одновременно, от набора количественных факторов х. По отношению к У переменные хназ. сопутствующими; факторы Fзадают сочетания условий качественной природы, при к-рых получены наблюдения У и х, и описываются с помощью так наз. индикаторных переменных; среди сопутствующих и индикаторных переменных могут быть как случайные, так и не случайные (контролируемые в эксперименте); если случайная величина У является вектором, то говорят о многомерном К. а.

Основные теоретические и прикладные проблемы К. а. относятся к линейным моделям. В частности, если анализируется схема из пнаблюдений Y1..., Yn с рсопутствующими переменными и kвозможными типами условий эксперимента, то линейная модель соответствующего К. а. задается уравнениями где индикаторные переменные fij равны 1, если j-e условие эксперимента имело место при наблюдении У,-, и равны 0 в ином случае; коэффициенты qj определяют эффект влияния j-го условия; xi(s)- значение сопутствующей переменной х (s) при к-рой получено наблюдение Yi, i=1,...,n; s=1,..., p; bs(Fi)- значения соответствующих коэффициентов регрессии У по x(s), вообще говоря, зависящие от конкретного сочетания условий эксперимента, т. е. от вектора Fi= (fi1, ...,fik); ei(Fi)- случайные ошибки, имеющие нулевые средние значения. Основное содержание К. а.- в построении статистич. оценок для неизвестных параметров q1, ..., qk; b1, ..., bp и статистич. критериев для проверки различных гипотез относительно значений этих параметров.

Если в модели (*) постулировать априори b1=...=bp=0, то получится модель дисперсионного анализа;если из (*) исключить влияние неколичественных факторов (положить q1=... =qk=0), то получится модель регрессионного анализа. Своим названием К. а. обязан тому обстоятельству, что в его вычислениях используются разбиения ковариаций величин У и Xточно так же, как в дисперсионном анализе используются разбиения суммы квадратов отклонений У.

74 билет. Современные пакеты прикладных программ многомерного статистического анализа.

• Многомерные статистические методы среди множества возможных вероятностно-статистических моделей позволяют обоснованно выбрать ту, которая наилучшим образомсоответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании ограниченного статистического материала.

К области приложения математической статистики могут быть отнесены задачи, связанные с исследованием поведения индивидуума, семьи или другой социально-экономической или производственной единицы, как представителя большой совокупности объектов.

Многомерный экономико-статистический анализ опирается на широкий спектр методов. В учебном пособии рассматриваются некоторые из наиболее используемых методов, а именно: факторный, кластерный и дискриминантный анализы.

Методы многомерной классификации, которые предназначены разделять рассматриваемые совокупности объектов, субъектов или явлений на группы в определенном смысле однородные. Необходимо учитывать, что каждый из рассматриваемых объектов характеризуется большим количеством разных и стохастически связанных признаков. Для решения столь сложных задач классификации применяют кластерный и дискриминантный анализ. Наличие множества исходных признаков, характеризующих процесс функционирования объектов, заставляет отбирать из них наиболее существенные и изучать меньший набор показателей. Чаще исходные признаки подвергаются некоторому преобразованию, которое обеспечивает минимальную потерю информации. Такое решение может быть обеспечено методами снижения размерности, куда относятся факторный анализ. Этот метод позволяет учитывать эффект существенной многомерности данных, дает возможность лаконичного и более простого объяснения многомерных структур. Вскрывает объективно существующие, непосредственно не наблюдаемые закономерности при помощи полученных факторов или главных компонент.

Это дает возможность достаточно просто и точно описать наблюдаемые исходные данные, структуру и характер взаимосвязей между ними. Сжатие информации получается за счет того, что число факторов или главных компонент – новых единиц измерения – используется значительно меньше, чем исходных признаков.

Все перечисленные методы наиболее эффективны при активном применении статистических пакетов прикладных программ. При помощи этих пакетов предоставляется возможным даже восстанавливать пропущенные данные и др. Стандартные статистические методы обработки данных включены в состав электронных таблиц, таких как Excel, Lotus 1-2-3, QuattroPro, и в математические пакеты общего назначения, например Mathсad. Но гораздо большими возможностями обладают специализированные статистические пакеты, позволяющие применять самые современные методы математической статистики для обработки данных. По официальным данным Международного статистического института, число статистических программных продуктов приближается к тысяче. Среди них есть профессиональные статистические пакеты, предназначенные для пользователей, хорошо знакомых с методами математической статистики, и есть пакеты, с которыми могут работать специалисты, не имеющие глубокой математической подготовки; есть пакеты отечественные и созданные зарубежными программистами; различаются программные продукты и по цене.

Среди программных средств данного типа можно выделить узкоспециализированные пакеты, в первую очередь статистические - STATISTICA, SPSS, STADIA, STATGRAPHICS, которые имеют большой набор статистических функций: факторный анализ, регрессионный анализ, кластерный анализ, многомерный анализ, критерии согласия и т. д. Данные программные продукты обычно содержат и средства для визуальной интерпретации полученных результатов: различные графики, диаграммы, представление данных на географической карте.

При анализе данных пользователю статистического программного пакета приходится выполнять вычисления широкого спектра статистик, передавать и преобразовывать данные для их анализа, а также представлять полученные результаты в наглядном виде. Поэтому при выборе того или иного статистического пакета, для сравнения пакетов, необходимо прежде всего обращать внимание на такие характеристики, как:

удобство управления данными (экспорт/импорт данных, их реструктуризация);

• статистическое разнообразие (количество статистических модулей);

• графические возможности (наличие встроенного графического редактора, возможность показа отдельных элементов графика, возможности экспорта графиков).

Кроме того, большое значение имеет удобство работы с пакетом, легкость его освоения (наличие встроенной системы помощи, руководства пользователя, степень удобства управления данными, результатами вычислений, таблицами и графиками), а также скорость произведения вычислений.

Существуют также нестатистические пакеты, решающие задачи классификации(PolyAnalyst, ДА-система, АРГОНАВТ, ЛОРЕГ, пакет ОТЭКС и разнообразные нейросетевые пакеты).

 




1. Западном Западном и СевероВосточном районах
2. Платой за самопожертвование была черная неблагодарность бойфренд вдруг порвал с девушкой и пустился во вс
3. Культура и ответственность человека в хозяйственной деятельности
4. Криминалистическое оружиеведение
5. амплитуду колебаний; 2 циклическую частоту; 3 частоту колебаний; 4 период колебаний
6. Курсовая работа- Прогнозирование развития образования (на примере Новосибирской области).html
7. дидактиканы~ негізгі ережелерін ~сынады Песталоций И
8. Вольовий розвиток дітей 7 року життя Мета- розвиток вольової сфери та навичок довільності у поведінці фор
9. Определение влияния ассортимента ткани на основные технико-экономические показатели работы прядильного и ткацкого производства
10. Сибирский государственный университет телекоммуникаций и информатики МЕТОДИЧЕСКИЕ УКА
11. Система ценообразования в экономике
12. 879 Рюрик Новгородский 879912 Олег Вещий
13. Телекоммуникационные проекты в образовании
14. Государственная служба и административное право
15. Fion Фэндом- Ориджиналы Персонажи- м-м Рейтинг- NC17 Жанры- Слэш яой Ангст Предупреждения- Насилие Изн
16. Проблема экономического роста в странах Центральной и Восточной Европы
17. Курсовая работа- Структуры данных и алгоритмы
18. Использование небулайзеров в клинической практике
19. Вариант 1 Вариант 2 Вариант 3 Вариант 4 Вариант 5
20. ТЕМА 13- Учет доходов и финансовых результатов деятельности предприятия Методологические основы формир