Элементы математической статистики и корреляционного анализа

Обработка данных наблюдений и проверка гипотез Статистическое распределение выборки Расчет сводных характеристик выборки Расчет интервальных оценок генеральных параметров Проверка гипотезы о нормальном распределении генеральной совокупности критерию Пирсона Построение гистограммы выборки и теоретической нормальной прямой...

2015-10-24

1.26 MB

3 чел.


Поделитесь работой в социальных сетях

Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск


Балтийский военно-морской институт

им. Адмирала Ф. Ф. Ушакова (филиал) федерального государственного военного образовательного учреждения  высшего профессионального образования «Военный учебно-научный центр Военно-морской флот «Военно-морская академия

имени адмирала флота Советского Союза Н. Г. Кузнецова»

Курсовая работа

«Элементы математической статистики и корреляционного анализа»

                                                         Выполнил:

                                                                                 Курсант 228 класса Хачатурян А.А.

                                           Руководитель:

                                                              Доцент Коноваленко Т. А.

Калининград 2015

Содержание

ВВЕДЕНИЕ

ГЛАВА 1

Обработка данных наблюдений и проверка гипотез

Статистическое распределение выборки

Расчет сводных характеристик выборки

Расчет интервальных оценок генеральных параметров

Проверка гипотезы о нормальном распределении генеральной совокупности критерию Пирсона

Построение гистограммы выборки и теоретической нормальной прямой

Вывод

ГЛАВА 2

Элементы корреляционного анализа

Корреляционная таблица и корреляционное поле

Нахождение выборочного коэффициента корреляции

Нахождение доверительного интервала для генерального коэффициента корреляции

Нахождение доверительного выборочного уравнения прямой регрессии Y на X т построения ее графика

ЛИТЕРАТУРА
ЗАКЛЮЧЕНИЕ ПРЕПОДАВАТЕЛЯ

 

ВВЕДЕНИЕ

Наблюдаемые нами события (явления) можно подразделить на следующие три вида: достоверные, невозможные и случайные. Невозможно учесть влияние на результат всех причин, поскольку число их очень велико и законы их действий неизвестны. Поэтому теория вероятности не ставит перед собой задачу предсказать, произойдет единичное событие или нет, - она просто не в силах это сделать.

По – иному обстоит дело, если рассматриваются случайные события, которые могут многократно наблюдаться при осуществлении одних и тех же условий S, т. е. если речь идет о массовых однородных случайных событий. Оказывается, что достаточно большое число однородных случайных событий независимо от их конкретной природы подчиняется определенным закономерностям, а именно вероятностным закономерностям. Установлением этих закономерностей и занимается теория вероятности. Итак, предметом теории вероятности является изучение вероятностных закономерностей однородных массовых случайных событий. Знание закономерностей которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.

Методы теории вероятности широко применяются в различных отраслях естествознания и техники. В последние годы методы теории вероятности все шире и шире проникают в различные области науки и техники, способствуя их прогрессу.

Краткая историческая справка.

Первые работы, в которых зарождались основные понятия теории вероятностей, представляли собой попытки создания теории азартных игр (Кардано, Гюйгенс, Паскаль, Ферма и другие в XVI–XVII вв.).

Следующий этап развития теории вероятностей связан с именем Якоба Бернулли (1654–1705). Доказанная им теорема, получившая впоследствии название «Закона больших чисел», была первым теоретическим обоснованием накопленных ранее фактов.

Дальнейшими успехами теория вероятностей обязана Муавру, Лапласу, Гауссу, Пуассону и др.

Новый, наиболее плодотворный период связан с именами П. Л. Чебышева (1821–1894) и его учеников А. А.Маркова (1856–1922) и А. М.Ляпунова (1857–1918). В этот период теория вероятностей становится стройной математической наукой. Ее последующее развитие обязано в первую очередь русским и советским математикам (С. Н. Бернштейн, В. И. Романовский, А. Н. Колмогоров, А. Я. Хинчин, Б. В. Гнеденко, Н. В. Смирнов и др.). В настоящее время ведущая роль в создании новых ветвей теории вероятностей также принадлежит советским математикам.

Вариант № 38

ГЛАВА I

Обработка данных наблюдений и проверка гипотез

Задание: В результате независимых измерений получены n значений ошибки точности настройки РПУ на заданную частоту: х1, х2,…хn. Произвести полный статистический анализ данных выборки и сделать соответствующие выводы.

Значения выборки

0,637

1,121

0,409

1,082

-0,263

0,267

1,627

0,061

-1,114

-0,529

-0,142

0,658

-0,964

-0,586

0,799

-0,394

-0,036

0,507

0,882

-0,856

-0,118

0,678

-1,414

0,679

-0,276

0,247

1,469

-0,847

-0,032

0,379

-0,973

0,522

-1,191

0,091

1,468

0,486

1,642

0,185

0,838

-1,805

0,820

-0,872

-0,090

-0,304

-0,266

-0,426

-0,358

-0,866

-2,716

-0,592

0,243

1,594

-1,116

0,823

-1,473

-0,822

0,109

-0,156

-1,248

-1,266

0,238

0,676

-1,387

0,346

0,702

-0,220

-1,084

-0,406

-0,537

1,071

-1,566

0,318

-0,454

-0,402

-0.383

0,932

0,367

0,575

1,214

0.167

-0,833

-0,992

-0,266

-1,214

-0,348

-0,039

0,529

1,246

1,353

0,192

0,275

0,278

0,557

1,511

-1,447

-0,163

1,392

0,004

-0,184

0,495

min=

max=

Статическое распределение выборки

  1.  По данным выборки найти:

а) размах варьирования: R = xmax – xmin,

R= 1,642-(-2.716)= 4,4

б) количество интервалов (разрядов):

к=7

в) длину разряда: 

h= 0,6

Интервал (-2,7 ; 1,6) расширим до интервала (-3 ; 1,9). Сдвиг в каждую стороны при этом не превысит: 

Для нового интервала изменения признака (-3;1,9) при  k=7  длина разряда получается равной 

  1.  Произведем группировку опытных данных и построим интервальный вариационный ряд. Расчет оформим в виде таблицы 1.

Таблица №1

Границы интервала

[-3;-2,3)

[-2,3;-1,6)

[-1,6;-0,9)

[-0,9;-0,2)

[-0,2;0,5)

[0,5;1,2)

[1,2;1,9)

Частот

1

1

14

24

29

20

11

Относительные частоты

Накопленные частоты ∑

1

2

16

40

69

89

100

-

n  -

Расчет сводных характеристик выборки

  1.  Вычислим моду  и медиану  выборочного распределения.

  1.      По интервальному вариационному ряду, полученному в §1 составить дискретный вариационный ряд в виде таблицы 2, в котором в качестве вариант берём середины разрядов


Таблица № 2

Вычислим выборочную среднюю  (математическое ожидание) и выборочную дисперсию :


             

  1.  Для расчета сводных характеристик выборки по методу произведений составим таблицу 3.

Таблица № 3

h=

Контроль расчетов производим по формуле:

  1.  Вычислим начальные условные эмпирические моменты:


  

  1.  Используя начальные моменты , вычислим центральные моменты: 


  1.  Найдем выборочную среднюю (выборочное математическое ожидание):

где, С = 0,09

  1.  Вычислим выборочную дисперсию и исправленную выборочную дисперсию:


  1.  Найдем выборочное среднее квадратическое отклонение (с.к.о.) и исправленное выборочное с.к.о.: 


  1.  Определим, чему равны выборочная асимметрия и выборочный эксцесс: 




Расчет интервальных оценок генеральных параметров

Построим доверительные интервалы для оценки генерального математического ожидания mx и генерального с.к.о. σх. Для этого по заданной доверительной вероятности (надежности) γ из таблицы функции Лапласа найдем значение аргумента tγ этой функции, для которого Ф(tγ) = γ.




 

Используя найденное tγ, рассчитаем границы доверительного интервала для 

Интервальную оценку генерального с. к. о. определим по одной из формул:

В данном варианте q<1 то               <σx<                     

Проверка гипотезы о нормальном распределении
генеральной совокупности по критерию Пирсона

Для того, чтобы при заданном уровне значимости α = 1 – γ проверить гипотезу о нормальном распределении обследуемого признака X генеральной совокупности, заполним таблицу 5.

Таблица №5

Контроль вычислений производим по формуле:

Обозначим сумму элементов восьмого столбца , и для заданного уровня значимости α числа свободы р = k – 3 находим критическую 

точку  (α; р)

 ВЫВОД: так как, то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).

Построение гистограммы выборки и теоретической 
нормальной кривой

1. Для построения гистограммы в выбранной системе координат на оси абсцисс откладываем разряды, а на каждом из разрядов как на основании строим прямоугольник с высотой , составляя таблицу 6.

Таблица №6

Разряды

На этом же графике строим гипотетическую (предположительную) теоретическую нормальную кривую. Для этого берем середины разрядов хi и выравнивающие частоты ni из таблицы 5. Эти данные заносим в таблицу 7.

Таблица №7

наносим точки с координатами и соединяем их плавной линией, получая искомую кривую. 

ВЫВОД: В данной части курсовой работы проверена гипотеза Пирсона, ее нет оснований отвергнуть, другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).


Разряды


-1.6


-1.1


-0.6


-0.1


0.4


0.9


1.4


1.9


2.4


2.9



0,12


0,18


0,26


0,38


0,32


0,40


0,26


0,04


0,02


0,06


В последней строке результаты вычислений округлим до 0,01.

На этом же графике строим гипотетическую (предположительную) теоретическую нормальную кривую. Для этого берем середины разрядов хi и выравнивающие частоты ni из таблицы 5. Эти данные заносим в таблицу 7.

Таблица №7


xi


-1.6


-1.1


-0.6


-0.1


0.4


0.9


1.4


1.9


2.4


2.9



0,12


0,23


0,35


0,41


0,38


0,27


0,15


0,07


0,024


0,006


наносим точки с координатами и соединяем их плавной линией, получая искомую кривую. 

ГЛАВА II

Элементы корреляционного анализа

Вариант №18

Дано: Результаты исследований зависимости между случайными величинами X и Y представлены в виде таблицы 8: 

Таблица №8

Y


X


30


35


40


45


50


55


n
y


45


4


2






6


55



5


3





8


65




5


45


5



55


75




7


8


2



17


85





4


3


7


14


n
x


4


7


15


57


10


7





Произвести корреляционный анализ зависимости Y от X, для чего:
Построить корреляционное поле;

  1.  Найти выборочный коэффициент корреляции ;
  2.  Получить доверительный интервал rxy для с надежностью γ;
  3.  Найти выборочное уравнение прямой регрессии Y на X;
  4.  В выбранной системе координат построить точки (xi, yi) и выборочное уравнение регрессии Y на X.


§1. Корреляционная таблица и корреляционное поле

Представим данные корреляционной таблицы в виде корреляционного поля. Для этого в выбранной системе координат изобразим точки (xi, yj) и рядом с каждой точкой укажем, если это позволит масштаб, соответствующую частоту nxy. По расположению точек можно сделать предположение о наличии (или отсутствии) линейной корреляционной зависимости между обследуемыми признаками X и Y.

Для данных таблицы 8 корреляционное поле имеет вид:

         Расположение точек говорит о наличии положительной корреляции между признаками X и Y.

§2.  Нахождение выборочного коэффициента корреляции

Вычисления можно значительно упростить, если перейти от истинных вариант xi, yj к условным ui, vj соответственно, а именно:




C1 = 45

h1 = 5

u1 = -3

u2 = -2

u3 = -1

u4 = 0

u5 = 1

u6 = 2


C2 = 65

h2 = 10

v1 = -1

v2 = 0

v3 = 1

v4 = 2


Формула для вычисления эмпирического коэффициента корреляции в условных вариантах имеет вид:

Для нахождения  составим расчетную таблицу 9.

Таблица №9


xi


ui


ni


niui


niui2


(
ui + 1)


(
ui + 1)2


ni(ui + 1)2


30


-3


4


-12


36


-2


4


16


35


-2


7


-14


28


-1


1


7


40


-1


15


-15


15


0


0


0


45


0


57


0


0


1


1


57


50


1


10


10


10


2


4


40


55


2


7


14


28


3


9


63




100


-17


117




183


Контроль 

,

то есть вычисления верны

Так как , то 



Аналогичные вычисления проводим для
 v в таблице 10.

Таблица №10


yj


vj


nj


njvj


njvj 2


(
vj + 1)


(
vj + 1)2


nj(vj + 1)2


45


-2


6


-12


24


-1


1


6


55


-1


8


-8


8


0


0


0


65


0


55


0


0


1


1


55


75


1


17


17


17


2


4


68


85


2


4


28


56


3


9


126




100


25


105




255


ui

vj 


-3


-2


-1


0


1


2




-3




-12




-4














-16


48



4




2















-12




-6
















-2







-10




-3











-13


26






5




3















-10




-6













-1







-




-5




0




5





0


0









5




45




5












-5




-45




-5







0










-7




0




2




0


-5


0









7




8




2












0




0




0







1













0




3





17


17












4




3















4




3








-12


-16


-11


-41


-2


7





36


32


11


0


-2


14



контроль


Контроль вычислений производим по формуле: 

вычисления верны.

Для вычисления  требуется еще найти. Для ее нахождения составим корреляционную таблицу 11 в условных вариантах.

Подставив найденные значения в формулу (*), получим

Таблица №11



§3. Нахождение доверительного интервала 
для генерального коэффициента корреляции

Задана надежность γ = 0,99. Доверительный интервал для генерального коэффициента корреляции rxy имеет вид:

 

Следовательно с вероятностью 0,99 доверительный интервал имеет вид:



§4. Нахождение выборочного уравнения прямой регрессии Y на X и построение ее графика

Общий вид уравнения прямой линии регрессии Y на X имеет вид:












          Полученное уравнение регрессии показывает, как в среднем изменяется значение признака Y в зависимости от изменения признака Х.
В выбранной системе координат строим прямую и точки (xi, yi) корреляционного поля.

Таблица для построения графика


30


35


40


45


50


55


43,877


52,225


60,572


68,919


77,266


85,613


ВЫВОД: Построив корреляционное поле мы убеждаемся, что расположение точек говорит о наличии положительной корреляции между Х и Y. По расположению точек можно судить о линейной зависимости между Х и Y.

Заключение

В проделанной курсовой работе была предоставлена возможность проверить гипотезу Пирсона, опираясь на полученные результаты, я могу утверждать, что эмпирические и теоретические частоты различаются незначительно. Так же был проведен корреляционный анализ, была выявлена сильная линейная зависимость между величинами X и Y 

Список использованной литературы

1. Гмурман В.Е. «Теория вероятностей математической статистики» – М.: Высшая школа, 1999 г.

2. «Пособие и методические указания к выполнению курсовой работы» – Калининград: 1998 г.



 

Другие похожие работы, которые могут вас заинтересовать.
2581. ЭЛЕМЕНТЫ КОРРЕЛЯЦИОННОГО АНАЛИЗА 54.63 KB
  Первая задача теории корреляции – установить форму корреляционной связи то есть вид функции регрессии линейная квадратичная и так далее. Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным Пусть имеются две случайные величины и проводится их измерение.
21471. Анализ произведений Л.Н.Толстого и А.П.Чехова с помощью описательного метода математической статистики 57.5 KB
  Имя великого русского писателя Льва Николаевича Толстого известно всем. Толстого и А. Имя великого русского писателя Льва Николаевича Толстого известно всем. Пушкин в Евгение Онегине. обращает на это внимание: Ей чтенье нравилось болеНикто ей в этом не мешал И чем роман тянулся долеТем ей он боле угождал Казалось бы что рассказы-сценки рассказы-анекдоты небольшие повести Чехова совершенно несопоставимы с...
7128. Элементы математической логики 3.98 MB
  Не всякое предложение является высказыванием. В частности все вопросительные и восклицательные предложения не являются высказываниями, а также предложения, являющиеся определением чего-то
16744. Применение методов математической статистики для исследования медико-демографических процессов в регионах России 9.93 KB
  Исследование социально-экономических экологических природно-климатических и психологических факторов влияющих на медико-демографические тенденции и состояние здоровья населения регионов России является актуальной задачей для современного научного сообщества. была сформирована в виде информационной системы состоящей из следующих блоков: социально-демографический состав населения экология и природно-климатические условия социально-экономическое развитие доступность медицинских услуг медико-демографические показатели социальный стресс....
1813. Задачи и уравнения математической физики 1.74 MB
  Составим таблицу рассчитанных и теоретических значений первых восьми собственных частот колебаний стержня, а так же их относительных погрешностей. Расчетные формулы для определения собственных частот и форм колебаний стержня (одномерное волновое уравнение)
12879. Разработка и реализация математической модели двухключевой криптосистемы 279.48 KB
  Для шифрования информации и организации защиты сетей в России активно используются западные продукты. Это разного рода программы защиты от несанкционированного доступа, а также шифрования файлов, — начиная от Norton Utilities и архиваторов типа PKZIP и заканчивая серьезными приложениями уровня PGP (Pretty Good Private). Даже обычные текстовые редакторы и электронные таблицы содержат те или иные криптографические средства.
10172. Основные понятия и уравнения интегральной математической модели пожара в помещении 53.24 KB
  Основные понятия и уравнения интегральной математической модели пожара в помещении. Основные понятия математической модели пожара в помещении. Допущения интегрального метода термодинамического анализа пожара.
21263. Разработка математической модели и автоматизация технологии построения карты изолиний (на примере «Лесного» месторождения, объект зеленая свита) 159.98 KB
  Точечная аппроксимация поверхности степенными полиномами. Разложение функции поверхности в ряд Фурье по ортонормированной системе полиномов Лежандра. линии соединяющие на земной поверхности точки одинаковой высоты - основной способ-изображения рельефа на топографических картах. Такие системы изолиний отображают поверхности реальные например рельеф местности или абстрактные например поверхность годового слоя осадков.
13423. Методы правовой статистики 7.86 KB
  Любое статистическое исследование начинается вопервых с получения исходных статистических данных например с учета правонарушений судебных решений или других юридически значимых фактов вовторых с обобщения установленных фактов в соответствующую совокупность полученные данные по какимлибо признакам сводятся в различных формах отчетности. Программа статистической сводки включает следующие этапы: разработка системы показателей характеризующих преступность или другое социальноправовое явление в целом и его отдельные группы;...
11759. Основы правовой статистики 1.34 MB
  При этом правовые явления и процессы рассматриваются в динамике развитии; взаимосвязи что позволяет выявить причинно-следственные связи развития; сравнении и сопоставлении что позволяет установить специфику и типические черты изучаемого явления. В установлении и количественное выражение закономерностей и взаимозависимости массовых явлений статистическая наука опирается на закон больших чисел особенность которого состоит в том что правильности и закономерности массовых явлений могут отчетливо быть обнаружены только при их массовом...
© "REFLEADER" http://refleader.ru/
Все права на сайт и размещенные работы
защищены законом об авторском праве.