Скачать .docx  

Реферат: Уральский федеральный округ 2 Заселение Урала

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ОБЛАСТНОЙ УНИВЕРСИТЕТ

Экономический факультет. Государственное и муниципальное управление.

Курсовая работа

На тему: «Статистическое изучение социально-экономического явления.»

Вариант №7.

Выполнила студентка

заочного отделения

группа 21

Живаева К.М.

Москва, 2008


Оглавление

Введение

Формирование исходной выборки

Статистические распределения рядов признаков-факторов и результирующего признака

Проверка однородности и нормальности

Вывод зависимостей результирующего-признака от факторов-признаков

Группировка

Определение доверительного интервала

Вычисление линейных коэффициентов корреляции, вывод уравнения регрессии

Заключение

Список источников

Введение

Целью данной работы является статистическое исследование взаимосвязей стоимости автомобиля марки «Хонда-Сивик» с факторными признаками: пробегом и временем эксплуатации; а также, на основании исследования выявления первичных факторов, влияющих на стоимость и вывод зависимости целевого параметра(стоимости) от первичного фактора.

Для построения исходной выборки был выбран сайт www.auto.ru.

Формирование исходной выборки

Используя сайт auto.ru проводим выборочное исследование 50 автомобилей марки Хонда-Сивик.

Исследуемые признаки:

Y ‑ цена автомобиля, тыс.руб.;

Х1 ‑ время эксплуатации, лет;

Х2 ‑ пробег, тыс. км.

№ п/п Марка Y Х1 Х2
1 Civic VII 379 5 121
2 Civic VII 399 4 74
3 Civic VII 429 4 88
4 Civic VII 393 3 95
5 Civic VII 397 3 60
6 Civic VII 430 3 54
7 Civic VII 459 3 46
8 Civic VIII 455 2 107
9 Civic VIII 467 2 47
10 Civic VIII 468 2 97
11 Civic VIII 552 2 60
12 Civic VIII 565 2 41
13 Civic VIII 570 2 57
14 Civic VIII 579 2 30
15 Civic VIII 597 2 150
16 Civic VIII 441 1 75
17 Civic VIII 466 1 30
18 Civic VIII 500 1 15
19 Civic VIII 524 1 26
20 Civic VIII 530 1 22
21 Civic VIII 539 1 32
22 Civic VIII 555 1 62
23 Civic VIII 560 1 14
24 Civic VIII 575 1 30
25 Civic VIII 575 1 88
26 Civic VIII 600 1 18
27 Civic VIII 600 1 18
28 Civic VIII 615 1 40
29 Civic VIII 680 1 14
30 Civic VIII 510 0 18
31 Civic VIII 533 0 0
32 Civic VIII 533 0 0
33 Civic VIII 541 0 0
34 Civic VIII 541 0 0
35 Civic VIII 561 0 0
36 Civic VIII 570 0 29
37 Civic VIII 585 0 0
38 Civic VIII 590 0 0
39 Civic VIII 606 0 0
40 Civic VIII 616 0 0
41 Civic VIII 640 0 0
42 Civic VIII 640 0 0
43 Civic VIII 640 0 0
44 Civic VIII 643 0 0
45 Civic VIII 650 0 10
46 Civic VIII 650 0 0
47 Civic VIII 661 0 0
48 Civic VIII 661 0 0
49 Civic VIII 683 0 0
50 Civic VIII 600 0 13

Статистические распределения рядов признаков-факторов и результирующего признака

Исследуем статистическое распределение признаков Х1 с помощью интервального вариационного ряда:

Интервальный ряд для Х 1
Х 1 F 1 Ср. цена тыс.руб.
0-1 21 603
1-2 14 554
2-3 8 532
3-4 4 420
4-5 2 414
5-6 1 379

Приведем графическое отображение ряда для Х1 в виде гистограммы и кумуляты:

Вычислим среднюю арифметическую, моду и медиану интервального ряда распределения для X1 . Формула для вычисления среднего арифметического:

где – средняя по ряду распределения;

– средняя по i-му интервалу;

– частота i-го интервала (число автомобилей в интервале).

Мода – это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:

где – значение моды;

X0 – нижняя граница модального интервала;

h – величина модального интервала (1 год);

– частота модального интервала;

– частота интервала, предшествующая модальному;

– частота послемодального интервала.

Модальный интервал определяется по наибольшей частоте. Для ряда X1 наибольшее значение частоты равно 21, т.е. это будет интервал 0 лет , тогда значение моды:

Медиана – значение признака, лежащее в середине упорядоченного ряда распределения.

Номер медианы определяется по формуле:

где

n – число единиц в совокупности

т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.

Значение медианы можно определить по формуле:

где – значение медианы;

– нижняя граница медианного интервала;

- номер медианы;

- накопленная частота интервала, предшествующая медианному;

- частота медианного интервала.

По накопленной частоте определяем, что медиана будет находиться в интервале от 1 года до 2-х лет , тогда значение медианы:

Для вычисления дисперсии воспользуемся следующей формулой:

где – дисперсия;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Среднее квадратическое отклонение вычислим по следующей формуле:

где – дисперсия;

– среднее квадратическое отклонение;

Вычислим коэффициент вариации

где – коэффициент вариации;

– среднее квадратическое отклонение;

- среднее по ряду распределения.

Вычислим значения коэффициента ассиметрии:

где ;

– коэффициент ассиметрии;

– среднее квадратическое отклонение;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Вычислим значения коэффициента эксцесса:

где

- коэффициент эксцесса;

– среднее квадратическое отклонение;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Исследуем статистическое распределение признаков Х2 с помощью интервального вариационного ряда.

Для построения ряда распределения необходимо определить число групп и величину интервала. Для определения числа групп воспользуемся формулой Стерджесса:

гдеm – число групп (всегда целое);

n – число единиц в выборке, в нашем случае n= 50.

Вычислим m:

Величину интервала определим по формуле:

где Хmax – максимальное значение признака;

Хmin - минимальное значение признака;

m – число групп.

На основании полученных данных построим интервальный ряд для Х2 :

Интервальный ряд для Х 2
Х 2 F 2 Ср. цена тыс.руб.
0 - 21 25 601
21 - 42 9 551
42 - 63 7 490
63 - 84 2 420
84 - 105 4 466
105 - 126 2 417
126 - 150 1 597

Приведем графическое отображение ряда для Х2 в виде гистограммы и кумуляты:

Вычислим среднюю арифметическую, моду и медиану интервального ряда распределения для X2 . Формула для вычисления среднего арифметического:

где – средняя по ряду распределения;

– средняя по i-му интервалу;

– частота i-го интервала (число автомобилей в интервале).

Мода – это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:

где – значение моды;

– нижняя граница модального интервала;

h – величина модального интервала (1 год);

- частота модального интервала;

- частота интервала, предшествующая модальному;

- частота послемодального интервала.

Модальный интервал определяется по наибольшей частоте. Для ряда X1 наибольшее значение частоты равно 25, т.е. это будет интервал 0 до 21 тыс. км., тогда значение моды:

Медиана – значение признака, лежащее в середине упорядоченного ряда распределения.

Номер медианы определяется по формуле:

где

n – число единиц в совокупности

т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.

Значение медианы можно определить по формуле:

где– значение медианы;

– нижняя граница медианного интервала;

- номер медианы;

- накопленная частота интервала, предшествующая медианному;

- частота медианного интервала.

По накопленной частоте определяем, что медиана будет находиться в интервале от 21 до 42 тыс. км., тогда значение медианы:

Для вычисления дисперсии воспользуемся следующей формулой:

где – дисперсия;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Среднее квадратическое отклонение вычислим по следующей формуле:

где – дисперсия;

– среднее квадратическое отклонение;

Вычислим коэффициент вариации

где – коэффициент вариации;

– среднее квадратическое отклонение;

- среднее по ряду распределения.

Вычислим значения коэффициента ассиметрии:

где

– коэффициент ассиметрии

– среднее квадратическое отклонение;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Вычислим значения коэффициента эксцесса:

где;

- коэффициент эксцесса;

– среднее квадратическое отклонение;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Исследуем статистическое распределение признаков Y с помощью интервального вариационного ряда.

Величину интервала определим по формуле, используя полученное ранее значение m:

где Хmax – максимальное значение признака;

Хmin - минимальное значение признака;

m – число групп.

На основании полученных данных построим интервальный ряд для Y:

Интервальный ряд для Y
Y Fy Ср. цена тыс.руб.
379 - 422 4 400,5
422 - 465 5 443,5
465 - 508 4 486,5
508 - 551 8 529,5
551 - 594 12 572,5
594 - 637 7 615,5
637 - 683 10 660

Приведем графическое отображение ряда для Y в виде гистограммы и кумуляты:

Вычислим среднюю арифметическую , моду и медиану интервального ряда распределения для Y. Формула для вычисления среднего арифметического:

где – средняя по ряду распределения;

– средняя по i-му интервалу;

– частота i-го интервала (число автомобилей в интервале).

Мода – это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:

где – значение моды;

Y0 – нижняя граница модального интервала;

h– величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующая модальному;

- частота послемодального интервала.

Модальный интервал определяется по наибольшей частоте. Для ряда Y наибольшее значение частоты равно 12, т.е. это будет интервал 551-594, тогда значение моды:

Медиана – значение признака, лежащее в середине упорядоченного ряда распределения.

Номер медианы определяется по формуле:

где ;

n – число единиц в совокупности;

т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.

Значение медианы можно определить по формуле:

где – значение медианы;

– нижняя граница медианного интервала;

– номер медианы;

– накопленная частота интервала, предшествующего медианному;

- частота медианного интервала;

По накопленной частоте определяем, что медиана будет находиться в интервале 551-594 , тогда значение медианы:

Для вычисления дисперсии воспользуемся следующей формулой:

где – дисперсия;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Среднее квадратическое отклонение вычислим по следующей формуле:

где – дисперсия;

– среднее квадратическое отклонение;

Вычислим коэффициент вариации

где – коэффициент вариации;

– среднее квадратическое отклонение;

- среднее по ряду распределения.

Вычислим значения коэффициента ассиметрии:

где

– коэффициент ассиметрии;

– среднее квадратическое отклонение;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Подставив значения, получим, что:

Вычислим значения коэффициента эксцесса:

где ;

- коэффициент эксцесса;

– среднее квадратическое отклонение;

– среднее по i-му интервалу;

– среднее по ряду распределения;

– частота i-го интервала;

n – размер выборки (n=50).

Проверка однородности и нормальности

Проверим интервальные распределения на однородность:

следовательно, совокупность для Х1 является неоднородной.

следовательно, совокупность для Х2 является неоднородной.

следовательно, совокупность для Y является однородной.

Исследуем нормальность распределения факторного признака Х1 :

Интервалы значений признака-фактора Число единиц, входящих в интервал Удельный вес единиц, входящих в интервал, в общем их числе, % Удельный вес единиц, входящих в интервал, при нормальном распределении, %
1 2 3 4

(1,6-1,25)-(1,6+1,25)

0,35 – 2,85

22 44 68,3

(1,6-2×1,25) - (1,6+2×1,25)

-0,9 – 4,1

49 98 95,4

(1,6-3×1,25) - (1,6+3×1,25)

-2,15 – 5,35

50 100 99,7

Таким образом, сопоставляя гр.3 и гр.4 делаем вывод: распределение Х1 относительно близко к нормальному, но не подчиняется ему.

Исследуем нормальность распределения факторного признака Х2 :

Интервалы значений признака-фактора Число единиц, входящих в интервал Удельный вес единиц, входящих в интервал, в общем их числе, % Удельный вес единиц, входящих в интервал, при нормальном распределении, %
1 2 3 4

(36,15-34,03)-(36,15+34,03)

2,12 – 70,18

24 48 68,3

(36,15-2×34,03) - (36,15+2×34,03)

-31,91 – 104,21

47 94 95,4

(36,15-3×34,03) - (36,15+3×34,03)

-65,94 – 138,24

49 98 99,7

Таким образом, сопоставляя гр.3 и гр.4 делаем вывод: распределение Х2 близко к нормальному, но не подчиняется ему.

Таким образом, проведя анализ на нормальность распределения мы можем отобрать данные не попадающие в диапазон 3х σ. Для ряда Х1 таких значений нет. Для ряда Х2 исключаем значение с пробегом 150 тыс. км.

С учетом отфильтрованных по правилу 3х сигм составим интервальные ряды для Х1 , Х2 , Y.

Вывод зависимостей результирующего-признака от факторов-признаков

Интервальный ряд для Х 1
Х 1 F 1 Ср. цена тыс.руб.
0-1 21 603
1-2 14 554
2-3 7 522
3-4 4 420
4-5 2 414
5-6 1 379
Интервальный ряд для Х 2
Х 2 F 2 Ср. цена тыс.руб.
0 - 21 25 601
21 - 42 9 551
42 - 63 7 490
63 - 84 2 420
84 - 105 4 466
105 - 126 2 417
Интервальный ряд для Y
Y F y Ср. цена тыс.руб.
379 - 422 4 400,5
422 - 465 5 443,5
465 - 508 4 486,5
508 - 551 8 529,5
551 - 594 12 572,5
594 - 637 6 615,5
637 - 683 10 660

Проведем аналитические группировки продаваемых автомобилей по времени эксплуатации и пробегу и определим групповые средние.

Построим график Y(X1 )

Зависимость цены от времени эксплуатации существует и носит линейный характер, чем больше время эксплуатации, тем дешевле автомобиль.

Построим график Y(X2 )

Зависимость цены от пробега существует и носит линейный характер, чем больше пробег автомобиля, тем дешевле автомобиль.

Группировка

На основанииданных статистического наблюдения выделим три типа автомобилей:

· по времени эксплуатации:

o новые автомобили от 0 до 1 года – 34 шт.

o средние автомобили от 2 до 3 лет – 13 шт.

o старые автомобили от 3 до 5 лет – 3 шт.

· по пробегу:

o новые автомобили от 0 до 50 тыс. км. – 36 шт.

o средние автомобили от 50 до 100 тыс.км. – 11 шт.

o старые автомобили от 100 до 150 тыс.км. – 3 шт.

· по цене:

o новые автомобили от 581 до 683 тыс. руб. – 19 шт.

o средние автомобили от 480 до 581 тыс. руб. – 12 шт.

o старые автомобили от 379 до 480 тыс. руб. – 12 шт.

Определение доверительного интервала

Определим доверительный интервал, в котором заключена средняя цена всех продаваемых автомобилей, с вероятностью 0,9.

При вероятности 0,9 t = 1,64

Следовательно:

Таким образом, с вероятностью 0,9 можно утверждать, что средняя цена автомобиля равна:

Определим доверительный интервал, в котором заключена средняя цена всех продаваемых автомобилей, с вероятностью 0,95.

При вероятности 0,95 t = 1,96

Следовательно:

Таким образом, с вероятностью 0,95 можно утверждать, что средняя цена автомобиля равна:

Определим необходимую численность выборки при определении средней цены продаваемых автомобилей, чтобы с вероятностью 0,95 предельная ошибка выборки не превышала 10 тыс.руб.

Вычисление линейных коэффициентов корреляции, вывод уравнения регрессии

На основании выборочного наблюдения оценим степень тесноты связи и проведем оценку ее существенности:

Для определения степени тесноты парной линей зависимости используем линейный коэффициент корреляции(r) :

Для вычисления линейных коэффициентов корреляции составим вспомогательную таблицу:

5 121 379 1,6 36,15 509,8 3,4 84,85 -130,8 -444,72 -11098,4 288,49
4 74 399 1,6 36,15 509,8 2,4 37,85 -110,8 -265,92 -4193,78 90,84
4 88 429 1,6 36,15 509,8 2,4 51,85 -80,8 -193,92 -4189,48 124,44
3 95 393 1,6 36,15 509,8 1,4 58,85 -116,8 -163,52 -6873,68 82,39
3 60 397 1,6 36,15 509,8 1,4 23,85 -112,8 -157,92 -2690,28 33,39
3 54 430 1,6 36,15 509,8 1,4 17,85 -79,8 -111,72 -1424,43 24,99
3 46 459 1,6 36,15 509,8 1,4 9,85 -50,8 -71,12 -500,38 13,79
2 107 455 1,6 36,15 509,8 0,4 70,85 -54,8 -21,92 -3882,58 28,34
2 47 467 1,6 36,15 509,8 0,4 10,85 -42,8 -17,12 -464,38 4,34
2 97 468 1,6 36,15 509,8 0,4 60,85 -41,8 -16,72 -2543,53 24,34
2 60 552 1,6 36,15 509,8 0,4 23,85 42,2 16,88 1006,47 9,54
2 41 565 1,6 36,15 509,8 0,4 4,85 55,2 22,08 267,72 1,94
2 57 570 1,6 36,15 509,8 0,4 20,85 60,2 24,08 1255,17 8,34
2 30 579 1,6 36,15 509,8 0,4 -6,15 69,2 27,68 -425,58 -2,46
2 150 597 1,6 36,15 509,8 0,4 113,85 87,2 34,88 9927,72 45,54
1 75 441 1,6 36,15 509,8 -0,6 38,85 -68,8 41,28 -2672,88 -23,31
1 30 466 1,6 36,15 509,8 -0,6 -6,15 -43,8 26,28 269,37 3,69
1 15 500 1,6 36,15 509,8 -0,6 -21,15 -9,8 5,88 207,27 12,69
1 26 524 1,6 36,15 509,8 -0,6 -10,15 14,2 -8,52 -144,13 6,09
1 22 530 1,6 36,15 509,8 -0,6 -14,15 20,2 -12,12 -285,83 8,49
1 32 539 1,6 36,15 509,8 -0,6 -4,15 29,2 -17,52 -121,18 2,49
1 62 555 1,6 36,15 509,8 -0,6 25,85 45,2 -27,12 1168,42 -15,51
1 14 560 1,6 36,15 509,8 -0,6 -22,15 50,2 -30,12 -1111,93 13,29
1 30 575 1,6 36,15 509,8 -0,6 -6,15 65,2 -39,12 -400,98 3,69
1 88 575 1,6 36,15 509,8 -0,6 51,85 65,2 -39,12 3380,62 -31,11
1 18 600 1,6 36,15 509,8 -0,6 -18,15 90,2 -54,12 -1637,13 10,89
1 18 600 1,6 36,15 509,8 -0,6 -18,15 90,2 -54,12 -1637,13 10,89
1 40 615 1,6 36,15 509,8 -0,6 3,85 105,2 -63,12 405,02 -2,31
1 14 680 1,6 36,15 509,8 -0,6 -22,15 170,2 -102,12 -3769,93 13,29
0 18 510 1,6 36,15 509,8 -1,6 -18,15 0,2 -0,32 -3,63 29,04
0 0 533 1,6 36,15 509,8 -1,6 -36,15 23,2 -37,12 -838,68 57,84
0 0 533 1,6 36,15 509,8 -1,6 -36,15 23,2 -37,12 -838,68 57,84
0 0 541 1,6 36,15 509,8 -1,6 -36,15 31,2 -49,92 -1127,88 57,84
0 0 541 1,6 36,15 509,8 -1,6 -36,15 31,2 -49,92 -1127,88 57,84
0 0 561 1,6 36,15 509,8 -1,6 -36,15 51,2 -81,92 -1850,88 57,84
0 29 570 1,6 36,15 509,8 -1,6 -7,15 60,2 -96,32 -430,43 11,44
0 0 585 1,6 36,15 509,8 -1,6 -36,15 75,2 -120,32 -2718,48 57,84
0 0 590 1,6 36,15 509,8 -1,6 -36,15 80,2 -128,32 -2899,23 57,84
0 0 606 1,6 36,15 509,8 -1,6 -36,15 96,2 -153,92 -3477,63 57,84
0 0 616 1,6 36,15 509,8 -1,6 -36,15 106,2 -169,92 -3839,13 57,84
0 0 640 1,6 36,15 509,8 -1,6 -36,15 130,2 -208,32 -4706,73 57,84
0 0 640 1,6 36,15 509,8 -1,6 -36,15 130,2 -208,32 -4706,73 57,84
0 0 640 1,6 36,15 509,8 -1,6 -36,15 130,2 -208,32 -4706,73 57,84
0 0 643 1,6 36,15 509,8 -1,6 -36,15 133,2 -213,12 -4815,18 57,84
0 10 650 1,6 36,15 509,8 -1,6 -26,15 140,2 -224,32 -3666,23 41,84
0 0 650 1,6 36,15 509,8 -1,6 -36,15 140,2 -224,32 -5068,23 57,84
0 0 661 1,6 36,15 509,8 -1,6 -36,15 151,2 -241,92 -5465,88 57,84
0 0 661 1,6 36,15 509,8 -1,6 -36,15 151,2 -241,92 -5465,88 57,84
0 0 683 1,6 36,15 509,8 -1,6 -36,15 173,2 -277,12 -6261,18 57,84
0 13 600 1,6 36,15 509,8 -1,6 -23,15 90,2 -144,32 -2088,13 37,04
Итого: -4829,8 -98283,3 1894,15

Тогда

Таким образом, значение линейного коэффициента корреляции = -0,84 свидетельствует о наличии обратной и тесной связи между временем эксплуатации и ценой автомобиля.

Таким образом, значение линейного коэффициента корреляции = -0,63 свидетельствует о наличии обратной и тесной связи между пробегом и ценой автомобиля.

Таким образом, значение линейного коэффициента корреляции = 0,89 свидетельствует о наличии прямой и тесной связи временем эксплуатации и пробегом автомобиля.

Проведем анализ матрицы парных коэффициентов корреляции:

Составим матрицу парных коэффициентов корреляции:

Y X1 X2
Y 1 -0,84 -0,63
X1 -0,84 1 0,89
X2 -0,63 0,89 1

Так как оба условия не соблюдаются, то для составления уравнения регрессии будем использовать наиболее значимый (весомый) факторный признак, т.е. – X1 (время эксплуатации), т.к. .

Составим уравнение регрессии:

В качестве регрессионной модели выберем линейную модель, которая имеет вид:

Вычислим коэффициенты регрессионного уравнения:

Таким образом, уравнение регрессии примет вид:


Заключение

В ходе исследования были выявлены следующие характеристики взаимосвязи стоимости автомобиля с факторными признаками:

· Стоимость автомобиля линейно зависит от пробега и времени эксплуатации причем эта зависимость обратная для обоих случаев. При увеличении пробега (времени эксплуатации) стоимость автомобиля уменьшается;

· Основным фактором, влияющим на конечную стоимость, является время эксплуатации;

· Выявлена зависимость стоимости автомобиля от времени эксплуатации, которая имеет следующий вид:


Список источников

1) Сайт www.auto.ru.

2) Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учеб. пособие. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 2005. – 336 с: ил. ISBN 5-279-02555-0.