Теория вероятности (9 задач)
Задание 1
Найти вероятность того, что набран пятизначный номер телефона не содержит цифру 3.
Обозначим:
А1 – первая цифра не 3.
А2 – вторая цифра не 3.
А3 – третья цифра не 3.
А4 – четвертая цифра не 3.
А5 – пятая цифра не 3.
Тогда первой цифрой может быть любая из 8 цифр (не 0 и не 3), второй-пятой может быть любая из 9 цифр.
То есть:
P(A1)=8/10
P(A2)=9/10
P(A3)=9/10
P(A4)=9/10
P(A5)=9/10
А- набран пятизначный номер телефона не содержит цифру 3.
Р(А)=8/10*9/10*9/10*9/10*9/10=0,52488
В урне 6 белых и 6 черных шариков. Из урны дважды наугад вынимают по одному шарику без возвращения. Найти вероятность появления белого шарика при втором испытании.
Строим гипотезы:
В1 – первый шарик был белым
В2 – первый шарик был черным
Р(В1)=6/12=0,5
Р(В2)=6/12=0,5
А - появления белого шарика при втором испытании.
Р(А/В1)=5/11
Р(А/В2)=6/11
По формуле полной вероятности:
Р(А)=0,5*5/11+0,5*6/11=0,5
Руководитель пожарной команды собрал статистические данные о количестве по крайней мере одного фальшивого вызова в день за предыдущие 360 дней. Если вероятность по крайней мере одного фальшивого вызова в день равняется 1/6, то какое самое вероятное число таких дней?
Решение
Наивероятнейшее число наступления событий:
Целые число между двумя полученными значениями: n0=60.
Значит, самое вероятное число таких дней: 60.
Из поступающих для составления деталей от станка №1 – 0,1% бракованных, от станка №2 – 0,2%, от станка №3 – 0,25%, от станка №4 – 0,5%. Производительность станков относятся соответственно как 4:3:2:1. Взятая наугад деталь является стандартной. Какая вероятность того, что она изготовлена на станке №3?
Решение
В1 – деталь изготовлена на станке №1
В2 – деталь изготовлена на станке №2
В3 – деталь изготовлена на станке №3
Р(В1)=0,4
Р(В2)=0,3
Р(В3)=0,2
Р(В4)=0,1
А - Взятая наугад деталь является стандартной
Р(В1/А)=1-0,1=0,9
Р(В2/А)=1-0,2=0,8
Р(В3/А)=1-0,25=0,75
Р(В4/А)=1-0,5=0,5
По формуле полной вероятности:
Р(А)=0,4*0,9+0,3*0,8+0,2*0,75+0,1*0,5=0,8
По формуле Байеса, вероятность того, что деталь изготовлена на станке №3:
Р(А/В3)=0,2*0,75/0,8=0,1875.
Задание 2
В урне 4 белых и 3 черных шариков. Проводится последовательное вынимание шариков к появлению черного шарика (выборка осуществляется с возвращением ). Случайная величина Х – число проведенных выниманий. Построить закон распределения случайной величины Х.
Решение
Выборка осуществляется с возвращением, поэтому вероятность изъятия белого шара: р=4/7.
Вероятность изъятия черного шара: q=3/7.
X={1, 2, 3, 4, …, n, ….}
К=1 – при первом изъятии появился черный шар
Р(к=1)=3/7.
К=2 – черный шар появился при втором изъятии
Р(к=2)=4/7*3/7
К=3 – черный шар появился при третьем изъятии
Р(к=3)=4/7*4/7*3/7
…….
К=n – черный шар появился при n изъятии
Р(к=n)=
X |
1 |
2 |
3 |
… |
N |
…. | |
P |
3/7 |
12/49 |
48/343 |
… |
…. |
Вероятность попадания в мишень при одном выстреле равняется 0,6. Построить закон распределения случайной величины Х – числа попаданий в мишень, если были сделаны 3 выстрела. Построить многоугольник распределения случайной величины Х.
Решение
Используем формулу Бернулли
Были сделаны 3 выстрела, поэтому число попаданий может быть:
К=0, 1, 2, 3.
Закон распределения:
К |
0 |
1 |
2 |
3 |
Р |
0,064 |
0,288 |
0,432 |
0,216 |
Задание 3
Средний доход на душу населения в размере 8000 грн. считается случайной величиной, которая распределена нормально со средним квадратичным отклонением грн. В каких пределах практически можно гарантировать доход на душу населения с вероятностью 0,9973?
Решение
Среднее: а=8000
Среднеквадратичное отклонение:
По правилу 3 сигм, с вероятностью 0,9973 значение испытания находится в пределах: .
То есть, с вероятностью 0,9973 можно гарантировать доход на душу населения в пределах: (7400; 8600).
Задание 4
Качество продукции контролируется за наличием в ней дефектов двух видов Х и Y. Эти дефекты являются случайными величинами, которые имеют закон распределения, указанный в таблице. Нужно найти:
1) законы распределения компонент Х и Y;
2) условное распределение Y при условии, что Х принимает свое наименьшее значение;
3) ковариацию и коэффициент корреляции дефектов и выяснить зависимые они или нет.
X |
Y | |||
4 |
5 |
6 |
7 | |
2 |
0,1 |
0,1 |
0 |
0 |
3 |
0 |
0,3 |
0,2 |
0 |
4 |
0 |
0 |
0,2 |
0,1 |
Решение
1) Закон распределения Х:
Х |
2 |
3 |
4 |
Р |
0,2 |
0,5 |
0,3 |
Закон распределения У:
У |
4 |
5 |
6 |
7 |
Р |
0,1 |
0,4 |
0,4 |
0,1 |
2) условное распределение Y при условии, что Х принимает свое наименьшее значение:
Х=2
У/х=2 |
4 |
5 |
6 |
7 |
Р |
0,5 |
0,5 |
0 |
0 |
3) ковариацию и коэффициент корреляции дефектов и выяснить зависимые они или нет.
Факторы зависимы.
Задание 5
Задана генеральная совокупность, которая характеризует месячную прибыль малых предприятий (в тис. грн.) Сделать выборку из 40 элементов и выполнить такие упражнения:
1) построить статистическое распределение выборки и его эмпирическую функцию распределения;
2) построить интервальное распределение выборки, разбив статистический ряд на 6 ровных подинтервалы;
3) построить полигон частот и гистограмму относительных частот;
4) найти моду, медиану, размах и коэффициент ковариации; Замечание. Выборку осуществлять путем выбора 40 элементов кряду начиная из некоторого N, где N – две последних цифры зачетной книжки. (мои две оследние цифры в зачетке 30)
12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 10, 12, 21, 18, 17, 16, 7, 10, 13, 14, 17, 18, 16, 16, 8, 9,12,16, 21, 17, 19, 15, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16, 16, 21, 17, 15, 14, 12.
Решение
N=30, тридцатое число в ряду: 21.
Получаем выборку:
21, 18, 17, 16, 7, 10, 13, 14, 17, 18, 16, 16, 8, 9,12,16, 21, 17, 19, 15, 14, 17, 18, 16, 16, 8, 11, 15, 19, 21, 9, 12, 10, 7, 10, 13, 14, 17, 18, 16.
1) построить статистическое распределение выборки и его эмпирическую функцию распределения:
Статистический ряд:
X |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
N |
2 |
2 |
2 |
3 |
1 |
2 |
2 |
3 |
2 |
7 |
5 |
4 |
2 |
0 |
3 |
Эмпирическая функция:
X |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
N |
2 |
2 |
2 |
3 |
1 |
2 |
2 |
3 |
2 |
7 |
5 |
4 |
2 |
0 |
3 |
Х* |
2 |
4 |
6 |
9 |
10 |
12 |
14 |
17 |
19 |
26 |
31 |
35 |
37 |
37 |
40 |
2) построить интервальное распределение выборки, разбив статистический ряд на 6 ровных подинтервалы
Ширина интервала составит:
Xmax - максимальное значение группировочного признака в совокупности.
Xmin - минимальное значение группировочного признака.
Результаты группировки оформим в виде таблицы:
Группы |
№ совокупности |
Частота fI |
7 - 9.33 |
1,2,3,4,5,6 |
6 |
9.33 - 11.66 |
7,8,9,10 |
4 |
11.66 - 13.99 |
11,12,13,14 |
4 |
13.99 - 16.32 |
15,16,17,18,19,20,21,22,23,24,25,26 |
12 |
16.32 - 18.65 |
27,28,29,30,31,32,33,34,35 |
9 |
18.65 - 20.98 |
36,37,38,39,40 |
5 |
3) построить полигон частот и гистограмму относительных частот
4) найти моду, медиану, размах и коэффициент ковариации
Таблица для вычислений:
Группы |
Середина интервала, xi |
Кол-во, fi |
Xi * fi |
Накопленная частота, S |
(x - xср) * f |
(x - xср)2 * f |
Частота, fi/n |
7 - 9.33 |
8.17 |
6 |
48.99 |
6 |
38.1 |
241.88 |
0.15 |
9.33 - 11.66 |
10.5 |
4 |
41.98 |
10 |
16.08 |
64.62 |
0.1 |
11.66 - 13.99 |
12.83 |
4 |
51.3 |
14 |
6.76 |
11.41 |
0.1 |
13.99 - 16.32 |
15.16 |
12 |
181.86 |
26 |
7.69 |
4.93 |
0.3 |
16.32 - 18.65 |
17.49 |
9 |
157.37 |
35 |
26.74 |
79.43 |
0.23 |
18.65 - 20.98 |
19.82 |
5 |
99.08 |
40 |
26.5 |
140.49 |
0.13 |
суммы |
40 |
580.57 |
121.86 |
542.75 |
1 |
Средняя взвешенная
Мода
Где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.
Медиана
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером:
Находим середину ранжированного ряда: h = (n+1)/2 = (40+1)/2 = 21.
Медианным является интервал 13.99 - 16.32, т. к. в этом интервале накопленная частота S, больше медианного номера.
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т. е. отклонения от среднего).
Среднее квадратическое отклонение (средняя ошибка выборки).
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Задание 6
Распределение размеров основных производственных фондов (в млн. грн.) на n случайно отобранных предприятиях приведено в таблице. Найти точечные несмещенные оценки для и исправлено среднее квадратичное отклонение.
11 |
13 |
15 |
17 |
19 |
21 | |
10 |
8 |
12 |
6 |
14 |
5 |
Решение
Таблица для расчета показателей.
Xi |
Кол-во, fi |
Xi * fi |
Накопленная частота, S |
(x - xср) * f |
(x - xср)2 * f |
11 |
10 |
110 |
10 |
47.64 |
226.92 |
13 |
8 |
104 |
18 |
22.11 |
61.1 |
15 |
12 |
180 |
30 |
9.16 |
7 |
17 |
6 |
102 |
36 |
7.42 |
9.17 |
19 |
14 |
266 |
50 |
45.31 |
146.64 |
21 |
5 |
105 |
55 |
26.18 |
137.1 |
сумма |
55 |
867 |
157.82 |
587.93 |
Средняя:
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т. е. отклонения от среднего).
Исправленная дисперсия:
Среднее квадратическое отклонение (средняя ошибка выборки).
Исправленное среднее квадратическое отклонение:
Задание 7
Провели 15 измерений одним устройством (без систематических ошибок) некоторой физической величины, при этом исправлено среднеквадратичное отклонение S случайных ошибок измерения оказалось ровным 0,12. Найти точность устройства с надежностью 0,99.
Решение
Из равенства
Точность устройства: 9,6%.
Задание 8
По статистическим данным за 10 лет имеет место зависимость валового выпуска продукции предприятия Y от имеющихся основных производственных фондов Х. Дани задаются таблицей
Y = Yi |
400-30 |
420-30 |
430-30 |
440-30 |
450-30 |
460-30 |
470-30 |
480-30 |
490-30 |
500-30 |
X = Xi |
150-30 |
160-30 |
170-30 |
180-30 |
190-30 |
200-30 |
210-30 |
220-30 |
230-30 |
240-30 |
Необходимо:
1) Построить корреляционное поле зависимости признака Х от Y;
2) Основываясь на гипотетическом предположении, что между признаками Х и Y существует линейная зависимость, записать соответствующее уравнение регрессии;
3) Проверить тесноту связи между признаками Х и Y, вычислив коэффициент корреляции;
4) Проверить значимость коэффициента корреляции за критерием Стьюдента.
Решение
Y = Yi |
370 |
390 |
400 |
410 |
420 |
430 |
440 |
450 |
460 |
470 |
X = Xi |
120 |
130 |
140 |
150 |
160 |
170 |
180 |
190 |
200 |
210 |
Линейное уравнение регрессии имеет вид y = bx + a.
Коэффициенты уравнения регрессии находим из системы нормальных уравнений:
A•n + b∑x = ∑y
A∑x + b∑x2 = ∑y•x
Строим вспомогательную таблицу:
X |
Y |
X2 |
Y2 |
X • y |
120 |
370 |
14400 |
136900 |
44400 |
130 |
390 |
16900 |
152100 |
50700 |
140 |
400 |
19600 |
160000 |
56000 |
150 |
410 |
22500 |
168100 |
61500 |
160 |
420 |
25600 |
176400 |
67200 |
170 |
430 |
28900 |
184900 |
73100 |
180 |
440 |
32400 |
193600 |
79200 |
190 |
450 |
36100 |
202500 |
85500 |
200 |
460 |
40000 |
211600 |
92000 |
210 |
470 |
44100 |
220900 |
98700 |
Сумма 1650 |
4240 |
280500 |
1807000 |
708300 |
Для наших данных система уравнений имеет вид
10a + 1650 b = 4240
1650 a + 280500 b = 708300
Из первого уравнения выражаем А и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 1.0545, a = 250
Уравнение регрессии (эмпирическое уравнение регрессии):
Y = 1.0545 x + 250
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции находим по формуле:
Связь очень высокая прямая.
Значимость коэффициента корреляции:
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия
И по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=8 находим tкрит:
Tкрит (n-m-1;α/2) = (8;0.025) = 2.306
Где m = 1 - количество объясняющих переменных.
Получили, что |tнабл| > tкрит, — коэффициент корреляции статистически значим.
Задание 9
По данному интервальному распределению выборки объема n при уровне значимости а по критерию согласия Пирсона проверить гипотезу о нормальном распределении генеральной совокупности.
(-4,-1) |
(-1,2) |
(2,5) |
(5,8) |
(8,11) |
(11,14) | |
72 |
55 |
37 |
24 |
10 |
2 |
Решение
Проверим гипотезу о том, что Х распределено по Нормальному закону с помощью критерия согласия Пирсона.
Где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа
Таблица для расчета показателей.
Группы |
Xi |
Кол-во, fi |
Xi * fi |
(x - xср) * f |
(x - xср)2 * f |
-4 - -1 |
-2.5 |
72 |
-180 |
271.08 |
1020.62 |
-1 - 2 |
0.5 |
55 |
27.5 |
42.08 |
32.19 |
2 - 5 |
3.5 |
37 |
129.5 |
82.7 |
184.82 |
5 - 8 |
6.5 |
24 |
156 |
125.64 |
657.73 |
8 - 11 |
9.5 |
10 |
95 |
82.35 |
678.15 |
11 - 14 |
12.5 |
2 |
25 |
22.47 |
252.45 |
200 |
253 |
626.31 |
2825.96 |
Средняя взвешенная
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т. е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии.
Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 1.27 не более, чем на 3.76
Оценка среднеквадратического отклонения.
Интервалы группировки |
Наблюдаемая частота ni |
Ф(xi) |
Ф(xi+1) |
Вероятность pi попадания в i-й интервал |
Ожидаемая частота npi |
Слагаемые статистики Пирсона Ki |
-4 - -1 |
72 |
0.23 |
0.42 |
0.19 |
38.02 |
30.37 |
-1 - 2 |
55 |
0.0793 |
0.23 |
0.15 |
29.96 |
20.93 |
2 - 5 |
37 |
0.34 |
0.0793 |
0.26 |
52.4 |
4.53 |
5 - 8 |
24 |
0.46 |
0.34 |
0.12 |
24.4 |
0.0065 |
8 - 11 |
10 |
0.5 |
0.46 |
0.032 |
6.4 |
2.03 |
11 - 14 |
2 |
0.5 |
0.5 |
0.00436 |
0.87 |
1.46 |
сумма |
200 |
59.31 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения «хи-квадрат» и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).
Kkp = 9.34840; Kнабл = 59.31
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены Не по нормальному закону.
< Предыдущая | Следующая > |
---|