Задать вопрос
Вы можете уточнить интересующие вопросы любым удобным для Вас способом
VK
Telegram
Mail
WhatsApp

Решение задач по математической статистике в R-studio

Статья с кодами в R.

Задача 4
По схеме собственно-случайной бесповторной выборки проведено 10%- ное обследование строительных организаций региона по объему выполненных работ (млн. руб.). Результаты представлены в таблице:

Объем работ (млн. руб.)

Менее 56

56–60

60–64

64–68

68–72

Более 72

Итого

Число

организаций

9

11

19

30

18

13

100

Найти:
а) границы, в которых с вероятностью 0,9973 заключен средний объем выполненных работ всех строительных организации региона;
б) вероятность того, что доля всех строительных организаций, объем работ которых не менее 60 млн. руб., отличается от доли таких организаций в выборке не более, чем на 0,05 (по абсолютной величине);
в) объем бесповторной выборки, при котором те же границы для среднего объема выполненных работ, (см. п. а)), можно гарантировать с вероятностью 0,9876.
Задача 5
По схеме собственно-случайной бесповторной выборки проведено 10%-ное обследование аптек региона по недельному объему продаж антибиотиков (тыс. руб.). Предполагая, что в регионе функционируют 1000 аптек, получены следующие данные:

748

449

713

602

775

661

147

676

108

488

612

641

761

660

642

794

636

924

859

866

839

573

510

597

735

135

435

759

645

695

597

795

671

596

922

694

556

572

668

776

729

656

738

941

702

707

479

610

783

698

824

877

572

887

649

984

668

857

616

498

682

716

749

706

667

865

896

697

519

841

838

838

711

609

740

433

714

940

848

561

609

837

715

766

451

603

639

673

613

821

784

665

534

751

580

748

753

629

686

724


Составить интервальный вариационный ряд. Записать эмпирическую функцию распределения и построить ее график. На одном графике изобразить гистограмму и полигон частот.

По сгруппированным данным вычислить выборочные числовые характеристики: среднее арифметическое, исправленную выборочную дисперсию, среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс, моду и медиану.
Заменив параметры генеральной совокупности соответственно их наилучшими выборочными числовыми характеристиками и используя χ2- критерий Пирсона, на уровне значимости α=0,05 проверить две гипотезы о том, что изучаемая случайная величина ξ – недельный объем продаж антибиотиков – распределена:
а) по нормальному закону распределения;
б) по равномерному закону распределения.
Задача 6
Распределение 100 торговых павильонов по числу привлекаемых сезонных рабочих ξ (чел.) и их среднемесячной заработной плате на одного человека η (тыс. руб.) представлено в таблице:

ξ

η

 

10–12

 

12–14

 

14–16

 

16–18

 

18–20

Более 20

 

Итого

1–3

 

 

 

 

 

10

10

3–5

 

 

 

 

6

15

21

5–7

 

 

10

11

8

 

29

7–9

 

 

8

3

 

 

11

9–11

 

5

6

 

 

 

11

11-13

5

9

4

 

 

 

18

Итого

5

14

28

14

14

25

100

Необходимо:
1) Вычислить групповые средние и построить эмпирические линии регрессии;
2) Предполагая, что между переменными ξ и η существует линейная корреляционная зависимость:
а) найти уравнения прямых регрессии, построить их графики на одном графике с эмпирическими линиями регрессии и дать экономическую интерпретацию полученных уравнений;
б) вычислить коэффициент корреляции; на уровне значимости α=0,05 оценить его значимость и сделать вывод о тесноте и направлении связи между переменными ξ и η;
в) используя соответствующее уравнение регрессии, оценить среднемесячную заработную плату одного сезонного рабочего в павильоне, привлекающем 10 сезонных рабочих.

Задача 4
Решение.
Коды:
#Исходные данные
x=c(54,58,62,66,70,74)
f=c(9,11,19,30,18,13)
#пункт а
#среднее
x_sr=x%*%f/sum(f)
#дисперсия
d=x^2%*%f/sum(f)-(x_sr)^2
t=qnorm(0.9973/2+0.5)
#предельная ошибка выборочной средней
dsr=t*(d/sum(f)*(1-0.1))^0.5
#нижняя граница для средней
sr_n=x_sr-dsr
#верхняя граница для средней
sr_м=x_sr+dsr
#пункт б
#выборочная доля
w=(100-9-11)/100
#предельная ошибка выборочной доли
dw=0.05
n=100
tw=dw*(w*(1-w)/n*(1-0.1))^(-0.5)
#вероятность
p=(pnorm(tw)-0.5)*2
#пункт в
tv=qnorm(0.9876/2+0.5)
N=1000
#объём выборки
n1=(tv^2*d*N)/(dsr^2*N+tv^2*d)
Задача 4. Коды в R
Задача 4. Результаты
А) ответ: 65(+/-)1,64
Б) ответ: р = 0,8124
В) ответ: n=71.7
Задача 5
Решение.
Код:
#загружаем данные из файла Excel
library(readxl)
df=read_excel('D:\\NEW\\R-studio\\Задание по статистике\\5.xlsx')
#Строим эмпирическую функцию распределения
x1=sort(df$x)
v=seq(from=1/100, to=1, by=1/100)
plot(x1, v)
#строим интервальный вариационный ряд
xmin=min(df$x)
xmax=max(df$x)
l=((xmax-xmin)/8)
xi=seq(xmin+l,xmax,by=l)
n1=length(which(df$x<=xi[1]))
n2=length(which(df$x>xi[1]&df$x<=xi[2]))
n3=length(which(df$x>xi[2]&df$x<=xi[3]))
n4=length(which(df$x>xi[3]&df$x<=xi[4]))
n5=length(which(df$x>xi[4]&df$x<=xi[5]))
n6=length(which(df$x>xi[5]&df$x<=xi[6]))
n7=length(which(df$x>xi[6]&df$x<=xi[7]))
n8=length(which(df$x>xi[7]&df$x<=xi[8]))
fi=c(n1,n2,n3,n4,n5,n6,n7,n8)
#строим гистограмму и полигон
barplot(fi,space=c(0.5,0,0,0,0,0,0,0))
lines(fi, col = "red", lwd = 1)
#средняя
x_sr=xi%*%fi/sum(fi)
#исправленная выборочная дисперсия
d=((sum(fi)/(sum(fi)-1))*(xi^2%*%fi/sum(fi)-(x_sr)^2)
#среднее квадратическое отклонение
sko=d^0.5
#коэффициент вариации
Kv=sko/x_sr
#асимметрия
As=sum((xi-x_sr)^3*fi)/(sum(fi)*sko^3)
#эксцесс
Ex=sum((xi-x_sr)^4*fi)/(sum(fi)*sko^4)-3
#мода
Mo=xi[5]+l*(fi[6]-fi[5])/(2*fi[6]-fi[5]-fi[7])
#медиана
Me=xi[5]+l*(sum(fi)/2-fi[1]-fi[2]-fi[3]-fi[4]-fi[5])/fi[6]
#сформируем ряд частот нормального закона распределения
f1=pnorm((xi-x_sr)/sqrt(d))
f1[8]=1
xi_=seq(xmin,xmax-l,by=l)
f2=pnorm((xi_-x_sr)/sqrt(d))
f2[1]=0
norm=f1-f2
chisq.test(fi,norm)
#сформируем ряд частот равномерного закона
ravn=seq(0.125, 0.125, length.out = 8)
chisq.test(fi, ravn)
Закон распределения соответствует нормальному.
Гистограмма и полигон
Эмпирическая функция распределения
Задача 6
Решение.
Коды:
#Задаём начальные условия
x=seq(2,12,length.out = 6)
y=seq(11,21,length.out = 6)
m1=c(0,0,0,0,0,5)
m2=c(0,0,0,0,5,9)
m3=c(0,0,10,8,6,4)
m4=c(0,0,11,3,0,0)
m5=c(0,6,8,0,0,0)
m6=c(10,15,0,0,0,0)
n1=c(0,0,0,0,0,10)
n2=c(0,0,0,0,6,15)
n3=c(0,0,10,11,8,0)
n4=c(0,0,8,3,0,0)
n5=c(0,5,6,0,0,0)
n6=c(5,9,4,0,0,0)
#групповые средние
y_sr=c(y%*%n1/sum(n1), y%*%n2/sum(n2),y%*%n3/sum(n3),y%*%n4/sum(n4),y%*%n5/sum(n5),y%*%n6/sum(n6))
x_sr=c(x%*%m1/sum(m1), x%*%m2/sum(m2),x%*%m3/sum(m3),x%*%m4/sum(m4),x%*%m5/sum(m5),x%*%m6/sum(m6))
plot(x,y_sr,main ="Коррелляция Y на X")
abline(lm(y_sr~x), col = "red")
plot(y,x_sr,main ="Коррелляция X на Y")
abline(lm(x_sr~y), col = "red")
y_x=lm(y_sr~x)
summary(y_x)
x_y=lm(x_sr~y)
summary(x_y)
cor.test(x, y_sr)
#прогноз
22.41769-0.91837*10
Задача 6. Результаты.
Графики и уравнения:
Call:
lm(formula = y_sr ~ x)
 
Residuals:
     1       2 3       4       5 6
-0.1516 1.0166 -0.8104 -0.3874 -0.1024 0.4352
 
Coefficients:
Estimate Std. Error t value Pr(>|t|) 
(Intercept) 22.891160.66857  34.24 4.34e-06 ***
x-0.86979   0.08584 -10.13 0.000534 ***
---
Signif. codes:0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 
Residual standard error: 0.7182 on 4 degrees of freedom
Multiple R-squared:0.9625, Adjusted R-squared: 0.9531
F-statistic: 102.7 on 1 and 4 DF, p-value: 0.000534
Корреляция X на Y
Call:lm(formula = x_sr ~ y)
 Residuals:    
 1       2       3       4       5       6
-0.31565 0.80680 -0.35646 -0.37687 0.17415 0.06803
 Coefficients:         
 Estimate Std. Error t value Pr(>|t|)  
(Intercept) 22.41769   1.00407  22.33 2.38e-05 ***
y          -0.91837   0.06137 -14.96 0.000116 ***
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 Residual standard error: 0.5135 on 4 degrees of freedomMultiple R-squared: 0.9825, Adjusted R-squared: 0.9781 F-statistic: 223.9 on 1 and 4 DF, p-value: 0.0001162
Корреляция Y на X
Тест коэффициента корреляции:
t = -10.133, df = 4, p-value = 0.000534
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.9980144 -0.8317596
sample estimates:    
 cor -0.9810731
Прогноз:
> #прогноз> 22.41769-0.91837*10[1] 13.23399
Заявка на услуги
Укажите наиболее удобный для ВАС способ связи
и с Вами свяжутся в ближайшее время
Загрузить свой файл
Нажимая на кнопку, Вы соглашаетесь на обработку персональных данных в соответствии с Условиями.
Made on
Tilda