Задать вопрос
Вы можете уточнить интересующие вопросы любым удобным для Вас способом
VK
Telegram
Mail
WhatsApp

Построение модели рейтинга компаний по панельным данным.

Влияние нефинансовых показателей на рейтинг компаний.
Исходные данные
Для изучения влияния нефинансовых показателей на рейтинг компаний мной были взяты данные по 10 компаниям нефтегазовой отрасли и 10 компаниям автомобильной отрасли. Имеем панельные данные по 20 компаниям за пять лет. Объясняющие переменные:
X1- Social contributions (in millions of USD)
X2- Environmental investments (in millions of USD)
X3- No. of positions held by women (%)
Объясняемые переменные:
ESG Rating – рейтинг компании,
ROA –рентабельность активов (%),
ROE – рентабельность собственного капитала (%),
Leverage ratio – финансовый рычаг.
Корреляционный анализ
Построим корреляционную матрицу.

Таблица 1

Корреляционная матрица


Correlation coefficients, using the observations 1:1 - 20:5

5% critical value (two-tailed) = 0.1966 for n = 100

FIRM

YEAR

ESGRating

ROA

ROE

 

1.0000

0.0000

-0.3381

0.1030

0.0819

FIRM

 

1.0000

0.1280

0.1499

0.4139

YEAR

 

 

1.0000

0.0301

0.0428

ESGRating

 

 

 

1.0000

0.4897

ROA

 

 

 

 

1.0000

ROE

 

 

 

 

 

 

 

Leverageratio

X1

X2

X3

 

 

0.1666

0.0867

-0.6671

-0.7602

FIRM

 

0.1821

-0.0085

0.0685

0.1063

YEAR

 

0.0020

0.0469

0.1923

0.4161

ESGRating

 

-0.1045

0.0285

0.0996

-0.2006

ROA

 

0.2024

0.1635

0.1403

-0.0252

ROE

 

1.0000

0.2544

-0.0378

0.1123

Leverageratio

 

 

1.0000

0.1078

0.0303

X1

 

 

 

1.0000

0.3818

X2

 

 

 

 

1.0000

X3

Рис. 1. Корреляционная матрица.
От показателя времени имеет зависимость только показатель ROE, коэффициент корреляции между ними составляет 0,4. Остальные переменные имеют очень слабую связь с показателем YEAR. Индексный показатель FIRM имеет тесную корреляционную зависимость с показателями Х2 и Х3. Объясняющая переменная ESG Rating имеет корреляционную зависимость с индексной переменной FIRM и переменной Х3. Показатель ROA имеет слабую корреляционную зависимость с показателем Х3, показатель ROE имеет слабую корреляционную зависимость с показателем Х1. Остальные корреляционные связи существенно малы или они являются связями между объясняемыми переменными.
В связи с вышесказанным будем рассматривать переменные ESG Rating, ROA, ROE, X1, X3.
Описательные статистики
Приведём описательные статистики для данных переменных и графики разброса.

Таблица 2

Описательная статистика объясняемой переменной (ESG Rating)


Summary Statistics, using the observations 1:1 - 20:5

for the variable ESGRating (100 valid observations)

 Mean

Median

Minimum

Maximum

4.4000

5.0000

1.0000

7.0000

 Std. Dev.

C.V.

Skewness

Ex. kurtosis

1.9437

0.44174

-0.33348

-0.92794

 5% Perc.

95% Perc.

IQ range

Missing obs.

1.0000

7.0000

3.5000

0

Минимальное значение рейтинга составляет 1, максимальное -7. Среднее значение рейтинга составляет 4,4 – это значения между ВВВ и А. Коэффициент вариации составляет 44,17%, выше 33%, вариация результативного показателя является существенной. Асиметрия правостороння.
Изобразим коробчатую диаграмму результативного показателя ESGRating.
Рис. 2. Коробчатая диаграмма показателя ESG Rating.
Видим, что от разброс зависит от номера предприятия. Предприятия 2, 16, 17 имеют существенный разброс рейтинга в зависимости от времени.

Таблица 3

Описательная статистика объясняемой переменной ROA



Summary Statistics, using the observations 1:1 - 20:5

for the variable ROA (100 valid observations)

 Mean

Median

Minimum

Maximum

3.7493

4.0000

-77.000

18.000

 Std. Dev.

C.V.

Skewness

Ex. kurtosis

9.5504

2.5473

-6.1066

49.575

 5% Perc.

95% Perc.

IQ range

Missing obs.

-4.9965

13.950

5.0000

0

Минимальное значение ROA составляет -77%, максимальное составляет 18%. Среднее значение ROA составляет 3.75%. Коэффициент вариации составляет 254.7%, выше 33%, вариация результативного показателя является существенной. Асиметрия правостороння.
Изобразим коробчатую диаграмму результативного показателя ROA.
Рис. 4. Коробчатая диаграмма показателя ROA.
Видим, что от разброс зависит от номера предприятия. Предприятие 5 имеет существенный разброс рентабельности активов в зависимости от времени.

Таблица 4

Описательная статистика объясняемой переменной ROE

Summary Statistics, using the observations 1:1 - 20:5

for the variable ROE (100 valid observations)

 Mean

Median

Minimum

Maximum

11.424

9.9450

-14.000

53.000

 Std. Dev.

C.V.

Skewness

Ex. kurtosis

10.193

0.89226

0.92011

2.4580

 5% Perc.

95% Perc.

IQ range

Missing obs.

-1.9500

31.105

10.698

0

Минимальное значение ROE составляет -14%, максимальное составляет 53%. Среднее значение ROE составляет 11.42%. Коэффициент вариации составляет 89.2%, выше 33%, вариация результативного показателя является существенной. Асиметрия левосторонняя.
Изобразим коробчатую диаграмму результативного показателя ROE.
Рис. 5. Коробчатая диаграмма показателя ROE.
Видим, что от разброс зависит от номера предприятия. Предприятия 1, 6, 16 имеют существенный разброс рентабельности собственного капитала в зависимости от времени.

Таблица 5

Описательная статистика объясняющей переменной Х1


Summary Statistics, using the observations 1:1 - 20:5

for the variable X1 (100 valid observations)

 Mean

Median

Minimum

Maximum

74.437

43.810

1.6000

840.00

 Std. Dev.

C.V.

Skewness

Ex. kurtosis

112.55

1.5120

4.1648

21.618

 5% Perc.

95% Perc.

IQ range

Missing obs.

5.1070

365.52

59.750

0

Минимальное значение Х1 составляет 1,6 млн. долл., максимальное составляет 840 млн. долл. Среднее значение Х1 составляет 74,44 млн. долл. Коэффициент вариации составляет 151,2%, выше 33%, вариация результативного показателя является существенной. Асиметрия левосторонняя.
Изобразим коробчатую диаграмму результативного показателя Х1.
Рис. 6. Коробчатая диаграмма показателя Х1.
Видим, что от разброс зависит от номера предприятия. Предприятие 5 имеет существенный разброс показателя Х1 от времени. Похожий разброс имеет рентабельность активов в зависимости.

Таблица 6

Описательная статистика объясняющей переменной Х3

Summary Statistics, using the observations 1:1 - 20:5

for the variable X3 (100 valid observations)

 Mean

Median

Minimum

Maximum

24.380

25.350

8.2000

45.000

 Std. Dev.

C.V.

Skewness

Ex. kurtosis

8.0552

0.33040

-0.064080

-0.85214

 5% Perc.

95% Perc.

IQ range

Missing obs.

9.8850

35.950

12.600

0

Минимальное значение Х3 составляет 8,2%, максимальное составляет 45%. Среднее значение Х3 составляет 24,38%. Коэффициент вариации составляет 33%, не выше 33%, вариация результативного показателя является умеренной. Асиметрия слабая левосторонняя.
Изобразим коробчатую диаграмму результативного показателя Х3.
Рис. 7. Коробчатая диаграмма показателя Х3.
Видим, что от разброс зависит от номера предприятия. Предприятие 5 имеет существенный разброс показателя Х3 от времени.
Построение моделей по панельным данным. Проверка выдвинутых гипотез.
Построим модель зависимости показателя ESG Rating от объясняющих переменных Х1, Х3. Воспользуемся взвешенным методом с коррекцией гетероскедастичности для панельных моделей. Данный метод используем для коррекции гетероскедастичности.

Таблица 7.


Model 2: WLS, using 100 observations

Included 20 cross-sectional units

Dependent variable: ESGRating

Weights based on per-unit error variances

 

Coefficient

Std. Error

t-ratio

p-value

 

const

1.74531

0.364130

4.793

<0.0001

***

X1

0.00117382

0.00116859

1.004

0.3176

 

X3

0.108413

0.0125657

8.628

<0.0001

***


Statistics based on the weighted data:

Sum squared resid

 98.51748

 

S.E. of regression

 1.007792

 

 

 

 

 

R-squared

 0.436705

 

Adjusted R-squared

 0.425091

F(2, 97)

 37.60058

 

P-value(F)

 8.14e-13

Log-likelihood

−141.1470

 

Akaike criterion

 288.2941

Schwarz criterion

 296.1096

 

Hannan-Quinn

 291.4572


Statistics based on the original data:

Mean dependent var

 4.400000

 

S.D. dependent var

 1.943651

Sum squared resid

 310.2690

 

S.E. of regression

 1.788477

Исключаем незначимую переменную Х1

Таблица 8.


Model 3: WLS, using 100 observations

Included 20 cross-sectional units

Dependent variable: ESGRating

Weights based on per-unit error variances

 

Coefficient

Std. Error

t-ratio

p-value

 

const

1.87560

0.335370

5.593

<0.0001

***

X3

0.106262

0.0122232

8.693

<0.0001

***


Statistics based on the weighted data:

Sum squared resid

 98.96760

 

S.E. of regression

 1.004925

R-squared

 0.435406

 

Adjusted R-squared

 0.429645

F(1, 98)

 75.57619

 

P-value(F)

 8.23e-14

Log-likelihood

−141.3750

 

Akaike criterion

 286.7499

Schwarz criterion

 291.9603

 

Hannan-Quinn

 288.8587


Statistics based on the original data:

Mean dependent var

 4.400000

 

S.D. dependent var

 1.943651

Sum squared resid

 309.9070

 

S.E. of regression

 1.778290


Проверим остатки модели на нормальность распределения.
Рис. 8. Остатки модели (4)
Нулевая гипотеза – остатки имеют нормальное распределение. В нашем случае вероятность принятия нулевой гипотезы составляет 0,239, что больше 0,05. Принимаем нулевую гипотезу.
Запишем модель:
ESGRating = 1.87560 + 0.106262*Х3 (4)
p-value для всех коэффициентов модели <0.0001. Следовательно, отвергаем нулевую гипотезу – коэффициенты регрессии являются статистически значимыми. P-value(F) <0.0001, отвергаем нулевую гипотезу. Уравнение регрессии является статистически значимым в целом. При увеличении доли женского персонала на один процентный пункт рейтинг компании увеличивается на 0,1 весовую единицу.
Изобразим остатки модели в виде коробчатой диаграммы.
Рис. 9. Коробчатая диаграмма остатков модели (4)
Видим, что разброс остатков не одинаков для разных предприятий. Наибольший разброс остатков имеют предприятия 5, 16, 17.
Построим модель зависимости показателя ROA от объясняющих переменных Х1, Х3. Воспользуемся взвешенным методом с коррекцией гетероскедастичности для панельных моделей. Данный метод используем для коррекции гетероскедастичности.

Таблица 9


Model 5: WLS, using 100 observations

Included 20 cross-sectional units

Dependent variable: ROA

Weights based on per-unit error variances

 

Coefficient

Std. Error

t-ratio

p-value

 

const

4.95803

1.19622

4.145

<0.0001

***

X3

−0.0578955

0.0412731

−1.403

0.1639

 

X1

0.0123334

0.00432341

2.853

0.0053

***

Statistics based on the weighted data:

Sum squared resid

 76.32916

 

S.E. of regression

 0.887073

R-squared

 0.115184

 

Adjusted R-squared

 0.096941

F(2, 97)

 6.313678

 

P-value(F)

 0.002645

Log-likelihood

−128.3881

 

Akaike criterion

 262.7762

Schwarz criterion

 270.5917

 

Hannan-Quinn

 265.9393

Statistics based on the original data:

Mean dependent var

 3.749300

 

S.D. dependent var

 9.550411

Sum squared resid

 9037.666

 

S.E. of regression

 9.652555

Исключим незначимую переменную Х3.

Таблица 10.


Model 7: WLS, using 100 observations

Included 20 cross-sectional units

Dependent variable: ROA

Weights based on per-unit error variances

 

Coefficient

Std. Error

t-ratio

p-value

 

const

3.00955

0.289806

10.38

<0.0001

***

X1

0.0135758

0.00435756

3.115

0.0024

***

Statistics based on the weighted data:

Sum squared resid

 93.72960

 

S.E. of regression

 0.977970

R-squared

 0.090116

 

Adjusted R-squared

 0.080832

F(1, 98)

 9.706048

 

P-value(F)

 0.002409

Log-likelihood

−138.6560

 

Akaike criterion

 281.3121

Schwarz criterion

 286.5224

 

Hannan-Quinn

 283.4208

Statistics based on the original data:

Mean dependent var

 3.749300

 

S.D. dependent var

 9.550411

Sum squared resid

 9185.922

 

S.E. of regression

 9.681627

Модель запишется в виде:
ROA = 3.00955 + 0.0135758*X1 (5)
Проверим остатки модели на наличие нормального распределения.
Рис. 10. Остатки модели (5)
Нулевая гипотеза – остатки имеют нормальное распределение. В нашем случае вероятность принятия нулевой гипотезы намного меньше 0,0001.Отвергаем нулевую гипотезу.
Данную модель не можем принять, так как у неё низкий коэффициент детерминации, равный 0,09. Это значит, что модель объясняет только 9% изменения результативного показателя ROA. Остатки модели не имеют нормального распределения.
Построим модель зависимости показателя ROE от объясняющих переменных Х1, Х3. Воспользуемся взвешенным методом с коррекцией гетероскедастичности для панельных моделей. Данный метод используем для коррекции гетероскедастичности.

Таблица 11

Model 11: WLS, using 100 observations

Included 20 cross-sectional units

Dependent variable: ROE

Weights based on per-unit error variances

 

Coefficient

Std. Error

t-ratio

p-value

 

const

9.15614

2.11210

4.335

<0.0001

***

X1

0.0231452

0.00751921

3.078

0.0027

***

X3

−0.0185069

0.0732322

−0.2527

0.8010

 

Statistics based on the weighted data:

Sum squared resid

 94.42245

 

S.E. of regression

 0.986624

R-squared

 0.089617

 

Adjusted R-squared

 0.070847

F(2, 97)

 4.774305

 

P-value(F)

 0.010528

Log-likelihood

−139.0243

 

Akaike criterion

 284.0486

Schwarz criterion

 291.8641

 

Hannan-Quinn

 287.2117

Statistics based on the original data:

Mean dependent var

 11.42350

 

S.D. dependent var

 10.19274

Sum squared resid

 10188.89

 

S.E. of regression

 10.24891

Исключим незначимую переменную Х3.

Таблица 12.

Model 12: WLS, using 100 observations

Included 20 cross-sectional units

Dependent variable: ROE

Weights based on per-unit error variances

 

Coefficient

Std. Error

t-ratio

p-value

 

const

8.57272

0.690560

12.41

<0.0001

***

X1

0.0236003

0.00757392

3.116

0.0024

***

Statistics based on the weighted data:

Sum squared resid

 93.38282

 

S.E. of regression

 0.976159

R-squared

 0.090144

 

Adjusted R-squared

 0.080860

F(1, 98)

 9.709403

 

P-value(F)

 0.002405

Log-likelihood

−138.4707

 

Akaike criterion

 280.9414

Schwarz criterion

 286.1518

 

Hannan-Quinn

 283.0501

Statistics based on the original data:

Mean dependent var

 11.42350

 

S.D. dependent var

 10.19274

Sum squared resid

 10226.92

 

S.E. of regression

 10.21549

Модель запишется в виде:
ROA = 8.57272+ 0.0236*X1 (6)
Проверим остатки модели на наличие нормального распределения.
Рис. 11. Остатки модели (6)
Нулевая гипотеза – остатки имеют нормальное распределение. В нашем случае вероятность принятия нулевой гипотезы составляет 0,0003, что меньше 0,05. Отвергаем нулевую гипотезу.
Данную модель не можем принять, так как у неё низкий коэффициент детерминации, равный 0,09. Это значит, что модель объясняет только 9% изменения результативного показателя ROE. Остатки модели не имеют нормального распределения.
Интерпретация результатов
По панельным данным 20 компаний за 2018-2022 годы нами были выдвинуты две гипотезы. Первая: рейтинг компаний зависит от косвенных факторов Х1, Х2, Х3, Х4. Вторая: экономические показатели рентабельности ROA, ROE и финансовый рычаг зависят от косвенных факторов Х1, Х2, Х3, Х4.
Было установлено, что рейтинг компании зависит только от показателя Х3 (доля женского персонала). От показателей Х1, Х2, Х4 рейтинг компании не зависит. Взвешенным методом для панельных моделей было получено уравнение линейной зависимости:
ESGRating = 1.87560 + 0.106262*Х3 (4)
Все коэффициенты модели являются статистически значимыми. Уравнение регрессии является статистически значимым в целом. Коэффициент детерминации составляет 0,435. 43,5% изменения показателя рейтинга зависит от доли женского персонала. При увеличении доли женского персонала на один процентный пункт рейтинг компании увеличивается на 0,1 весовую единицу. Первая гипотеза у нас подтвердилась по перекрёстным данным и по панельным данным.
 При проверке 2-ой гипотезы мной установлена зависимость ROA от показателя Х1 и ROE от показателя Х1. Получены две модели.
ROA = 3.00955 + 0.0135758*X1 (5)
Данную модель не можем принять, так как у неё низкий коэффициент детерминации, равный 0,09. Это значит, что модель объясняет только 9% изменения результативного показателя ROA. Остатки модели не имеют нормального распределения.
ROA = 8.57272+ 0.0236*X1 (6)
Данную модель не можем принять, так как у неё низкий коэффициент детерминации, равный 0,09. Это значит, что модель объясняет только 9% изменения результативного показателя ROE. Остатки модели не имеют нормального распределения.
Обобщая, можно сказать, что вторую гипотезу относительно панельных данных нельзя принять, так как не удалось построить адекватные модели зависимости рентабельности от косвенных факторов.
Заявка на услуги
Укажите наиболее удобный для ВАС способ связи
и с Вами свяжутся в ближайшее время
Загрузить свой файл
Нажимая на кнопку, Вы соглашаетесь на обработку персональных данных в соответствии с Условиями.
Made on
Tilda