Архив

Распределение продолжительности жизни в России. Альтернативная оценка
Горшков Вячеслав Алексеевич — доктор технических наук, профессор филиала РГСУ в г. Руза

Аннотация

Средняя продолжительность предстоящей жизни (СППЖ) является важнейшим показателем общественного здоровья. По данному показателю Россия в рейтингах занимает далеко не престижные места. Однако, в литературе и интернете отсутствуют классические вероятностные характеристики продолжительности жизни, такие как функция распределения (интегральная) и функция плотности распределения (дифференциальная). 

Рассматривается метод оценки распределения продолжительности жизни в России на основе сопоставления смежных возрастных диаграмм. Приводится результаты анализа динамики характеристик распределения продолжительности жизни с 1991 по 2010 г. представленных на сайте Федеральной службы государственной статистики (Росстата). 

Приводятся формулы и ссылки на исходные данные расчетов методики всех расчетов, позволяющие провести численную проверку полученных в работе результатов.

1. Введение

На сайте Росстата — http://www.gks.ru — в качестве основной характеристики продолжительности жизни приводится ее среднее значение. При этом само распределение не приводится. Не приводятся также другие моменты распределения (дисперсии, коэффициент асимметрии, эксцесс), что существенно осложняет прогноз численности населения в различных возрастных группах.

См. В. А. Горшков. Особенности демографической ситуации в России —
http://www.demographia.ru/articles_N/index.html?idR=20&idArt=1931

При этом приводимое среднее значение продолжительности жизни, смещающее страну в соответствующих рейтингах на весьма низкое место — http://ostranah.ru/_lists/life_expectancy.php, вызывает сомнение в адекватности такого расчета. 

Международная практика расчета СППЖ (средней продолжительности предстоящей жизни; дожития) основана на анализе таблиц смертности. Однако в отечественных учебниках данная методика изложена с большим количеством неточностей и опечаток. Ни в интернете, ни в литературе доказательного расчета средней продолжительности жизни автором данной работы не найдено. 

Адекватную картину дают классические функция плотности распределения (дифференциальная) и функция распределения (интегральная).

2. Метод

Распределение продолжительности жизни может быть оценено по распределению возраста ухода из жизни. Однако, такой статистики для России в открытой печати и интернете не найдено. В связи с этим, в данной работе оно восстанавливалось по смежным возрастным диаграмм (ВД), размещенным на сайте Росстата. 

Возрастная диаграмма позволяет определить численность населения в различных возрастных группах и средний возраст населения России по формуле:

где t — возраст, Nt — число жителей возраста.

Так, средний возраст жителей России в 1990 составлял 34,9 года, а в 1991 — 35,0.

Возрастная диаграмма позволяет также с помощью сверточного алгоритма прогнозировать численность населения в различных возрастных группах.

См. Горшков В. А. Прогноз демографического эха. Демографические исследования. № 11, 2010 —
http://www.demographia.ru/articles_N/index.html?idR=22&idArt=1862]

Две смежные диаграммы (рис. 1) позволяю получить распределение продолжительности жизни.

Рисунок 1.
Возрастные диаграммы.

Если, например, на ВД 1990 г. число жителей России в возрасте 40 лет представлено 2 362 918 жителей, а на ВД 1991года число жителей России в возрасте 41 год представлено 2 357 341, то число жителей, равное разнице (2 362 918 — 2 357 341 = 5 577), представляет суммарное число умерших, эмигрантов и иммигрантов (со знаком минус). 

Характерно, что если сравнить число двухлетних детей 1990 г. (2 454 150) с числом трехлетних 1991 г. (2 456 950), то их число даже увеличилось — на 2 800. Откуда эта прибавка? Кроме как доминирующим влиянием иммиграции над эмиграцией и смертностью в этой возрастной группе объяснить этот феномен нельзя. 

Для более адекватной оценки распределения продолжительности жизни необходим учет распределений эмигрантом и иммигрантов по возрасту. 

Так, включение в рассмотрение эмигрантов приводит к уменьшению оценки средней продолжительности жизни, иммигрантов — к увеличению. Однако в силу не соизмеримости смертности после 40–50 лет с миграционными процессами их не учет не приводит к существенным ошибкам.

Здесь необходимо сделать несколько допущений: 

  1. Поскольку последняя возрастная группа в возрастной диаграмме представляет число жителей, достигших 100 и более лет, будем полагать, что максимальный возраст составляет 100 лет. Т. е. доля ушедших возрасте 100 лет будет равна 1. Это допущение незначительно и приведет к пренебрежимо малому снижению средней продолжительности жизни.
  2. Чтобы исключить отрицательные значения вероятностей в распределении возраста убытия (из-за иммиграционных процессов), отрицательные значения убытий будут обнуляться, что приведет к незначительному завышению оценки средней продолжительности жизни.
  3. Поскольку возрастные диаграммы строятся на конец года (1 января), они не позволяют учитывать смертность в возрасте до одного года.

Число убывших в возрасте t в год τ определяется из смежных возрастных диаграмм по формуле:

где  — число жителей по ВД в год τ в возрасте t

 — число жителей по ВД в год τ–1 в возрасте t–1

 

 

На рис. 2 представлено распределение возраста убытия в 1991 г. 

Рисунок 2.
Распределение возраста убытия.

 

Обращает на себя внимание ушедшие из жизни молодые люди в возрасте 19–22 года (более 30 тыс.человек). Автор не располагает объективными данными, позволяющими адекватно объяснить причину этого факта. 

Локальные минимумы и максимумы в 60-х и 70-х годах связаны не с какими-то особенностями медицинского характера, а с неравномерным распределением численности людей различных возрастных групп (рис. 1).

Данная диаграмма позволяет вычислить средний возраст убытия как

Так, средний возраст убытия в 1991 г. составлял 68,8 лет

Однако данная величина не является средней продолжительностью жизни, поскольку зависит от распределения жителей по возрасту, т. е. от ВД. Она также не учитывает численность живых долгожителей, которая также влияет на величину средней продолжительности жизни.

Если отнести число убывших людей к общей численности соответствующей возрастной группы (из возрастной диаграммы), получим распределение доли убытия в соответствующей возрастной группе.

Это доля является ни чем иным как условной вероятностью убытия в возрасте t при условии дожития до него — P(t/t–1), т. е. неухода в предыдущие возрастные группы 1, 2, … t–1 (рис. 3).

Рисунок 3. 
Зависимость вероятности ухода от возраста.

Как видно, с увеличением возраста, начиная с 50 лет, вероятность убытия монотонно возрастает, что вполне объяснимо и логично. Колебания распределения в области старших возрастов обусловлены низкой статистикой долгожителей.

Для получения распределения продолжительности жизни необходимо вычислить вероятность ухода в данном возрасте, которая будет равна произведению вероятности дожития до данной возрастной группы Pl (t–1), т. е. вероятность неухода в предыдущие возрастные группы 1, 2, … t–1 на условную вероятность ухода в текущей возрастной группе t P(t/t–1)

Поскольку данный метод не учитывает смертность в возрасте до одного года, вероятность ухода в 1-й год (t =1) определяется как

,

вероятность дожития до возрастной группы t, т.е неухода в предыдущие возрастные группы 1, 2, … t–1, равна произведению вероятностей неухода в каждой из предыдущих возрастных групп

На рис. 4 представлена зависимость вероятности дожития до возраста t.

Рисунок 4.
Зависимость вероятности дожития.

Окончательно получаем:

Значение вероятности ухода в столетнем возрасте при условии дожития до него принимается равной единице

Рисунок 5.
Вероятность ухода в возрасте t.

Рис. 5 представляет зависимость вероятности ухода в возрасте t, которая численно (поскольку интервал разбиения равен одному году) равна выборочной функции плотности распределения возраста ухода (с размерностью [1/год]). 

Весьма драматично выглядит интервал в возрасте 19–21 год, который наглядно представляет увеличение доли убытия молодых людей в этом возрасте в начале 90-х годов. 

Учитывая то, что интервал квантования составляет 1 год, функция распределения продолжительности жизни (рис. 6) численно определяется как

Рисунок 6.
Функция распределения продолжительности жизни.

Не трудно убедиться, что сумма всех вероятностей на всем интервале возрастов равна единице:

Средняя продолжительность жизни определяется как

В 1991 году средняя продолжительность жизни составляла 72 года. Это значение существенно выше общепринятого. Обнуление отрицательной убыли населения за счет иммиграции приводит к снижению оценки средней продолжительности не более, чем на 1–2 года. 

На рис. 7 представлена функция плотности распределения, в которой отрицательные значения убыли населения заменены смертностью равной смертности в 33-летней возрастной группой (что, конечно, явно завышено и неадекватно реальности). Как видно, такая замена привела к снижению средней продолжительности жизни всего на 1,8 года.

Рисунок 7.
Вероятность ухода в возрасте t
при искусственном завышении смертности в возрастной группе 1–25 лет

Автор не встретил в литературе и интернете детального расчета средней продолжительности жизни в России на основе таблиц смертности. В этой связи он не может объяснить отличия рассчитанного значения средней продолжительности жизни в данной работе от приводимых в литературе и на сайте Росстата. 

В табл. 1 представлены исходные данные (возрастные диаграммы) и промежуточные результаты вычислений, позволяющие проверить адекватность проведенного анализа для 1991 года.

Таблица 1.

Возраст, t ВД-1990, N(t) ВД-1991, N(t) Число ушедших, Nd(t) P(t/t–1) 1–P(t/t–1) П{1–P(t/t–1)} {П(1–P(t/t–1)}
P(t/t–1)
0 2 123 530 1 964 547          
1 2 310 881 2 115 235 8295 0,00392 0,996078 0,99607 0,00392155
2 2 454 150 2 310 866 15 0,00001 0,999994 0,99607 6,46562E-06
3 2 468 247 2 456 950 1 0,99607 0
4 2 373 356 2 472 633 1 0,99607 0
5 2 406 796 2 376 147 1 0,99607 0
6 2 465 737 2 411 771 1 0,99607 0
7 2 316 112 2 472 154 1 0,99607 0
8 2 209 876 2 324 549 1 0,99607 0
9 2 204 952 2 215 781 1 0,99607 0
10 2 166 429 2 213 131 1 0,99607 0
11 2 160 362 2 171 930 1 0,99607 0
12 2 123 318 2 165 394 1 0,99607 0
13 2 145 965 2 128 138 1 0,99607 0
14 2 100 925 2 150 135 1 0,99607 0
15 2 070 264 2 103 004 1 0,99607 0
16 2 011 907 2 071 294 1 0,99607 0
17 2 065 605 2 024 621 1 0,99607 0
18 2 003 243 2 066 259 1 0,99607 0
19 1 984 703 1 991 845 11398 0,00572 0,994278 0,99037 0,00570
20 1 907 787 1 975 904 8799 0,00445 0,995547 0,98596 0,00441
21 1 839 093 1 894 115 13672 0,00722 0,992782 0,97885 0,00712
22 1 854 534 1 834 106 4987 0,00272 0,997281 0,97618 0,00266
23 1 957 511 1 850 360 4174 0,00226 0,997744 0,97398 0,00220
24 1 997 892 1 952 026 5485 0,00281 0,99719 0,97124 0,00274
25 2 112 153 1 995 055 2837 0,00142 0,998578 0,96986 0,00138
26 2 296 202 2 108 513 3640 0,00173 0,998274 0,96819 0,00167
27 2 431 828 2 292 722 3480 0,00152 0,998482 0,96672 0,00147
28 2 577 368 2 432 215 1 0,96672 0
29 2 644 531 2 573 087 4281 0,00166 0,998336 0,96511 0,00161
30 2 624 267 2 649 798 1 0,96511 0,00000
31 2 626 786 2 621 184 3083 0,00118 0,998824 0,96398 0,00114
32 2 594 515 2 622 898 3888 0,00148 0,998518 0,96255 0,00143
33 2 524 672 2 592 537 1978 0,00076 0,999237 0,96181 0,00073
34 2 536 341 2 521 237 3435 0,00136 0,998638 0,96050 0,00131
35 2 560 717 2 532 158 4183 0,00165 0,998348 0,95892 0,00159
36 2 349 587 2 557 285 3432 0,00134 0,998658 0,95763 0,00129
37 2 398 874 2 344 514 5073 0,00216 0,997836 0,95556 0,00207
38 2 330 291 2 397 053 1821 0,00076 0,99924 0,95483 0,00073
39 2 250 792 2 324 744 5547 0,00239 0,997614 0,95255 0,00228
40 2 362 918 2 249 333 1459 0,00065 0,999351 0,95193 0,00062
41 1 963 017 2 357 341 5577 0,00237 0,997634 0,94968 0,00225
42 1 926 862 1 957 715 5302 0,00271 0,997292 0,94711 0,00257
43 1 755 777 1 922 693 4169 0,00217 0,997832 0,94506 0,00205
44 1 066 375 1 749 238 6539 0,00374 0,996262 0,94152 0,00353
45 830 920 1 062 536 3839 0,00361 0,996387 0,93812 0,00340
46 770 711 827 431 3489 0,00422 0,995783 0,93417 0,00396
47 1 170 699 766 944 3767 0,00491 0,995088 0,92958 0,00459
48 1 859 167 1 166 617 4082 0,00350 0,996501 0,92633 0,00325
49 1 957 007 1 847 692 11475 0,00621 0,99379 0,92057 0,00575
50 2 215 837 1 946 002 11005 0,00566 0,994345 0,91537 0,00521
51 2 261 682 2 200 202 15635 0,00711 0,992894 0,90886 0,00650
52 2 267 436 2 244 192 17490 0,00779 0,992207 0,90178 0,00708
53 1 900 429 2 249 913 17523 0,00779 0,992212 0,89476 0,00702
54 1 677 994 1 883 139 17290 0,00918 0,990819 0,88654 0,00822
55 1 357 252 1 661 870 16124 0,00970 0,990298 0,87794 0,00860
56 1 348 852 1 342 648 14604 0,01088 0,989123 0,86839 0,00955
57 1 655 703 1 332 366 16486 0,01237 0,987627 0,85764 0,01074
58 1 645 850 1 635 398 20305 0,01242 0,987584 0,84700 0,01065
59 1 826 231 1 622 938 22912 0,01412 0,985882 0,83504 0,01196
60 1 863 593 1 800 535 25696 0,01427 0,985729 0,82312 0,01192
61 1 889 975 1 831 256 32337 0,01766 0,982342 0,80859 0,01453
62 1 802 080 1 856 050 33925 0,01828 0,981722 0,79381 0,01478
63 1 676 011 1 765 155 36925 0,02092 0,979081 0,77720 0,01661
64 1 452 619 1 639 972 36039 0,02198 0,978025 0,76012 0,01708
65 1 339 536 1 420 335 32284 0,02273 0,97727 0,74284 0,01728
66 1 156 407 1 307 217 32319 0,02472 0,975276 0,72448 0,01837
67 960 721 1 126 868 29539 0,02621 0,973787 0,70549 0,01899
68 814 627 933 515 27206 0,02914 0,970856 0,68493 0,02056
69 733 440 789 244 25383 0,03216 0,967839 0,66290 0,02203
70 747 319 708 583 24857 0,03508 0,96492 0,63964 0,02325
71 742 365 717 521 29798 0,04153 0,958471 0,61308 0,02656
72 583 712 711 547 30818 0,04331 0,956689 0,58653 0,02655
73 595 648 555 702 28010 0,05040 0,949595 0,55696 0,02956
74 698 963 566 202 29446 0,05201 0,947994 0,52800 0,02897
75 823 669 661 445 37518 0,05672 0,943279 0,49805 0,02995
76 713 882 775 530 48139 0,06207 0,937928 0,46713 0,03092
77 733 323 667 867 46015 0,06890 0,931102 0,43495 0,03218
78 603 325 681 793 51530 0,07558 0,92442 0,40208 0,03287
79 573 466 555 786 47539 0,08553 0,914465 0,36768 0,03439
80 470 775 524 130 49336 0,09413 0,905871 0,33307 0,03461
81 418 394 426 015 44760 0,10507 0,894933 0,29808 0,03500
82 362 326 374 871 43523 0,11610 0,883899 0,26347 0,03461
83 308 880 320 523 41803 0,13042 0,869579 0,22911 0,03436
84 264 340 270 057 38823 0,14376 0,856241 0,19617 0,03294
85 215 065 228 500 35840 0,15685 0,843151 0,16540 0,03077
86 177 482 182 677 32388 0,17730 0,822703 0,13608 0,02933
87 144 116 149 178 28304 0,18973 0,810267 0,11026 0,02582
88 98 332 118 599 25517 0,21515 0,784846 0,08654 0,02372
89 88 763 80 140 18192 0,22700 0,772997 0,06689 0,01964
90 50 850 68 916 19847 0,28799 0,712012 0,04763 0,01926
91 42 118 39 606 11244 0,28390 0,716104 0,03411 0,01352
92 28 930 31 810 10308 0,32405 0,675951 0,02305 0,01105
93 22 886 20 816 8114 0,38980 0,610204 0,01407 0,00899
94 16 857 16 578 6308 0,38050 0,619496 0,00872 0,00535
95 11 417 11 808 5049 0,42759 0,572409 0,00499 0,00373
96 8 578 7 918 3499 0,44190 0,558095 0,00278 0,00220
97 7 170 5 785 2793 0,48280 0,5172 0,00144 0,00134
98 4 395 5 071 2099 0,41392 0,586078 0,00084 0,00060
99 15 908 2 963 1432 0,48329 0,516706 0,00044 0,00041
100 0 11559   1     0,00044
Сумма 145 541 551 146 309 199 1 437 077     Сумма 1
Средний возраст жителейубытия 34,89 35,05 68,76     СППЖ 72,01

3. Результаты

На рис. 8 представлены две возрастные диаграммы России. Такой «изрезанной» диаграммы, что обусловлено социальными катаклизма (войны, голод) и их демографическими эхо, нет ни в одной стране.



Рисунок 8.
Возрастные диаграммы для 1991 и 2010 года. 

Не одно поколение будет сталкиваться с демографическими проблемами, порожденными в прошлом веке. В какие-то периоды у нас будет не хватать школ, вузов, рабочих мест, а в какие-то периоды — учеников, студентов, рабочих.

На прогнозируемой половозрастной диаграмме Росстата (рис. 9) на 2031 г. видны провалы, обусловленные Великой Отечественной Войной (в области 90-летних), первым ее эхом (в области 65-летних), демографическим обвалом 90-х (период 40–30 лет), эхом 90-х (период 20–25 лет).

Рисунок 9.
Прогнозируемые Росстатом половозрастные диаграммы на 2031 год.

В принципе, по представленным смежным прогнозируемым возрастным диаграммам можно было бы и спрогнозировать и распределение продолжительности жизни. Однако, приведенный метод, основанный на разности смежных возрастных диаграмм, очень чувствителен к ошибкам их построения. 

Рис. 10 представляет динамику изменения возрастных диаграмм. Как видно, даже на 5-летнем интервале они весьма близки. На смежных интервалах в возрастных группах до 50 лет они отличаются на доли и единицы процентов. Такую точность прогноза половозрастных диаграмм обеспечить весьма проблематично.

Рисунок 10. 
Возрастные диаграммы.

В связи с этим, оценку распределении продолжительности жизни следует проводить по фактическим возрастным диаграммам.

Рисунок 11. 
Зависимости вероятности ухода от возраста.

На рис. 11 представлены зависимости вероятности ухода от возраста для 1991, 2000, 2010-го годов, полученные на основе разностного метода по смежным возрастным диаграммам. Как видно, кривая для 2010 г. ниже других, что свидетельствует о повышении продолжительности жизни. 

На рис. 12 представлены функции плотности распределения продолжительность жизни и её средние значения для этих же годов, доказывающие факт, увеличения средней продолжительности жизни.





Рисунок 12. 
Функции плотности распределения продолжительности жизни

Как видно, данная функция плотности распределения продолжительности жизни трансформировалась из двухмодальной в 1991 году в логически объяснимую колоколообразную ассиметричную функцию в 2010 г.

Практически на всем 20-летнем интервале происходило увеличение среднего возраста населения России (рис. 13).

Рисунок 13. 
Изменение среднего возраста населения.

Рисунок 14. 
Средний возраст ухода.

Средний возраст ухода (рис. 14) коррелирован со средней продолжительностью жизни, но не эквивалентен ей, поскольку определяется распределением жителей по возрасту, т. е. возрастной диаграммой

Рис. 15 представляет изменение средней продолжительности жизни, рассчитанная по изложенной методике, а также данные Росстата, ООН (http://www.unescap.org/stat/data/syb2008/syb2008_web/index.asp) и ЦРУ США [https://www.cia.gov/]. 

Рисунок 15. 
Изменение средней продолжительности предстоящей жизни.

4. Обсуждение

Падение средней продолжительности жизни после 1999 г. является следствием 90-х годов. Естественное запаздывание вполне объяснимо.

Однако полученные графики изменения средней продолжительности жизни в России существенно отличаются от данных Росстата, ООН и ЦРУ США. Удивляет результат расчета Росстата на 1994 г., который существенно ниже зарубежных данных. 

Чем отличается методика расчета Росстата и ООН? Нет ли в зарубежных оценках тенденции намеренно занизить оценку средней продолжительности жизни в России?

По сути, если строго, то полученные распределения и динамика средней продолжительности справедливы лишь для лиц, доживших до 30 лет.

Если для начала 90-х годов неучет смертности в возрастной группе 1–30 лет вызывает максимум снижения оценки продолжительности жизни не более как на 1–1,5 года, то для периода 2005–2010 это снижение никак не может быть более чем на 1 год. А расхождение между данными ООН и ЦРУ составляет около 6 лет, расхождение с Росстатом — около 3-х лет.

К сожалению, автор не встретил детального расчета продолжительности жизни. В этой связи автор будет весьма признателен за все замечания к представленной методике расчета.

5. Выводы

Приводимые в многочисленных материалах данные по средней продолжительности жизни в России представляются весьма заниженными. 

В разделе «Методология» на сайте Росстата следовало бы привести подробную, прозрачную методику расчета средней продолжительности жизни. Это позволило бы устранить различного рода спекуляции по данному вопросу, а также было бы полезным для студентов, специализирующихся в области демографии.


Дата публикации: 2011-11-01 12:45:19