dateNaissance age ageRef
<anneeMois> <int> <int>
1: 1980-01 50 50
2: 1980-01 51 51
3: 1980-01 52 52
4: 1980-01 53 53
5: 1980-01 54 54
6: 1980-01 55 55
7: 1980-01 56 55
8: 1980-01 57 55
9: 1980-01 58 56
10: 1980-01 59 57
11: 1980-01 60 57
12: 1980-01 61 57
13: 1980-01 62 57
14: 1980-01 63 57
15: 1980-01 64 55
16: 1980-01 65 55
17: 1980-01 66 55
3 Carrière et rémunérations
3.1 Préparation de l’effet horizon
L’effet horizon désigne la modification des carrières à l’approche du départ à la retraite. En effet, on remarque qu’à une certaine distance à la retraite, les comportements sur le marché du travail évoluent. Un exemple théorique donné est le manque d’investissement dans la formation continue. Ainsi, un employeur ou un travailleur renonceront à une formation car cet investissement en temps n’est plus “rentable” en fin de carrière. (Voir ici pour une note technique.)
Dans Trajectoire, nous retenons de cette observation qu’à partir de 50 ans les comportements ne dépendent plus vraiment de l’âge mais plutôt de la distance à « l’âge de la retraite », défini ici comme l’âge d’ouverture des droits (AOD). Ainsi, pour les simulations de carrière, au lieu de p dans la matrice de transition, qui donne pour chaque âge les probabilité de passage d’un état à un autre (par ex. de fonctionnaire d’état à temps plein à agriculteur salarié ; cf. étape 3.14), on attribue à chaque personne à l’approche de la retraite un âge fictif (ageRef
) qui permet de lui simuler un comportement plus réaliste.
Par exemple pour la génération 1980, cela se concrétise de la façon suivante. A 56 ans,
Pour les hommes, cadre du privé, nés en France, étant dans leur état depuis plus de 8 ans, dans le troisième tercile d’âge de premier emploi la proba de passer au chômage sur l’année suivante est pour les 58 ans, de 0.6 %, car c’est celle des individus de 56 ans de notre matrice d’apprentissage, au lieu de 0.7 % si on avait gardé la transition observé des 58.
3.2 Choix de l’hypothèse salaire moyen par tête
Cette étape filtre les séries prolongées fournies par le Conseil d’orientation des retraites (COR) sur l’hypothèse de Salaire moyen par tête (SMPT) que l’on souhaite retenir. L’idée est de repousser au maximum le choix de l’hypothèse de croissance du SMPT du COR afin que des variantes d’hypothèses de SMPT soient rapides à exécuter.
3.3 Différentiation des hypothèses de salaire moyen par caisse
L’hypothèse globale d’évolution du salaire moyen ne correspond pas nécessairement aux évolutions sectorielles des salaires moyens pour les cotisants auprès d’un régime de retraite particulier.
Trajectoire utilise par défaut le SMPT, mais pour la fonction publique, il existe un SMPT uniquement pour le traitement (hors prime) et un SMPT de la rémunération totale ce qui permet d’en déduire une part de primes.
3.4 Prolongement des paramètres
Les séries de paramètres sont prolongées en suivant la méthode de prolongement choisie en amont (étape 2.29).
3.5 Dérivation de paramètres calculés
Certains paramètres peuvent être déduits mathématiquement de paramètres connus : c’est le cas du Smic horaire que nous déduisons du salaire validant un trimestre d’assurance veillesse dans le secteur privé, fixé statutairement à 150 fois le montant du Smic horaire (article R. 351-9 CSS).
3.6 Passage des rému fonc en EQTP
La rémunération des fonctionnaires est convertie en rémunération en équivalent taux plein (EQTP) en utilisant la quotité de travail calculée au préalable (cf. étape 2.28).
A noter : les fonctionnaires en temps partiel à 80 % et 90 % bénéficient en réalité d’une fraction de rémunération plus que proportionnelle, respectivement de plus de 85 % (6/7èmes) et plus de 91 % (32/35èmes).
Champ: Rémunérations non nulles et hors temps plein.
3.7 Passage des caisses aux états
Pour le calcul ultérieur des droits à la retraite, il est nécessaire de définir des “états” sur le marché du travail plus précis que le simple régime de cotisation. C’est ce qui est fait à cette étape.
3.7.2 Création des états
A chaque ligne id * année * caisse, on associe un état. En plus de ventiler l’appartenance à la Cnav en plusieurs états différents, on en profite aussi pour introduire des états à temps partiel pour les fonctionnaires.
La liste des états résultants de l’ensemble des traitements est la suivante:
[1] "Salarie du prive non cadre" "AVPF"
[3] "Contractuel de la FP" "Salarie du prive cadre"
[5] "FPT ou FPH" "FPE"
[7] "Independant" "ENIM"
[9] "CANSSM" "SNCF"
[11] "MSA salarie" "RATP"
[13] "Exploitant agricole" "FPT ou FPH temps partiel"
[15] "FPE temps partiel" "Liberal"
[17] "CNIEG" "CRPCEN"
[19] "BDF" "CAVIMAC"
3.8 Distinction états principaux et secondaires
L’objectif de cette étape est d’obtenir une base cylindrée dtIdAn
comprenant, pour chaque individu et pour chaque année, un unique état principal et éventuellement un état secondaire. L’état (principal ou secondaire) peut être travaillé (section précédente), ou non travaillé (inactif, AVPF, maladie, chômage, invalidité).
Pour chaque individu, les informations accessibles via l’EIC sont limitées à la période active, qui est comprise par construction de l’enquête dans la tranche d’âge 14-70 ans. Pour un individu donné, plusieurs cas de figure sont possibles au cours d’une année :
- Aucune information n’est disponible \(\Rightarrow\) L’individu sera considéré comme “Inactif” ou comme “Retraité” ;
- Aucune information liée à une période travaillée n’est renseignée (trimestres cotisés, rémunération, AVPF), et au moins une période non travaillée est renseignée (trimestres ou points gratuits au titre de la maladie, du chômage ou de l’invalidité) \(\Rightarrow\) l’état principal attribué est non travaillé.
- Une seule période d’activité est renseignée \(\Rightarrow\) L’état principal attribué est un état travaillé.
- Si une information concernant une période non travaillée est renseignée \(\Rightarrow\) Un état secondaire non travaillé est attribué.
- Au moins deux périodes travaillées sont renseignées \(\Rightarrow\) les deux état travaillés les plus importants (au sens du nombre de trimestres cotisés, puis du montant des rémunérations, puis du nombre de trimestres validés) sont attribués en état principal et en état secondaire.
Pour les individus ayant plus de deux caisses de retraite de base une même année, seules les deux principales sont retenues.
3.9 Dernier état travaillé
Lorsqu’un individu a pour état principal un état non travaillé (chômage, maladie, invalidité), son état secondaire devient son dernier état travaillé. Cela augmente la probabilité qu’un individu transite vers son dernier état travaillé à partir d’un état non travaillé. L’hypothèse est qu’une enseignante passant en maladie longue durée a une forte chance de revenir vers la fonction publique lorsqu’elle reprend le travail.
Parmi les individus avec un état non travaillé, la part des individus ayant eu des droits à l’Ircantec et à l’Agirc a fortement augmenté. Par ailleurs, la part des individus avec un état non travaillé et ayant eu des droits à la MSA salarié ou en tant qu’exploitant est élevée, au regard du faible nombre d’affiliés dans ces régimes.
3.10 Transformation des états retraités en actifs
Dans cette étape, on écrase les états “Retraite” en les remplaçant par le dernier état travaillé. En effet, on ne souhaite pas d’état “Retraite” lors du calcule de la matrice de transition étape 3.14, qui ne gère que les évolutions de carrière (la liquidation des droits à la retraite faisant l’objet d’un module spécifique). On souhaite donc des carrières jusqu’à 70 ans, même si elles sont fictives.
3.11 Identification des invalides parmi les inactifs SRE/CNRACL
Une personne invalide de la fonction publique est inactive du point de vue de l’EIC car elle ne cotise pas et n’obtient pas de trimestre gratuit. Néanmoins, on l’identifie comme invalide car elle aura un départ à la retraite à l’AOD sans décote. L’idée sous-jacente est que les transitions doivent générer des invalides de façon endogène, en cas de variante de decalage de l’AOD par exemple.
Ainsi, pour chaque couple etat1 “inactif” et etat2 dans la fonction publique (après 49 ans), on transforme l’etat1 en “invalidité”. On fait donc l’hypothèse que les anciens de la fonction publique devenus inactifs en fin de carrière le sont en raison d’une invalidité.
3.12 Age du premier emploi
Le diplôme n’est pas renseigné dans l’EIC et donc l’âge de premier emploi tel qu’observé dans l’EIC est utilisé comme proxy du niveau d’études. L’échantillon démographique permanent (EDP), qui contient cette variable, n’a pas été utilisé car elle y est mal renseignée. L’EDP ne faisant que 50% de l’EIC, les tests d’imputation des diplômes aux autres individus de l’EIC n’ont pas été concluants.
Le premier emploi est défini comme la première année au cours de laquelle les trimestres cotisés sont supérieurs ou égaux à 3 (pour les régimes de base à points (MSA exploitant et CNAVPL) on ajoute la condition : nombre de trimestres validés égal à 4 et nombre de points non nul). Effectivement, l’information sur le nombre de trimestres cotisés peut être absente de l’EIC pour certains régimes à points (ex: RSI avant 1973).
L’âge du premier emploi est utilisé au cours des étapes :
- étape 3.26 (simulation des salaires), via la médiane d’âge de premier emploi par génération ;
- étape 3.14 (transitions de carrière) , via les terciles d’âge de premier emploi par génération.
La distribution des âges de premier emploi se déplace vers la droite au fil des générations, conséquence attendue de l’allongement progressif de la durée moyenne des études.
On observe un petit pic dans la distribution en fin de carrière observée, quelle que soit la génération considérée. Cela s’explique par le fait que, lorsqu’un individu présent dans l’EIC n’a aucun période de travail enregistrée, on lui impute un âge de premier emploi correspondant à sa dernière année d’observation. Cette approximation ne pose pas problème dans la mesure où la variable âge de premier emploi n’est pas utilisée telle quelle, mais discrétisée en 3 modalités. Les individus dont l’état observé se limite à de l’inactivité alimenteront plutôt les effectifs du tercile de diplomés du supérieurs. Dans l’étape de transitions, l’impact sera limité car cette population pèsera sur les transitions de diplomés du supérieurs inactifs depuis plus de 8 ans.
3.13 Durée dans l’état
On veut savoir, pour chaque couple (id, année), depuis combien d’années le couple d’états principaux et secondaires est le même.
Cette variable de durée dans l’état est discrétisée en trois catégories “supérieure à 8 ans”, “entre 3 et 8 ans” et “moins de 3 ans”.
Elle est utilisée dans la matrice de transition (cf. étape 3.14) et permet d’apporter de la profondeur historique aux transitions de carrière basées sur des chaînes de Markov (cf. aussi étape 3.9).
En cas d’interruption de carrière et lors d’un retour à un état précédent, la durée dans l’état est réinitialisée à 1.
Pour un âge donné, on observe une baisse de la durée moyenne passée dans un couple d’états au fil des générations.
3.14 Matrice de transition
On estime la probabilité de transition entre chaque triplet (état principal, état secondaire) pour chaque âge, chaque tercile de l’âge de premier emploi (étape 3.12), chaque sexe, selon si la personne est née en France ou à l’étranger et chaque durée dans l’état à partir des transitions observées dans l’EIC.
Ces transitions entre états sont observées pour différentes années. Par exemple, lorsqu’on s’appuie sur les transitions 2011-2012, cela revient à prendre la génération 1960 comme modèle des comportements à 51 ans, ainsi qu’à 50 ans car la génération 1961 n’est pas dans l’EIC. La génération 1962 prend le relais pour 49 et 48 ans, etc. Le poids de chaque transition est multiplié par \(0.9^{anneeEic-1-annee}\) afin de surpondérer les observations récentes. La génération 1994, la dernière dans l’EIC 2017, sert de référence pour les comportements entre 14 et 22 ans.
Auparavant, on utilisait les transitions de l’année la plus récente. Pour des petits régimes, cela conduisait à probabilité de transition trop déterministes, telles que des transitions SNCF -> SRE à 100 % à 50 ans.
La conjoncture économique n’est pas prise explicitement en compte. On reproduit, par exemple, les dernières transitions observées de 40 à 41 ans quelle que soit l’année. Un système de calage peut néanmoins pallier à ce problème (cf. étape 3.23)
L’EIC contient des transitions travail-retraite qui ne sont pas prises en compte ici car sinon une legislation anachronique serait reproduite en projection .
L’effet horizon (défini à l’étape 3.1) est difficile à reproduite, car l’âge légal d’ouverture des droits à la retraite diffère d’un individus à l’autre. En effet à ce stade on ne connaît pas encore la carrière complète de l’individu. Trajectoire prend alors pour AOD le droit commun pour la génération de cet individu pour évaluer la “distance à la retraite”. Les “catégories actives” de la fonction publique posent problème, car leur âge d’ouverture des droits est inférieur à celui des autres statuts d’affiliés.
L’effet horizon, soit la transition vers un état de non-travail lors des âges proches de celui d’ouverture des droits à la retraite, est plus présent pour les individus restés moins de trois ans dans un état donné. La probabilité de changer d’état travaillé ou de passer à un état non travaillé est beaucoup plus élevée pour les individus restés moins de trois ans dans un état donné. La probabilité de passer à un état non travaillé est d’autant plus faible que l’individu est resté longtemps dans un état donné.
3.15 Trimestres octroyés sans cotisation
Plusieurs dispositifs accordent des trimestres “gratuits” pour les cotisants dans des situations particulières. En pratique, ce sont des organismes qui prennent en charge ces cotisations, comme la Caisse nationale d’assurance maladie (CNAM) pour les congés maladie longue durée ou les Caisses d’allocations familiales (CAF) pour les congés parentaux.
Un état principal “Salarié du privé non cadre” et état secondaire “Maladie” signifie que des trimestres gratuits au titre de la maladie ont été obtenus (plus rarement des points gratuits au titre de la maladie pour les régimes de base en points). De même pour un état principal “Maladie” et état secondaire “Salarié du privé non cadre” (pour la différence entre les deux cf. étape 3.9).
A partir de la base EIC, on calcule la distribution par sexe et par âge des trimestres gratuits obtenus (1, 2, 3 ou 4 trimestres) lorsque l’état de maladie est principal ou secondaire. En projection, lorsque un état “Maladie” est prévu, on tire dans cette distribution le nombre de trimestres gratuits.
Le fonctionnement est identique pour l’état “Chômage” ou “Invalide”.
Pour les états “AVPF” (parent au foyer ou aidant d’un adulte en situation de handicap ou d’invalidité), on calcule la distribution observée du nombre de Smic AVPF. Un nombre de Smic AVPF est attribué, à partir duquel l’assuré obtient des trimestres cotisés.
3.16 Distribution des trimestres validés par les fonctionnaires
Contrairement aux salariés du secteur privé, la durée validée (pour les droits à lq retraite) des fonctionnaires dépend de la durée calendaire travaillée. Ce sont en général les années de début et de fin de période de travail qui sont susceptibles de générer moins de 4 trimestres validés, avec par exemple une première prise de poste en septembre et un départ à la retraite en juin. Une variable qualitative moment
est créée pour indiquer si tel état correspond à un début (1ère année), une fin (dernière année) ou un milieu (le reste) de période de travail.
Dans l’EIC, la distribution des trimestres validés par les fonctionnaires peut alors être déterminée, en fonction de la caisse, du sexe, de l’état (principal ou secondaire) et du moment pour les individus avant 50 ans.
Dans l’exemple illustré par le graphique ci-dessous, on constate que de nombreux individus valident moins de 4 trimestres en début et en fin de période de travail.
3.17 Générations intermédiaires
Principe général
Certaines générations sont manquantes dans l’échantillon de l’EIC (Trajectoire en bref - Sources). La simulation des générations intermédiaires est importante dans l’optique de modéliser des événéments touchant spécifiquement une partie de la population non observée (par exemple un changement de législation impactant spécifiquement les individus de la génération 1991).
Pour simuler une génération, on utilise comme référence la dernière génération connue et l’on “duplique” les observations de cette référence. (Ensuite, les carrières sont prolongées classiquement avec les autres à l’étape 3.23). De façon plus explicite, le tableau suivant résume les génération de référence pour chaque génération simulée :
Génération simulée | Génération de référence |
---|---|
1951, 1952, 1953 | 1950 |
1955 | 1954 |
1957 | 1956 |
1959 | 1958 |
1961 | 1960 |
1963 | 1962 |
1965 | 1964 |
1967 | 1966 |
1969 | 1968 |
1971 | 1970 |
1973 | 1972 |
1975 | 1974 |
1977 | 1976 |
1979 | 1978 |
1981 | 1980 |
1983 | 1982 |
1985 | 1984 |
1987 | 1986 |
1989 | 1988 |
1991 | 1990 |
1993 | 1992 |
1995, 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022, 2023, 2024, 2025, 2026, 2027, 2028, 2029, 2030, 2031, 2032, 2033, 2034, 2035, 2036, 2037, 2038, 2039, 2040, 2041, 2042, 2043, 2044, 2045, 2046, 2047, 2048, 2049, 2050, 2051, 2052, 2053, 2054, 2055, 2056, 2057, 2058, 2059, 2060 | 1994 |
Une alternative est de “panacher” entre la génération précédente et la génération suivante. Par exemple, pour imputer la génération manquante 1961, on se référe dans ce cas aux générations 1960 et 1962. Pour faire des prédictions en 2012 disons, on veut des carrières jusqu’à 2012 donc jusqu’à 2012-1961=51 ans pour la génération 1961. Cela ne pose pas de problème pour les individus de la génération 1960 qui vont jusqu’à 52 ans : il suffit de ne pas considérer leur dernière année à 52 ans. Pour la génération 1962, la carrière s’arrête en revanche à 50 ans et il faudrait donc imputer ce qui se passe à 51 ans.
Exemple
Partant d’un individu de l’EIC de la génération 1946, on crée un individu né en 1947 qui a exactement la même carrière décalée d’une année sauf :
- sa pondération qui diffère pour être en accord avec le répertoire national d’identification des personnes physiques (étape 2.21)
- ses rémunérations annuelles qui sont revalorisés d’un an par le salaire moyen par tête (SMPT ; étape 3.2).
- ses salaires portés au compte au titre de l’AVPF (montantAvpf) sont revalorisés selon la valeur du Smic AVPF.
Cas des générations futures
Pour les générations futures de 1994 à 2002, on essaye au maximum d’exploiter les informations contenues dans l’EIC. Le raisonnement est le même : on observe la carrière de la génération 1994 jusqu’à 2017-1994=23 ans et donc pour la génération 1995 on duplique la carrière d’individus de la génération 1994 raccourcie de un an, donc jusqu’à leurs 22 ans ; 21 ans pour la génération 1996 ; 15 ans pour la génération 2002. Or dans l’EIC, les carrières débutent au plus tôt à 14 ans. A partir de la génération 2002 on n’a donc plus d’informations de carrière valable.
La simulation des nouvelles générations après 2002 est faite à l’étape 3.18.
3.18 Flux entrants lors des transitions
Deux flux sont considérés au cours de cette étape : l’immigration et les générations futures après 2003 (générations ayant 14 ans ou moins en 2017).
On s’intéresse uniquement aux flux entrants d’immigration car les flux sortants peuvent encore bénéficier d’une pension de retraite française et ne doivent donc pas disparaître de nos bases. (Les émigrants deviennent juste “inactifs” pour ce que l’on sait d’eux.) Les projections démographiques de l’Insee présentent habituellement uniquement les prévisions de solde d’immigration et non pas le détail entrants/sortants. On prolonge donc les flux entrants de façon détaillée par âge, sexe et année d’immigration, à partir des données d’entrants observées dans le passé et la pondération moyenne par sexe et génération (cf. étape 3.17).
Trajectoire prend en compte trois hypothèses d’immigration, basse, centrale et haute. Les populations s’imbriquent : les individus simulés pour l’hypothèse basse sont inclus dans la centrale, et ceux simulés en sus pour l’hypothèse centrale sont inclus dans la haute. On procède ainsi pour ne pas introduire des variations purement aléatoire dans la comparaison de variante à variante.
Pour la même raison, on procède au tirage des aléas individuels (étape 3.19) avant de sélectionner la variante d’immigration. Ces aléas ne changeront donc pas avec les variantes. Fixer une graine aléatoire après avoir décidé d’une l’hypothèse d’immigration ne garantirait alors pas qu’un même individu ait les mêmes aléas.
Les immigrés sont considérés comme inactif au sens des états TRAJECTOiRE l’année de leur arrivé et ce depuis un an. L’ancienne mouture de TRAJECTOiRE les considérait comme inactifs de longue durée. On suppose que leur niveau de diplôme est inférieur à la médiane.
Les entrants à 14 ans (générations ultérieures à 2003) sont aussi supposés inactifs de courte durée. Leur niveau de diplôme est celui de leur génération de référence (cf. étape 3.17).
3.19 Tirage des aléas
Après que tous les individus simulé ont été ajoutés (les générations manquant dans l’EIC à l’étape 3.17 et les nouveaux arrivants à l’étape 3.18), Trajectoire tire des “aléas” individuels, c’est-à-dire des nombres aléatoire servant de base aux calculs ultérieurs.
Cette étape peut paraître sous-optimale car on crée des bases assez lourdes (les aléas étant de type numeric
) mais celle-ci est primordiale afin que les individus aient les mêmes comportements dans des variantes. Par exemple aleaLiquidation
détermine la propension à partir tôt ou tard à la retraite. On souhaite qu’un individu liquidant sa retraite tôt ait le même comportement dans une variante. Sa date de liquidation pourrait changer si la législation est modifiée mais l’individu sera maintenu dans la catégorie de ceux partant à la retraite rapidement. Cela permet d’éviter d’introduire de l’aléatoire dans la comparaison entre les variantes.
Une grande majorité des aléas sont individuels mais quelques uns sont de plus annuels (id * année). Ces bases sont lourdes et les aléas annuels doivent être utilisés avec parcimonie. Par exemple pour les simulations de trimestres accordés sans cotisation, une hypothèse acceptable d’aléas purement individuels (et non pas annuels) est retenue afin de ne pas surcharger les bases.
Aléas de carrière non annuels
[1] "aleaMoisNaissancev" "aleaMoisNaissanceManquant"
[3] "aleaMort" "aleaChomageCalage"
[5] "aleaEmploiCalage" "aleaNbEnfant"
[7] "aleaNaissanceEnfant" "aleaProbaTrimEtrg"
[9] "aleaDistribTrimEtrg" "aleaNonRecoursTotal"
[11] "aleaNonRecoursPartiel" "aleaResident"
[13] "aleaActifFP" "aleaProbaTrimBonif"
[15] "aleaDistribTrimBonif" "aleaLiquidation"
[17] "aleaDureeChomage" "aleaDureeEmploi"
[19] "aleaDureeMaladie" "aleaInapte"
[21] "aleaEtranger" "aleaPrimesFonc"
[23] "aleaTPFonc"
Aléas de carrière anuels
[1] "aleaTransition" "aleaTrimGratuit" "aleaJoursTravailAn"
[4] "aleaResiduSalaire"
Aléas de retraite (non annuel)
[1] "aleaMort" "aleaMoisNaissanceManquant"
3.20 Simulation des caractéristiques des immigrants
On récupère de l’EIC les caractéristiques des individus nés à l’étranger afin de les distribuer aux nouveaux arrivants immigrés par sexe et âge d’arrivée.
##- Application de l’hypothèse d’immigration
Préparée à l’étape 3.18, l’hypothèse d’immigration est réellement prise en compte après le tirage des aléas (étape 3.19), afin de garantir l’invariabilité de la population simulée en cas de variante d’hypothèse d’immigration. Trajectoire ne retient à ce stade que les individus correspondants à l’hypothèse retenue.
3.21 Tirage du mois de naissance et décalage des mois de naissance
Un trimestre de naissance est simulé pour les valeurs manquantes dans l’EIC ainsi que pour les individus simulés.
Un autre tirage décale les mois de naissance de 1 ou 2 mois afin que des individus ne soient pas nés en début de trimestre. Cela est pertinent pour voir l’effet de réformes s’appliquent à un moment autre qu’en début de trimestre, mais également pour modéliser certains effets calendaires en fin de carrière.
On n’effectue pas ce décalage pour les individus retraités.
3.22 Préparation des cibles de cotisants et chômeurs
Sur la base de l’hypothèse retenue pour le taux de chômage de long terme (étape 2.1), nous faisons correspondre à chaque combinaison d’états de l’étape 3.8 des pondération “chômage”, “emploiTotal”, etc. utilisés pour le calage. Par exemple, pour une année donnée, un individu ayant pour état principal un état du régime général (Cnav) et sans état secondaire comptera comme 1 dans les catégories “cotisant Cnav” et “emploi total”. Au contraire, un individu ayant comme état principal un état travaillé affilié à la CNIEG et un état secondaire au chômage “pèsera” 0,66 dans les catégories “emploi total” et “cotisant CNIEG” et 0,33 dans la catégorie “chômage”.
3.23 Projection des carrières
Trajectoire simule des carrières pour toutes les années après la dernière année de l’EIC (2017), sur la base à la fois des transitions observées entre états (étape 3.14) mais en respectant les cibles définies par le COR pour certaines populations d’intérête (hypothèses de chômage et de nombre de cotisants notamment ; étape 3.22)
Un âge maximal de 55 ans jusqu’auquel les calages sur les cibles d’évolution d’effectifs données par le COR seront effectuées est défini. Ceci permet de simuler des évolutions endogènes en fin de carrière. Une liste de marges servant au calage est établie.
Le prolongement annuel des carrières se fait en deux étapes.
Premièrement, les carrières de l’EIC sont réécrites à partir d’un certain âge 57, pour lequel la matrice de transition s’applique en tenant compte des âges de référence déterminés durant l’étape 3.1. Cela permet d’éviter d’imputer des états à des individus alors qu’ils sont partis en retraite.
Dans un deuxième temps, on prolonge les carrières de l’année 2017 de l’EIC jusqu’à l’année 2099 de fin de projection. On somme les effectifs par sous-groupes de croisements de variables (couples d’état 1 et d’état 2, sexe, etc.) afin d’obtenir un effectif initial associé à chaque coefficient de probabilité de la matrice de transition. On somme ensuite ces effectifs de couples d’états pondérés par marge correspondante afin d’obtenir les effectifs totaux initiaux des marges sur lesquelles on souhaite se caler. On applique à ces effectifs totaux l’évolution des marges du COR afin de déterminer les cibles d’effectifs totaux à atteindre après l’application des transitions.
Afin d’obtenir les effectifs d’arrivée par marge, on effectue une opération similaire sur les effectifs d’arrivée. Les effectifs d’arrivée de sous-groupes de croisement de variables par couple d’états pondérés par marge correspondante sont sommés.
Les probabilités par croisement de variables sont ensuite minimalement déformés afin que les effectifs d’arrivée soient suffisamment proches des effectifs cibles par marge.
Ces sous-étapes sont détaillées ci-dessous.
3.23.1 Gestion du statut des régimes spéciaux
Certains régimes spéciaux sont “en extinction” à partir d’une certaine date. Cela signifie que les nouveaux employés passent au régime général, alors que les anciens employés continuent de cotiser dans la caisse du régime. Prenons l’exemple la SNCF à partir de 2020 : les transitions de type [Etat x] -> SNCF
sont transformées en [Etat x] -> Cnav (ex-régime spécial)
.
Il est possible de directement modifier les transitions vers la SNCF en transitions vers “Salarié du privé non cadre”. Mais garder le fait que c’est un régime spécial permet de maintenir une carrière de type régime spécial, avec des caractéristiques spécifiques (moindre risque de chômage par exemple ; plus haut salaire ; etc.).
3.23.2 Complétion des carrières après 57 ans jusqu’à 2017
Les données observées pour les carrières après 57 ans sont difficilement exploitables car des départs en retraite sont de plus en plus présents. Il y a donc ambiguïté entre passage à l’inactivité ou à la retraite. On réécrit donc les carrières après 57 ans avec la matrice de transition (cf. étape 3.14).
3.23.3 Complétion des carrières après 2017
3.23.3.1 Déformation de la matrice de transition
Si les cibles du COR en variation sont toutes non manquantes pour cette année, on procède à la déformation de la matrice de transition. A chaque case de départ de la matrice de transition (cf. étape 3.14), soit une combinaison donnée des variables etat1, etat2, sexe, age, paysNaissance, dureeDansEtatQuali (cf. étape 3.13), tercileAgePremierEmploi (cf. étape 3.12), on associe la population observée l’année A. Grâce aux probabilités de transition, on calcule l’espérance des populations qu’on aura en A+1. La comparaison avec les cibles d’évolution du COR est alors possible et donc la déformation minimale des probabilités de transition afin d’atteindre les chiffres du COR : un calage sur marge.
Cependant comme Trajectoire ne travaille que sur un ensemble fini de générations - qui s’arrête pour l’instant à la génération 2060 -, rapidement les populations de cotisants observées l’année A sont trop faibles et le calage sur marge s’épuiserait à chercher à obtenir des cibles impossibles.
Pour contrer cet effet, on impute une population des générations non simulées l’année A par simple proportionnalité de la dernière génération simulée en utilisant comme clé le nombre de naissances.
Ainsi, chaque année, on garde en mémoire la répartition de la génération 2060 à l’âge associé. Cette répartition sera récyclée pour les générations suivantes.
Usuellement le calage sur marge concerne des individus pondérés dont on modifie les pondérations afin que certaines sommes pondérées vérifient des cibles exogènes. Ici les unités sont des transitions et les pondérations sont les probabilités de transitions. Il faut prendre en compte le fait que la somme des probabilités pour une case de départ donnée vaut nécessairement 1. Entrer comme marge le fait que chaque sous-somme de probabilités doit valoir 1 conduit à une explosion du nombre de marges (~10 000) qui rend l’algorithme inopérant. On préfère fonctionner en deux étapes : un calage sur marge sur les seules cibles macro sans se soucier des probabilités devant valoir 1 suivi d’une normalisation afin de les rétablir à 1. Quand la normalisation conduit à une modification très faible des probabilités, le calage est accepté.
3.23.3.2 Passage à l’année suivante
Une fois la matrice de transition déformée, on l’applique simplement afin d’obtenir les états de l’année suivante grâce aux aléas (cf. étape 3.19). L’âge est incrémenté de un, ainsi que la durée dans l’état s’il n’y a pas eu de changement
Finalement on joint les nouveaux arrivants (cf. étape 3.18).
Auparavant, les nouveaux arrivants immigrés avaient un état d’arrivée d’inactivité, et n’entraient dans aucune cible. Désormais, ils peuvent avoir des états d’arrivés travaillés. Il faut donc réfléchir à les intégrer dans les calages.
La philosophie d’un modèle de microsimulation serait de faire beaucoup plus de choses que de simplement déterminer l’état de l’année suivante à cette étape. On pourrait à cet instant calculer la rémunération de la nouvelle année, les points, les départs en retraite et les pensions associées. Cela poserait peut-être des problèmes de performance mais rendrait certaines innovations plus naturelles à coder comme les militaires qui peuvent partir après 17 ans de service.
3.24 Imputation trimestres gratuits
A cette étape, on impute un nombre compris entre 0 et 4 de trimestres gratuits pour chômage ou maladie par année lorsqu’ils sont manquants, hormis pour les fonctionnaires, en utilisant la distribution calculée à l’étape 3.15 ainsi que l’aléa individuel de trimestre gratuit (étape 3.19).
Concernant les fonctionnaires, dans l’EIC, les périodes assimilées de service militaire, de formation, de maladie ou de maternité sont considérées comme cotisées.
3.25 Passage en une ligne par état
3.25.1 Description du cas général
Afin de préparer l’étape d’imputation des salaires étape 3.26 et le passage au format EIC, un passage au format long est effectué, à partir de la table dtIdAn
, de sorte à avoir une ligne par état dans une nouvelle table baseEqua
(contenant les lignes remuPourEqua
== TRUE (voir les examples ci-dessous), une autre table baseFinaleNonEqua
contient les lignes remuPourEqua
== FALSE):
Avant (format wide) :
id | annee | etat1 | etat2 |
---|---|---|---|
1 | 2000 | “Etat 1” | “Etat 2” |
Après (format long) :
id | annee | etat | etatPrincipal | remuPourEqua | etatSansTravailDansAnnee |
---|---|---|---|---|---|
1 | 2000 | “Etat 1” | TRUE | TRUE | FALSE |
1 | 2000 | “Etat 2” | FALSE | TRUE | FALSE |
Description des variables créées :
etatPrincipal
: indique si l’état provient d’un état principal, elle rentrera dans la prédiction de salaire.remuPourEqua
: indique si la ligne ainsi créée sera utilisée pour la prédiction de salaire.etatSansTravailDansAnnee
: indique s’il existe un état non travaillé dans l’année.
Les différents cas de figure possibles sont décrits ci-après :
3.25.2 État principal travaillé, état secondaire travaillé
Avant :
id | annee | etat1 | etat2 |
---|---|---|---|
1 | 2000 | Salarié du privé non cadre | CNAVPL |
Après (une ligne pour chaque état travaillé) :
id | annee | etat | etatPrincipal | remuPourEqua | etatSansTravailDansAnnee |
---|---|---|---|---|---|
1 | 2000 | Salarié du privé non cadre | TRUE | TRUE | FALSE |
1 | 2000 | CNAVPL | FALSE | TRUE | FALSE |
3.25.3 État principal travaillé, état secondaire non travaillé
Avant :
id | annee | etat1 | etat2 |
---|---|---|---|
1 | 2000 | Salarié du privé non cadre | Chômage |
Après (une ligne pour l’état travaillé) :
id | annee | etat | etatPrincipal | remuPourEqua | etatSansTravailDansAnnee |
---|---|---|---|---|---|
1 | 2000 | Salarié du privé non cadre | TRUE | TRUE | TRUE |
3.25.4 État principal travaillé, absence d’état secondaire
Avant :
id | annee | etat1 | etat2 |
---|---|---|---|
1 | 2000 | Salarié du privé non cadre | “Sans état secondaire” |
Après (une ligne pour l’état travaillé) :
id | annee | etat | etatPrincipal | remuPourEqua | etatSansTravailDansAnnee |
---|---|---|---|---|---|
1 | 2000 | Cnav Accro | TRUE | FALSE |
3.25.5 État principal non travaillé
Avant :
id | annee | etat1 | etat2 |
---|---|---|---|
1 | 2000 | Chômage | Salarié du privé non cadre |
Après (une ligne pour l’état non travaillé) :
id | annee | etat | etatPrincipal | remuPourEqua | etatSansTravailDansAnnee |
---|---|---|---|---|---|
1 | 2000 | Chômage | TRUE | FALSE | TRUE |
3.26 Imputation des salaires
3.26.1 Etapes préliminaires
Avant d’imputer les salaires manquants, plusieurs étapes préparatoires sont effectuées :
- Création de rémunérations relatives au SMPT
- Prise en compte d’une différence de rémunération femmes/hommes, via l’application d’un SMPT différent pour les hommes et les femmes (optionnel, non effectué dans le scénario central)
L’imputation des salaires relatifs (au SMPT) se fait par sous-population en fonction des variables de caisse, sexe et niveau de diplôme (approximé par la position individuelle par rapport à la médiane de l’âge de premier emploi).
Des distributions de référence des salaires relatifs jusqu’à l’âge de l’AOD de la génération de référence 1950 sont déterminées à partir des rémunérations observées, qui dépendent d’un croisement de variables ordonnées par importance : l’âge, la durée en emploi, si la caisse correspond à l’état principal, à la durée dans l’état, et à l’existence d’un état sans travail dans l’année.
A partir de ces distributions, on détermine un quantile moyen et l’écart-type du quantile individuel. On détermine également un quantile moyen et l’écart-type de la variable quantile sur la population observée, qui serviront aux individus sans rémunération observée.
Pour les années de rémunération manquante, on impute un quantile annuel à chaque individu en fonction de son quantile moyen (s’il existe), de son écart-type, de son aléa annuel de résidu de salaire.
Enfin, on attribue un salaire relatif annuel aux individus lorsque la rémunération annuelle est manquante, cela à partir de la distribution de salaires relatifs correspondante (en fonction de la catégorie de croisement de variables dans laquelle se trouve l’individu cette année là - par âge, puis si la caisse de la sous-population correspond à un état principal, s’il y a un état sans travail dans l’année, de la durée de l’état et de la durée en emploi) et compte tenu du quantile annuel de l’individu.
On complète ensuite les carrières avec le dernier salaire observé et s’il est manquant, avec le salaire moyen de l’âge précédent l’âge maximum de transition de 57 afin de ne pas affecter cette moyenne en cas de variante.
3.27 Passage de la rémunération relative au SMPT à la rémunération
Durant l’étape précédente, des rémunérations relatives au SMPT ont été imputées étape 3.26. La présente étape calcule des rémunérations en niveau en multipliant les rémunérations relatives par les différents SMPT fournis par le COR.
Pour la fonction publique, la rémunération correspond au traitement, la dynamique de croissance des primes est traitée dans l’étape 3.32.
3.28 Prolongement de dtIdAnCaisseFonctionnaire
Les informations individuelles par caisse des fonctionnaires sont prolongées à partir des chroniques d’états afin de compléter les informations par caisse des fonctionnaires : l’imputation de trimestres validés, le tirage des temps partiels et l’imputation de primes, les salaires ayant déjà été imputés en fonction d’états individuels dans l’étape 3.26.
3.29 Imputation des trimestres validés des fonctionnaires
L’imputation des trimestres validés des fonctionnaires à partir d’une distribution de trimestres validés (cf. étape 3.16) par caisse, sexe, état fonctionnaire (principal ou secondaire) dépend d’un aléa et du moment dans la carrière.
3.30 Tirage des temps partiels fonctionnaire
Le tirage de la quotité de travail unique sur toute la carrière à partir d’une distribution de quotités (cf. étape 2.28) par sexe et caisse dépend d’un aléa individuel.
3.31 Passage de la rémunération EQTP à la rémunération pour les fonctionnaires
La rémunération des fonctionnaires est calculée à partir de la rémunération en équivalent temps plein et de la quotité de travail.
3.32 Imputation des primes de fonctionnaires (et assimilés)
3.32.1 Description
L’étape 3.32 permet d’estimer les primes des fonctionnaires (afin de calculer les cotisations au Rafp dans l’section 7).
Dans un premier temps la part de prime des fonctionnaires est récupérée dans les DADS (étape 2.16). Pour les individus au SRE ou CNRACL ayant au moins une part de prime observée, on projette dans le futur, si besoin, leur dernière part observée. Pour les autres, n’ayant jamais eu de part observée dans leur caisse, on en tire une chaque année (avec le même aléa pour une cohérence entre primes) sur l’ensemble de leur carrière. Après 2016, les primes sont corrigées pour que les traitements et les primes suivent de façon cohérente le smpt du traitement et le smpt du traitement plus prime fournis par le COR. On a donc une augmentation de la part des primes jusqu’aux années 2035 environ. Les parts de primes projetées sont capées pour ne pas dépasser la part de prime maximale observée avant 2013 (pour éviter d’avoir une part de plus de 100%).
Les DADS n’ont pas permis d’estimer une part de prime pour les régimes spéciaux. Une part de prime arbitraire de 15% a été fixée pour les régimes spéciaux. Une alternative serait de calculer une part moyenne depuis les DADS (sur les régimes spéciaux, ou sur l’ensemble des fonctionnaires et assimilés).
3.32.2 Résultats
3.33 Répartition dans l’EIC base et complémentaire
3.33.1 Description
3.33.1.1 Conversion des états en caisses
L’objectif de l’étape 3.33 est de convertir chaque état annuel en caisse de base et caisse complémentaire, afin d’aboutir à un format id * annee * caisse :
Avant : | → | Après : | |
---|---|---|---|
etat | → | caisseBase | caisseComplementaire |
Salarié du privé non cadre | Cnav | Arrco | |
Salarié du privé cadre | Cnav Cnav |
Arrco Agirc (avant 2019) |
|
Contractuel de la FP | Cnav | Ircantec | |
MSA salarié | MSA salarié | Arrco | |
RSI | RSI base | RSI complémentaire (après 2004) | |
MSA exploitant | MSA exploitant | MSA exploitant complémentaire | |
SRE | SRE | Rafp (après 2004) | |
CNRACL | CNRACL | Rafp (après 2004) | |
{r} listeRegimesSpeciaux |
Régime spécial | Caisse complémentaire régimes spéciaux | |
CNAVPL | CNAVPL CNAVPL |
CARMF complémentaire CARMF supplémentaire |
La fusion Agirc-Arrco de 2019 est gérée en ne créant plus que des lignes Arrco après fusion. L’appellation “Arrco” est donc légèrement ambigüe : il s’agit bien de l’Arrco avant fusion mais du régime fusionné Agirc-Arrco après. On pourrait créer une caisse ad hoc “Agirc-Arrco”.
3.33.1.3 Somme des rémunérations par caisse de base
Les rémunérations sont sommées par (id * caisseBase), selon la logique suivante :
Avant :
etat1 | etat2 | remu1 | remu2 |
---|---|---|---|
Salarié du privé non cadre | Contractuel de la FP | 15000 | 10000 |
Après :
caisseBase | remu |
---|---|
Cnav | 25000 |
3.33.2 Résultats
Les effectifs annuels ont la forme caractéristique due à l’intervalle des générations simulées.
3.34 Fusion trimestres fonctionnaires dans dtIdAnCaisse
Les trimestres validés et les trimestres cotisés sont fusionnés avec les trimestres validés imputés dans la base dont la clé est id * an * caisse. Effectivement, le nombre de trimestres cotisés est égale au nombre de trimestre validés pour les fonctionnaires, car ils n’ont pas de trimestres chômage, les trimestres maladie sont assimilés et les invalides sont pensionnés.
3.35 Prolongement des autres bases
Avant l’étape 3.35, la base dtIdAnCaisseBasePoint
est uniquement renseignée pour les années ≤ 2017. L’objectif est alors de concaténer à cette bases les projections calculées précédemment pour les années comprises entre 2018 et 2100, à partir de la base dtIdAnCaisse
. De plus, les trimestres gratuits dans la base dtIdAnCaisse
sont prolongés par dtIdAnCaisseTrimGratuit
et la base prolongée id * caisse dtIdCaisseBase
est créée à partir de dtIdAnCaisse
.