Ce document contient une nouvelle analyse des résultats obtenus par l’expérience 20210601-DOTG. Elle est obtenue en utilisant R et RStudio au lieu de Python et Jupyter. La méthode proposée ici consiste à se concentrer uniquement sur les populations où le taux de transmission est aléatoire, afin d’isoler la période comme unique variable indépendante. Cela permet d’examiner son effet spécifique sur la précision moyenne des connaissances des agents, sans l’influence potentielle du mode et du taux de transmission.

Hypothèse initiale

L’amélioration de la précision moyenne des connaissances, au delà de celle atteinte par une population d’agent sans renouvellement, dépend uniquement de la période de renouvellement des agents, le taux de transmission étant ici aléatoire.

Procédure

L’analyse nécessite les packages rmarkdown, broom, cowplot et FSA.

  1. Télécharger l’archive des résultats de 20210601-DOTG à partir de DOI
  2. Télécharger le cahier d’analyse analysis.Rmd
  3. Décompresser l’archive (unzip)
  4. Ouvrir le cahier d’analyse dans RStudio.
  5. Exécuter (Knit) le cahier d’analyse.
Les deux derniers points peuvent également être réalisés en ligne de commande par:
$ Rscript -e "rmarkdown::render('./analysis.Rmd', output_file='index.html');"
La taille du fichier engendré peut être largement réduite et son format amélioré par l’utilisation du script stripHTML fourni ici:
$ bash stripHTML.sh index.html

Paramètres d’analyse (Analysis setting)

Populations caractérisées par la période de renouvellement des agents : 1 sans renouvellement d’agents (200001) et 3 avec des périodes de renouvellement différentes (5001, 10001, 20001);

Pour chaque période (200001, 5001, 10001, 20001), 5 populations résultant de la moyenne (average) de 10 expérimentations (runs) avec un taux de transmission aléatoire (random) sont disponibles dans results:

Variables et populations

independent variables: [‘period’]

dependent variables: [‘Max_avg_accuracy’, ‘Rank_max_avg_accuracy’, ‘Max_avg_successRate’, ‘Rank_max_avg_successRate’]

Populations moyennes (average des 10 runs par dossier d’origine) où la transmission est aléatoire (random)
Dossier_d_origine Periode Final_avg_accuracy Max_avg_accuracy Rank_max_avg_accuracy Max_avg_successRate Rank_max_avg_successRate
200001-1-random 200001 0.8437500 0.8437500 28100 0.9672640 200000
200001-0.8-random 200001 0.8375000 0.8375000 30537 0.9679870 200000
200001-0.6-random 200001 0.8687500 0.8687500 24229 0.9653000 200000
200001-0.4-random 200001 0.8875000 0.8875000 30819 0.9709135 200000
200001-0.2-random 200001 0.8562500 0.8562500 25930 0.9694690 200000
5001-1-random 5001 0.6471875 0.6910937 174987 0.5047060 190036
5001-0.8-random 5001 0.6315625 0.6795313 90018 0.5030275 200000
5001-0.6-random 5001 0.6281250 0.6628125 80012 0.4845299 199999
5001-0.4-random 5001 0.6445312 0.6754688 50010 0.5043066 199997
5001-0.2-random 5001 0.6073437 0.6703125 25005 0.4919930 200000
10001-1-random 10001 0.9201562 0.9229687 139808 0.7126590 200000
10001-0.8-random 10001 0.9068750 0.9240625 159974 0.7134460 190019
10001-0.6-random 10001 0.9296875 0.9350000 179988 0.7074420 200000
10001-0.4-random 10001 0.8989063 0.9035938 190018 0.7008515 200000
10001-0.2-random 10001 0.9035938 0.9265625 89958 0.7147048 190019
20001-1-random 20001 0.9492188 0.9560937 178974 0.8412415 200000
20001-0.8-random 20001 0.9739062 0.9870313 178541 0.8356260 200000
20001-0.6-random 20001 0.9553125 0.9559375 179863 0.8409005 200000
20001-0.4-random 20001 0.9312500 0.9373437 179634 0.8456875 200000
20001-0.2-random 20001 0.9625000 0.9625000 178219 0.8454125 200000

Populations où la transmission est aléatoire (random)

Représentations graphiques et statistiques descriptives

Moyennes et écarts types, par période, des précisions moyennes (avg.accuracy) finales et maximales
Periode Moyenne de la précision finale (Final_avg_accuracy) Ecart type de la précision finale (Final_avg_accuracy) Moyenne de la précision maximale (Max_avg_accuracy) Ecart type de la précision maximale (Max_avg_accuracy)
200001 0.8587500 0.0200585 0.8587500 0.0200585
5001 0.6317500 0.0158943 0.6758437 0.0105677
10001 0.9118438 0.0127243 0.9224375 0.0115417
20001 0.9544375 0.0158879 0.9597812 0.0179009


Comme l’illustrent les boîtes à moustaches ci-dessous, les moyennes et écarts types respectifs de la Précision moyenne Finale (Final_avg_accuracy) et de la Précision moyenne Maximale (Max_avg_accuracy) sont identiques pour la Période 200001 correspondant à l’absence de renouvellement d’agents. Cependant, pour les périodes de renouvellement effectif (5001, 10001, 20001), des différences de moyennes et d’ écarts-types s’observent entre ces deux variables, notamment pour la Période 5001.



Les périodes 10001 et 20001 de renouvellement effectif des agents présentent des moyennes de Précision moyenne Finale (0.91, 0.95) et de Précision moyenne Maximale (0.92, 0.96) supérieures à celles obtenues sans renouvellement d’agents (Période 200001, 0.86).

Au contraire, la période 5001 présente des moyennes de Précision moyenne Finale (0.63) et de Précision moyenne Maximale (0.67) inférieures à celles observées sans renouvellement d’agents (Période 200001, 0.86).

Tests d’hypothèses

Pour tester son hypothèse “Adding inter-generation transmission leads to higher accuracy than intra-generation transmission alone”, Yasser Bourahla (https://sake.re/20210601-DOTG/) effectue sur l’ensemble des populations (transmission aléatoire (random) ou contrôlée (learn)) :

  1. une Analyse de variance (ANOVA) de la Précision moyenne Finale (ici, Final_avg_accuracy) selon la Période qui indique un effet significatif ;

  2. un test de Tukey permettant de spécifier que l’effet de la Période sur la Précision moyenne Finale (Final_avg_accuracy) est significatif entre toutes les périodes

La variation de la Précision moyenne Finale (Final_avg_accuracy) étant établie (ANOVA, PR(>F) = 2.057993e-75) entre toutes les périodes (Test de Tukey, p-adj < 0.05), et les Précisions moyennes Finales des Périodes 10001 (0.91) et 20001 (0.95) étant supérieures à celles de la Période 200001 (0.86), Yasser Bourahla conclue à juste titre que son hypothèse est validée pour les Périodes 10001 et 20001. En effet, si les tests sont aussi significatifs pour la période 5001, sa Précision moyenne Finale (0.63) est inférieure à celle de la Période 200001 (0.86).

Ici, la même méthode est utilisée dans les populations où la transmission est aléatoire (random). Afin de tester l’hypothèse assez similaire selon laquelle “l’amélioration de la précision moyenne des connaissances, au delà de celle atteinte par une population d’agents sans renouvellement, dépend uniquement de la période de renouvellement des agents”, la Précision moyenne Maximale (Max_avg_accuracy) est aussi examinée. Une analyse de la variance entre les périodes (variance_inter) et au sein de chacune des périodes (variance_intra) est ajoutée afin de définir la part de la variance expliquée par la Période.

Précision moyenne selon la période dans les populations où la transmission est aléatoire (random)

ANOVA - Précision moyenne Finale
term df sumsq meansq statistic p.value
Periode 3 0.3098725 0.1032908 386.3852 3.918e-15
Residuals 16 0.0042772 0.0002673 NA NA
ANOVA - Précision moyenne Maximale
term df sumsq meansq statistic p.value
Periode 3 0.2381771 0.0793924 328.1783 1.418e-14
Residuals 16 0.0038707 0.0002419 NA NA
Test de Tukey - Précision moyenne Finale
diff lwr upr p adj
5001-200001 -0.2270000 -0.2565850 -0.1974150 0.0000000
10001-200001 0.0530938 0.0235088 0.0826787 0.0005227
20001-200001 0.0956875 0.0661025 0.1252725 0.0000004
10001-5001 0.2800938 0.2505088 0.3096787 0.0000000
20001-5001 0.3226875 0.2931025 0.3522725 0.0000000
20001-10001 0.0425937 0.0130088 0.0721787 0.0040203
Test de Tukey - Précision moyenne Maximale
diff lwr upr p adj
5001-200001 -0.1829062 -0.2110502 -0.1547623 0.0000000
10001-200001 0.0636875 0.0355435 0.0918315 0.0000414
20001-200001 0.1010313 0.0728873 0.1291752 0.0000001
10001-5001 0.2465937 0.2184498 0.2747377 0.0000000
20001-5001 0.2839375 0.2557935 0.3120815 0.0000000
20001-10001 0.0373438 0.0091998 0.0654877 0.0077568
Analyse de variance - Précision moyenne Finale
F_ratio = Variance.inter.groupe / Variance.intra.groupe;
Part de variance expliquée (R²) = Variance.inter.groupe / Variance.totale
Variance.inter Variance.intra Variance.totale F.ratio p.value
0.1032908 0.0002673 0.0165342 386.3852 3.918e-15 0.986
Analyse des variances - Précision moyenne Maximale
F_ratio = Variance.inter.groupe / Variance.intra.groupe;
Part de variance expliquée (R²) = Variance.inter.groupe / Variance.totale
Variance.inter Variance.intra Variance.totale F.ratio p.value
0.0793924 0.0002419 0.0127394 328.1783 1.418e-14 0.984

Dans les populations où la transmission est aléatoire (random), la variation de la Précision moyenne Finale (Final_avg_accuracy, ANOVA, p.value = 3.918e-15), ainsi que la variation de la Précision moyenne Maximale (Max_avg_accuracy, ANOVA, Pr_F = 1.418e-14), selon la Période sont significatives et s’observent entre toutes les périodes (Test de Tukey, p adj < 0.05).

Les Précisions moyennes Finale et Maximale des Périodes 10001 (0.91, 0.92) et 20001 (0.95, 0.96) sont donc significativement supérieures à celle atteinte sans renouvellement de la population d’agents (Période 200001, 0.86), tandis que celle de la Période 5001 (0.63, 0.67) est significative inférieure.

L’analyse des variances entre périodes (variance inter) et au sein des périodes (variance intra) indique que, dans les populations où la transmission est aléatoire (random), la Période explique 98.6% (R²) de la variance de la Précision moyenne Finale et 98.4% (R²) de la variance de la Précision moyenne Maximale.

L’hypothèse est validée pour les Périodes 10001 et 20001.

Cependant, les tests paramétriques (ANOVA, Tukey) se basent sur les moyennes des valeurs et supposent que les données suivent une distribution normale, qui n’est pas vérifiée ici.

C’est pourquoi il est proposé de réaliser des tests non paramétriques (Kruskal-Wallis, Dunn) qui, parce qu’ils se basent sur les rangs des données plutôt que sur les valeurs absolues, ne reposent pas sur l’hypothèse de la normalité des distributions.

Tests non paramétriques (i.e. sans hypothèse sur la normalité des distributions)

Les tests de Kruskal-Wallis et de Dunn s’appuient sur le rang pour comparer les distributions. Il n’est donc pas nécessaire que les données utilisées soient normalement distribuées, il suffit que les catégories (ici les périodes) soient de type ordinal (i.e. puissent être triées, ce qui est le cas puisque 5001 < 10001 < 20001 < 200001).

Le test de Kruskal-Wallis permet de déterminer si au moins deux groupes diffèrent, le test de Dunn (correction Bonferroni) indique quels sont les groupes qui diffèrent lorsque le test de kruskal-wallis est significatif.

Test de Kruskal-Wallis - Précision moyenne Finale
statistic p.value parameter method
17.85714 0.0004707 3 Kruskal-Wallis rank sum test
Test de Kruskal-Wallis - Précision moyenne Maximale
statistic p.value parameter method
17.85714 0.0004707 3 Kruskal-Wallis rank sum test
Test de Dunn - Précision moyenne Finale
Comparison Z P.unadj P.adj
10001 - 200001 1.336306 0.1814492 1.0000000
10001 - 20001 -1.336306 0.1814492 1.0000000
200001 - 20001 -2.672612 0.0075263 0.0451579
10001 - 5001 2.672612 0.0075263 0.0451579
200001 - 5001 1.336306 0.1814492 1.0000000
20001 - 5001 4.008919 0.0000610 0.0003660
Test de Dunn - Précision moyenne Maximale
Comparison Z P.unadj P.adj
10001 - 200001 1.336306 0.1814492 1.0000000
10001 - 20001 -1.336306 0.1814492 1.0000000
200001 - 20001 -2.672612 0.0075263 0.0451579
10001 - 5001 2.672612 0.0075263 0.0451579
200001 - 5001 1.336306 0.1814492 1.0000000
20001 - 5001 4.008919 0.0000610 0.0003660

Les résultats aux tests de Kruskal-Wallis et de Dunn sont les mêmes pour la Précision moyenne Finale (Final_avg_accuracy) et la Précision moyenne Maximale (Max_avg_accuracy).

Le test de Kruskal-Wallis indique que la variation des précisions moyennes (Finale ou Maximale) selon la Période est significative (p.value = 0.0004707), ce qui signifie que les distributions des rangs des précisions moyennes diffèrent entre les périodes.

Le test non paramétrique de Dunn (avec correction Bonferroni) révèle que les précisions moyennes (Finale ou Maximale) sont significativement différentes entre les périodes 20001 et 200001 (P.adj = 0.0451579), mais pas entre les périodes 10001 et 200001 (P.adj = 1.0000000).

Autrement dit, les précisions moyennes (Finale et Maximale) de la Période 10001 diffèrent significativement de celles de la Période 200001 en termes de valeurs absolues (comme le montrent l’ANOVA et le test de Tukey), mais pas en termes de distribution relative (i.e., comment les valeurs se classent les unes par rapport aux autres).

Par suite, l’hypothèse selon laquelle la période de renouvellement explique l’amélioration de la précision moyenne, au-delà de celle atteinte par une population sans renouvellement d’agents (Période 200001, 0.86), est validée pour la Période 20001 (0.96) mais nécessite une analyse plus approfondie pour la Période 10001 (0.92).

C’est pourquoi, il est maintenant proposé d’examiner le Rang d’atteinte (Rank_max_avg_accuracy) de la Précision moyenne Maximale (celui de la Précision moyenne Finale étant le dernier par définition).

Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) selon la période

Moyennes et écarts types, par période, du Rang d’atteinte de la précision moyenne maximale
Periode Moyenne du Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) Ecart type du Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy)
200001 27923.0 2866.6
5001 84006.4 56935.2
10001 151949.2 39655.1
20001 179046.2 699.5

Les statistiques descriptives ci-dessus montrent que le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) conserve une grande variance au sein des périodes 5001 et 10001, ce qui explique pourquoi la différence de Précision moyenne Maximale (Max_avg_accuracy) entre la période 10001 et 200001 est significative avec le test de Tukey (200001-10001, p adj = 0.0000414) et ne l’est pas avec le test non paramétrique de Dunn (10001-200001, P.adj = 1).

Tests non paramétriques

Test de Kruskal-Wallis - Rang d’atteinte de la précision moyenne maximale
statistic p.value parameter method
13.58286 0.0035316 3 Kruskal-Wallis rank sum test
Test de Dunn - Rang d’atteinte de la précision moyenne maximale
Comparison Z P.unadj P.adj
10001 - 200001 2.7795169 0.0054440 0.0326639
10001 - 20001 -0.4810702 0.6304666 1.0000000
200001 - 20001 -3.2605872 0.0011118 0.0066709
10001 - 5001 1.6570197 0.0975155 0.5850930
200001 - 5001 -1.1224972 0.2616511 1.0000000
20001 - 5001 2.1380899 0.0325094 0.1950567

Le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) est significativement différent selon la Période (Kruskal-Wallis, p.value = 0.0035316). Le test de Dunn (avec correction Bonferroni) permet de préciser que la différence significative du Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) s’observe entre les périodes 10001-200001 (p.adj = 0.0326639) et 20001-200001 (p.adj = 0.0066709). Autrement dit, le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) des Périodes 10001 (151949) et 20001 (179046) est significiativement supérieur à celui observé sans renouvellement d’agents (Période 200001, 27923).

L’hypothèse initiale est donc aussi validée avec les tests non paramétriques, comme le confirment les tests de robustesse de l’ANOVA ci-dessous.

Tests de robustesse de l’ANOVA sur la Précision moyenne Maximale (Max_avg_accuracy)

Statistic p_value
Shapiro-Wilk 0.9573886 0.4930905
Bartlett 2.1005882 0.5517938

Les resultats des tests ci-dessus permettent de ne pas rejeter les hypothèses de normalité des résidus (Shapiro-Wilk p-value = 0.4930905 > 0.05) et de l’homogénéité des variances intra (Bartlett p-value = 0.5517938 > 0.05), ce qui permet de valider la pertinence de l’ANOVA pour l’analyse de la variance de Précision moyenne Maximale (Max_avg_accuracy) selon les Périodes.

C’est pourquoi il est proposé d’examiner la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon son Rang d’atteinte (Rank_max_avg_accuracy) et la Période, ainsi que l’effet possible de l’interaction de ces deux variables sur la Précison moyenne Maximale (Max_avg_accuracy).

ANOVA : Précision moyenne Maximale selon son Rang d’atteinte et la Période
Factor Df Sum Sq Mean Sq F value Pr(>F)
Periode Periode 3 0.2381771 0.0793924 314.0648123 0.0000000
Rank_max_avg_accuracy Rank_max_avg_accuracy 1 0.0000683 0.0000683 0.2700352 0.6127592
Periode:Rank_max_avg_accuracy Periode:Rank_max_avg_accuracy 3 0.0007690 0.0002563 1.0139584 0.4205027
Residuals Residuals 12 0.0030335 0.0002528 NA NA

Il a été montré plus haut que le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) est significativement différent selon la Période (Kruskal-Wallis, p.value = 0.0035316) et plus précisémment entre les périodes 10001-200001 (Dunn, p.adj = 0.0326639) et 20001-200001 (Dunn, p.adj = 0.0066709).

Cependant, le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) n’a pas d’effet significatif sur la variance de la Précision moyenne Maximale (Max_avg_accuracy) elle-même (Anova, Pr(>F) = 0.6127592). De plus, l’interaction de la Période et du Rang d’atteinte de la Précison moyenne Maximale (Rank_max_avg_accuracy) n’a pas non plus d’effet significatif sur la Précision moyenne Maximale (Pr(>F) = 0.4205027).

Différence entre Précision moyenne Maximale et Précision moyenne Finale selon la Période

Il a été observé plus haut que les résultats aux tests de Kruskal-Wallis et de Dunn sont les mêmes pour la Précision moyenne Finale (Final_avg_accuracy) et la Précision moyenne Maximale (Max_avg_accuracy). Autrement dit, ces deux variables ne diffèrent pas en termes de distribution sur le rang, mais diffèrent en termes de valeurs absolues.

En effet, les statistiques descriptives présentées en première partie montrent que ces deux variables sont identiques pour la Période 200001 correspondant à l’absence de renouvellement des agents, mais une différence entre les moyennes et les écart-types de ces deux variables s’observent notamment pour la Période 5001.

C’est pourquoi il est proposé de poursuivre l’analyse de la variance de la Différence entre ces deux mesures selon la Période.

Difference entre précisions moyennes Maximale et Finale
= mean(Max_avg_accuracy) - mean(Final_avg_accuracy)
Periode Mean_Max Mean_Final Difference Count
200001 0.8587500 0.8587500 0.0000000 5
5001 0.6758437 0.6317500 0.0440938 5
10001 0.9224375 0.9118438 0.0105937 5
20001 0.9597812 0.9544375 0.0053437 5
ANOVA - Difference entre précisions moyennes Maximale et Finale
Df Sum_Sq Mean_Sq F_value Pr_F
3 0.0059205 0.0019735 29.5906 9.180e-07
16 0.0010671 0.0000667 NA NA
Test de Tukey: Difference entre précisions moyennes Maximale et Finale
diff lwr upr p adj
5001-200001 0.0440938 0.0293165 0.0588710 0.0000013
10001-200001 0.0105937 -0.0041835 0.0253710 0.2110995
20001-200001 0.0053437 -0.0094335 0.0201210 0.7321800
10001-5001 -0.0335000 -0.0482772 -0.0187228 0.0000405
20001-5001 -0.0387500 -0.0535272 -0.0239728 0.0000069
20001-10001 -0.0052500 -0.0200272 0.0095272 0.7423991
Analyse des variances - Difference entre précisions moyennes Maximale et Finale selon la Période
F_ratio = Variance.inter.groupe / Variance.intra.groupe;
Part de variance expliquée (R²) = Variance.inter.groupe / Variance.totale
Variance.inter.groupe Variance.intra.groupe Variance.totale F.ratio p.value
0.0019735 6.67e-05 0.0003678 29.5906 9.180e-07 0.847

La Différence, entre précisions moyennes Maximale et Finale, varie significativement selon la période (ANOVA, Pr_F = 9.180e-07) et plus précisémment entre la Période 5001 et les autres Périodes (test de Tukey, p-adj < 0.05).

C’est pourquoi il est maintenant proposé de réaliser une analyse de la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon son Rang d’atteinte, la Période, et la Difference entre précisions moyennes Maximale et Finale.

ANOVA : Précision moyenne Maximale selon son Rang d’atteinte, la Période et la Différence entre précisions moyenne Maximale et Finale
Factor Df Sum Sq Mean Sq F value Pr(>F)
Periode Periode 3 0.2381771 0.0793924 308.1426583 0.000000
Rank_max_avg_accuracy Rank_max_avg_accuracy 1 0.0000683 0.0000683 0.2649433 0.614774
Difference Difference 1 0.0001954 0.0001954 0.7582386 0.398566
Residuals Residuals 14 0.0036071 0.0002576 NA NA

Seule la Période a un effet significatif (p-value = 0) sur la variance de la Précision moyenne Maximale (Max_avg_accuracy).

Cependant, le Taux de succès moyen (Max_avg_successRate) n’a pas encore été examiné.

C’est pourquoi, une analyse de la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon le Taux de succès moyen est maintenant proposée.

Taux de succès moyen

ANOVA - Précision moyenne Maximale selon le Taux de succès moyen
Factor Df Sum Sq Mean Sq F value Pr(>F)
Max_avg_successRate Max_avg_successRate 1 0.1157702 0.1157702 16.50224 0.0007311
Residuals Residuals 18 0.1262776 0.0070154 NA NA

L’ANOVA ci-dessus indique un effet significatif du Taux de succès moyen (Max_avg_successRate) sur la Précision moyenne maximale (Max_avg_accuracy) avec Pr(>F) = 0.0007311.

Néanmoins, puisque ces deux variables sont dépendantes de la Période (qui est ici la seule variable indépendante), cet effet du Taux de succès moyen sur la Précision moyenne maximale pourrait être principalement induit par leur dépendance commune à la Période.

Taux de succès selon la Période
ANOVA - Taux de succès
Df Sum_Sq Mean_Sq F_value Pr_F
3 0.6060732 0.2020244 5941.965 1.396e-24
16 0.0005440 0.0000340 NA NA
Test de Tukey - Taux de succès
diff lwr upr p adj
5001-200001 -0.4704741 -0.4810250 -0.4599233 0
10001-200001 -0.2583660 -0.2689169 -0.2478152 0
20001-200001 -0.1264131 -0.1369640 -0.1158622 0
10001-5001 0.2121081 0.2015572 0.2226589 0
20001-5001 0.3440610 0.3335102 0.3546119 0
20001-10001 0.1319529 0.1214021 0.1425038 0
Analyse des variances - Taux de succès
F_ratio = Variance.inter.groupe / Variance.intra.groupe;
Part de variance expliquée (R²) = Variance.inter.groupe / Variance.totale
Variance.inter.groupe Variance.intra.groupe Variance.totale F.ratio p.value
0.2020244 3.4e-05 0.0319272 5941.965 1.396e-24 0.999

En effet, les analyses ci-dessus indiquent un effet très significatif de la Période sur la variance du Taux de succès (Anova, pr_F = 1.396e-24) et qui s’observe entre toutes les Périodes (Test de Tukey, p adj = 0). De plus, l’analyses des variances intra et inter groupes indique que la Période explique 99.9% (R²) de la variance du Taux de succès moyen.

Cela explique qu’avec l’ANOVA à 2 facteurs ci-dessous, qui examine la variance de la Précision moyenne Maximale selon la Période et le Taux de succès moyen, seule la Période a un effet significatif sur la Précision moyenne maximale, tandis que l’effet du Taux de succès moyen n’est plus significatif (p-value = 0.3387694).

ANOVA - Précision moyenne Maximale selon la Période et le Taux de succès moyen
Factor Df Sum Sq Mean Sq F value Pr(>F)
Periode Periode 3 0.2381771 0.0793924 423.5292844 0.0000000
Max_avg_successRate Max_avg_successRate 1 0.0001861 0.0001861 0.9926196 0.3387694
Periode:Max_avg_successRate Periode:Max_avg_successRate 3 0.0014352 0.0004784 2.5520400 0.1045255
Residuals Residuals 12 0.0022495 0.0001875 NA NA

Le Taux de succès moyen (Max_avg_successRate) n’a pas d’effet significatif sur la Précision moyenne Maximale (F value = 0.99, Pr(>F) = 0.3387694), alors que la Période influence très significativement la Précision moyenne Maximale (F value = 423.53, Pr(>F) = 0).

De plus, cette Anova à 2 facteurs indique que l’interaction de la Période avec le Taux de succes moyen n’a pas non plus d’effet significatif sur la Précision moyenne Maximale (Pr(>F) = 0.1045255). Autrement dit, l’effet de la Période sur la Précision moyenne Maximale est indépendant du Taux de succès moyen.

Conclusion

Pour conclure, il est proposé de réaliser une analyse de la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon l’ensemble des variables ici considérées : son Rang d’atteinte (Rank_max_avg_accuracy), la Période, la Difference entre les moyennes des précisions moyennes maximale et finale, et le Taux de succès moyen (Max_avg_successRate).

ANOVA - Précision moyenne Maximale selon son Rang d’atteinte, la Période, la Différence entre précisions moyennes maximale et finale, et le Taux de succès moyen
Factor Df Sum Sq Mean Sq F value Pr(>F)
Periode Periode 3 0.2381771 0.0793924 299.7330369 0.0000000
Rank_max_avg_accuracy Rank_max_avg_accuracy 1 0.0000683 0.0000683 0.2577127 0.6201990
Max_avg_successRate Max_avg_successRate 1 0.0001771 0.0001771 0.6686461 0.4282573
Difference Difference 1 0.0001819 0.0001819 0.6868205 0.4222036
Residuals Residuals 13 0.0034434 0.0002649 NA NA

Seule la Période a un effet significatif (très significatif, p-value = 0) sur la variance de la Précision moyenne Maximale (Max_avg_accuracy).

Il a ainsi été établi que :

Ces résultats confirment les analyses de Yasser Bourahla et indiquent que par rapport à la Précision moyenne (Finale et Maximale) qui s’observe dans une population sans renouvellement d’agents (Période 200001, 0.86), la Précision moyenne (Finale et Maximale) est :

Dès lors, il serait intéressant d’examiner plus finement l’intervalle de périodes auquel les populations d’agents passent d’une précision moyenne inférieure à celle qui s’observe dans une population sans renouvellement, à une précision moyenne qui lui est supérieure. Cela permettrait de voir si cette bascule de l’évolution de la précision moyenne selon la période se fait par de petites variations graduelles ou présente au contraire des effets de seuils.


This file can be retrieved from URL https://sake.re/20210601-DOTG-a

It is possible to check out the repository by cloning https://felapton.inrialpes.fr/cakes/20210601-DOTG-a.git