Ce document contient une nouvelle analyse des résultats obtenus par l’expérience 20210601-DOTG. Elle est obtenue en utilisant R et RStudio au lieu de Python et Jupyter. La méthode proposée ici consiste à se concentrer uniquement sur les populations où le taux de transmission est aléatoire, afin d’isoler la période comme unique variable indépendante. Cela permet d’examiner son effet spécifique sur la précision moyenne des connaissances des agents, sans l’influence potentielle du mode et du taux de transmission.
L’amélioration de la précision moyenne des connaissances, au delà de celle atteinte par une population d’agent sans renouvellement, dépend uniquement de la période de renouvellement des agents, le taux de transmission étant ici aléatoire.
L’analyse nécessite les packages rmarkdown, broom, cowplot et FSA.
$ Rscript -e "rmarkdown::render('./analysis.Rmd', output_file='index.html');"La taille du fichier engendré peut être largement réduite et son format amélioré par l’utilisation du script stripHTML fourni ici:
$ bash stripHTML.sh index.html
Populations caractérisées par la période de renouvellement des agents : 1 sans renouvellement d’agents (200001) et 3 avec des périodes de renouvellement différentes (5001, 10001, 20001);
Pour chaque période (200001, 5001, 10001, 20001), 5 populations résultant de la moyenne (average) de 10 expérimentations (runs) avec un taux de transmission aléatoire (random) sont disponibles dans results:
independent variables: [‘period’]
dependent variables: [‘Max_avg_accuracy’, ‘Rank_max_avg_accuracy’, ‘Max_avg_successRate’, ‘Rank_max_avg_successRate’]
Dossier_d_origine | Periode | Final_avg_accuracy | Max_avg_accuracy | Rank_max_avg_accuracy | Max_avg_successRate | Rank_max_avg_successRate |
---|---|---|---|---|---|---|
200001-1-random | 200001 | 0.8437500 | 0.8437500 | 28100 | 0.9672640 | 200000 |
200001-0.8-random | 200001 | 0.8375000 | 0.8375000 | 30537 | 0.9679870 | 200000 |
200001-0.6-random | 200001 | 0.8687500 | 0.8687500 | 24229 | 0.9653000 | 200000 |
200001-0.4-random | 200001 | 0.8875000 | 0.8875000 | 30819 | 0.9709135 | 200000 |
200001-0.2-random | 200001 | 0.8562500 | 0.8562500 | 25930 | 0.9694690 | 200000 |
5001-1-random | 5001 | 0.6471875 | 0.6910937 | 174987 | 0.5047060 | 190036 |
5001-0.8-random | 5001 | 0.6315625 | 0.6795313 | 90018 | 0.5030275 | 200000 |
5001-0.6-random | 5001 | 0.6281250 | 0.6628125 | 80012 | 0.4845299 | 199999 |
5001-0.4-random | 5001 | 0.6445312 | 0.6754688 | 50010 | 0.5043066 | 199997 |
5001-0.2-random | 5001 | 0.6073437 | 0.6703125 | 25005 | 0.4919930 | 200000 |
10001-1-random | 10001 | 0.9201562 | 0.9229687 | 139808 | 0.7126590 | 200000 |
10001-0.8-random | 10001 | 0.9068750 | 0.9240625 | 159974 | 0.7134460 | 190019 |
10001-0.6-random | 10001 | 0.9296875 | 0.9350000 | 179988 | 0.7074420 | 200000 |
10001-0.4-random | 10001 | 0.8989063 | 0.9035938 | 190018 | 0.7008515 | 200000 |
10001-0.2-random | 10001 | 0.9035938 | 0.9265625 | 89958 | 0.7147048 | 190019 |
20001-1-random | 20001 | 0.9492188 | 0.9560937 | 178974 | 0.8412415 | 200000 |
20001-0.8-random | 20001 | 0.9739062 | 0.9870313 | 178541 | 0.8356260 | 200000 |
20001-0.6-random | 20001 | 0.9553125 | 0.9559375 | 179863 | 0.8409005 | 200000 |
20001-0.4-random | 20001 | 0.9312500 | 0.9373437 | 179634 | 0.8456875 | 200000 |
20001-0.2-random | 20001 | 0.9625000 | 0.9625000 | 178219 | 0.8454125 | 200000 |
Periode | Moyenne de la précision finale (Final_avg_accuracy) | Ecart type de la précision finale (Final_avg_accuracy) | Moyenne de la précision maximale (Max_avg_accuracy) | Ecart type de la précision maximale (Max_avg_accuracy) |
---|---|---|---|---|
200001 | 0.8587500 | 0.0200585 | 0.8587500 | 0.0200585 |
5001 | 0.6317500 | 0.0158943 | 0.6758437 | 0.0105677 |
10001 | 0.9118438 | 0.0127243 | 0.9224375 | 0.0115417 |
20001 | 0.9544375 | 0.0158879 | 0.9597812 | 0.0179009 |
Comme l’illustrent les boîtes à moustaches ci-dessous, les
moyennes et écarts types respectifs de la Précision moyenne Finale
(Final_avg_accuracy) et de la Précision moyenne Maximale
(Max_avg_accuracy) sont identiques pour la Période 200001 correspondant
à l’absence de renouvellement d’agents. Cependant, pour les périodes de
renouvellement effectif (5001, 10001, 20001), des différences de
moyennes et d’ écarts-types s’observent entre ces deux variables,
notamment pour la Période 5001.
Les périodes 10001 et 20001 de renouvellement effectif
des agents présentent des moyennes de Précision moyenne Finale (0.91,
0.95) et de Précision moyenne Maximale (0.92, 0.96) supérieures à celles
obtenues sans renouvellement d’agents (Période 200001,
0.86).
Au contraire, la période 5001 présente des moyennes de Précision moyenne Finale (0.63) et de Précision moyenne Maximale (0.67) inférieures à celles observées sans renouvellement d’agents (Période 200001, 0.86).
Pour tester son hypothèse “Adding inter-generation transmission leads to higher accuracy than intra-generation transmission alone”, Yasser Bourahla (https://sake.re/20210601-DOTG/) effectue sur l’ensemble des populations (transmission aléatoire (random) ou contrôlée (learn)) :
une Analyse de variance (ANOVA) de la Précision moyenne Finale (ici, Final_avg_accuracy) selon la Période qui indique un effet significatif ;
un test de Tukey permettant de spécifier que l’effet de la Période sur la Précision moyenne Finale (Final_avg_accuracy) est significatif entre toutes les périodes
La variation de la Précision moyenne Finale (Final_avg_accuracy) étant établie (ANOVA, PR(>F) = 2.057993e-75) entre toutes les périodes (Test de Tukey, p-adj < 0.05), et les Précisions moyennes Finales des Périodes 10001 (0.91) et 20001 (0.95) étant supérieures à celles de la Période 200001 (0.86), Yasser Bourahla conclue à juste titre que son hypothèse est validée pour les Périodes 10001 et 20001. En effet, si les tests sont aussi significatifs pour la période 5001, sa Précision moyenne Finale (0.63) est inférieure à celle de la Période 200001 (0.86).
Ici, la même méthode est utilisée dans les populations où la transmission est aléatoire (random). Afin de tester l’hypothèse assez similaire selon laquelle “l’amélioration de la précision moyenne des connaissances, au delà de celle atteinte par une population d’agents sans renouvellement, dépend uniquement de la période de renouvellement des agents”, la Précision moyenne Maximale (Max_avg_accuracy) est aussi examinée. Une analyse de la variance entre les périodes (variance_inter) et au sein de chacune des périodes (variance_intra) est ajoutée afin de définir la part de la variance expliquée par la Période.
term | df | sumsq | meansq | statistic | p.value |
---|---|---|---|---|---|
Periode | 3 | 0.3098725 | 0.1032908 | 386.3852 | 3.918e-15 |
Residuals | 16 | 0.0042772 | 0.0002673 | NA | NA |
term | df | sumsq | meansq | statistic | p.value |
---|---|---|---|---|---|
Periode | 3 | 0.2381771 | 0.0793924 | 328.1783 | 1.418e-14 |
Residuals | 16 | 0.0038707 | 0.0002419 | NA | NA |
diff | lwr | upr | p adj | |
---|---|---|---|---|
5001-200001 | -0.2270000 | -0.2565850 | -0.1974150 | 0.0000000 |
10001-200001 | 0.0530938 | 0.0235088 | 0.0826787 | 0.0005227 |
20001-200001 | 0.0956875 | 0.0661025 | 0.1252725 | 0.0000004 |
10001-5001 | 0.2800938 | 0.2505088 | 0.3096787 | 0.0000000 |
20001-5001 | 0.3226875 | 0.2931025 | 0.3522725 | 0.0000000 |
20001-10001 | 0.0425937 | 0.0130088 | 0.0721787 | 0.0040203 |
diff | lwr | upr | p adj | |
---|---|---|---|---|
5001-200001 | -0.1829062 | -0.2110502 | -0.1547623 | 0.0000000 |
10001-200001 | 0.0636875 | 0.0355435 | 0.0918315 | 0.0000414 |
20001-200001 | 0.1010313 | 0.0728873 | 0.1291752 | 0.0000001 |
10001-5001 | 0.2465937 | 0.2184498 | 0.2747377 | 0.0000000 |
20001-5001 | 0.2839375 | 0.2557935 | 0.3120815 | 0.0000000 |
20001-10001 | 0.0373438 | 0.0091998 | 0.0654877 | 0.0077568 |
Variance.inter | Variance.intra | Variance.totale | F.ratio | p.value | R² |
---|---|---|---|---|---|
0.1032908 | 0.0002673 | 0.0165342 | 386.3852 | 3.918e-15 | 0.986 |
Variance.inter | Variance.intra | Variance.totale | F.ratio | p.value | R² |
---|---|---|---|---|---|
0.0793924 | 0.0002419 | 0.0127394 | 328.1783 | 1.418e-14 | 0.984 |
Dans les populations où la transmission est aléatoire (random), la variation de la Précision moyenne Finale (Final_avg_accuracy, ANOVA, p.value = 3.918e-15), ainsi que la variation de la Précision moyenne Maximale (Max_avg_accuracy, ANOVA, Pr_F = 1.418e-14), selon la Période sont significatives et s’observent entre toutes les périodes (Test de Tukey, p adj < 0.05).
Les Précisions moyennes Finale et Maximale des Périodes 10001 (0.91, 0.92) et 20001 (0.95, 0.96) sont donc significativement supérieures à celle atteinte sans renouvellement de la population d’agents (Période 200001, 0.86), tandis que celle de la Période 5001 (0.63, 0.67) est significative inférieure.
L’analyse des variances entre périodes (variance inter) et au sein des périodes (variance intra) indique que, dans les populations où la transmission est aléatoire (random), la Période explique 98.6% (R²) de la variance de la Précision moyenne Finale et 98.4% (R²) de la variance de la Précision moyenne Maximale.
L’hypothèse est validée pour les Périodes 10001 et 20001.
Cependant, les tests paramétriques (ANOVA, Tukey) se basent sur les moyennes des valeurs et supposent que les données suivent une distribution normale, qui n’est pas vérifiée ici.
C’est pourquoi il est proposé de réaliser des tests non paramétriques
(Kruskal-Wallis, Dunn) qui, parce qu’ils se basent sur les rangs des
données plutôt que sur les valeurs absolues, ne reposent pas sur
l’hypothèse de la normalité des distributions.
Les tests de Kruskal-Wallis et de Dunn s’appuient sur le rang pour comparer les distributions. Il n’est donc pas nécessaire que les données utilisées soient normalement distribuées, il suffit que les catégories (ici les périodes) soient de type ordinal (i.e. puissent être triées, ce qui est le cas puisque 5001 < 10001 < 20001 < 200001).
Le test de Kruskal-Wallis permet de déterminer si au moins deux
groupes diffèrent, le test de Dunn (correction Bonferroni) indique quels
sont les groupes qui diffèrent lorsque le test de kruskal-wallis est
significatif.
statistic | p.value | parameter | method |
---|---|---|---|
17.85714 | 0.0004707 | 3 | Kruskal-Wallis rank sum test |
statistic | p.value | parameter | method |
---|---|---|---|
17.85714 | 0.0004707 | 3 | Kruskal-Wallis rank sum test |
Comparison | Z | P.unadj | P.adj |
---|---|---|---|
10001 - 200001 | 1.336306 | 0.1814492 | 1.0000000 |
10001 - 20001 | -1.336306 | 0.1814492 | 1.0000000 |
200001 - 20001 | -2.672612 | 0.0075263 | 0.0451579 |
10001 - 5001 | 2.672612 | 0.0075263 | 0.0451579 |
200001 - 5001 | 1.336306 | 0.1814492 | 1.0000000 |
20001 - 5001 | 4.008919 | 0.0000610 | 0.0003660 |
Comparison | Z | P.unadj | P.adj |
---|---|---|---|
10001 - 200001 | 1.336306 | 0.1814492 | 1.0000000 |
10001 - 20001 | -1.336306 | 0.1814492 | 1.0000000 |
200001 - 20001 | -2.672612 | 0.0075263 | 0.0451579 |
10001 - 5001 | 2.672612 | 0.0075263 | 0.0451579 |
200001 - 5001 | 1.336306 | 0.1814492 | 1.0000000 |
20001 - 5001 | 4.008919 | 0.0000610 | 0.0003660 |
Les résultats aux tests de Kruskal-Wallis et de Dunn sont les mêmes pour la Précision moyenne Finale (Final_avg_accuracy) et la Précision moyenne Maximale (Max_avg_accuracy).
Le test de Kruskal-Wallis indique que la variation des précisions moyennes (Finale ou Maximale) selon la Période est significative (p.value = 0.0004707), ce qui signifie que les distributions des rangs des précisions moyennes diffèrent entre les périodes.
Le test non paramétrique de Dunn (avec correction Bonferroni) révèle
que les précisions moyennes (Finale ou Maximale) sont
significativement différentes entre les périodes 20001 et 200001 (P.adj
= 0.0451579), mais pas entre les périodes 10001 et 200001 (P.adj =
1.0000000).
Autrement dit, les précisions moyennes (Finale et Maximale) de la Période 10001 diffèrent significativement de celles de la Période 200001 en termes de valeurs absolues (comme le montrent l’ANOVA et le test de Tukey), mais pas en termes de distribution relative (i.e., comment les valeurs se classent les unes par rapport aux autres).
Par suite, l’hypothèse selon laquelle la période de renouvellement explique l’amélioration de la précision moyenne, au-delà de celle atteinte par une population sans renouvellement d’agents (Période 200001, 0.86), est validée pour la Période 20001 (0.96) mais nécessite une analyse plus approfondie pour la Période 10001 (0.92).
C’est pourquoi, il est maintenant proposé d’examiner le Rang d’atteinte (Rank_max_avg_accuracy) de la Précision moyenne Maximale (celui de la Précision moyenne Finale étant le dernier par définition).
Periode | Moyenne du Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) | Ecart type du Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) |
---|---|---|
200001 | 27923.0 | 2866.6 |
5001 | 84006.4 | 56935.2 |
10001 | 151949.2 | 39655.1 |
20001 | 179046.2 | 699.5 |
Les statistiques descriptives ci-dessus montrent que le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) conserve une grande variance au sein des périodes 5001 et 10001, ce qui explique pourquoi la différence de Précision moyenne Maximale (Max_avg_accuracy) entre la période 10001 et 200001 est significative avec le test de Tukey (200001-10001, p adj = 0.0000414) et ne l’est pas avec le test non paramétrique de Dunn (10001-200001, P.adj = 1).
Tests non paramétriques
statistic | p.value | parameter | method |
---|---|---|---|
13.58286 | 0.0035316 | 3 | Kruskal-Wallis rank sum test |
Comparison | Z | P.unadj | P.adj |
---|---|---|---|
10001 - 200001 | 2.7795169 | 0.0054440 | 0.0326639 |
10001 - 20001 | -0.4810702 | 0.6304666 | 1.0000000 |
200001 - 20001 | -3.2605872 | 0.0011118 | 0.0066709 |
10001 - 5001 | 1.6570197 | 0.0975155 | 0.5850930 |
200001 - 5001 | -1.1224972 | 0.2616511 | 1.0000000 |
20001 - 5001 | 2.1380899 | 0.0325094 | 0.1950567 |
Le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) est significativement différent selon la Période (Kruskal-Wallis, p.value = 0.0035316). Le test de Dunn (avec correction Bonferroni) permet de préciser que la différence significative du Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) s’observe entre les périodes 10001-200001 (p.adj = 0.0326639) et 20001-200001 (p.adj = 0.0066709). Autrement dit, le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) des Périodes 10001 (151949) et 20001 (179046) est significiativement supérieur à celui observé sans renouvellement d’agents (Période 200001, 27923).
L’hypothèse initiale est donc aussi validée avec les tests non paramétriques, comme le confirment les tests de robustesse de l’ANOVA ci-dessous.
Statistic | p_value | |
---|---|---|
Shapiro-Wilk | 0.9573886 | 0.4930905 |
Bartlett | 2.1005882 | 0.5517938 |
Les resultats des tests ci-dessus permettent de ne pas rejeter les hypothèses de normalité des résidus (Shapiro-Wilk p-value = 0.4930905 > 0.05) et de l’homogénéité des variances intra (Bartlett p-value = 0.5517938 > 0.05), ce qui permet de valider la pertinence de l’ANOVA pour l’analyse de la variance de Précision moyenne Maximale (Max_avg_accuracy) selon les Périodes.
C’est pourquoi il est proposé d’examiner la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon son Rang d’atteinte (Rank_max_avg_accuracy) et la Période, ainsi que l’effet possible de l’interaction de ces deux variables sur la Précison moyenne Maximale (Max_avg_accuracy).
Factor | Df | Sum Sq | Mean Sq | F value | Pr(>F) | |
---|---|---|---|---|---|---|
Periode | Periode | 3 | 0.2381771 | 0.0793924 | 314.0648123 | 0.0000000 |
Rank_max_avg_accuracy | Rank_max_avg_accuracy | 1 | 0.0000683 | 0.0000683 | 0.2700352 | 0.6127592 |
Periode:Rank_max_avg_accuracy | Periode:Rank_max_avg_accuracy | 3 | 0.0007690 | 0.0002563 | 1.0139584 | 0.4205027 |
Residuals | Residuals | 12 | 0.0030335 | 0.0002528 | NA | NA |
Il a été montré plus haut que le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) est significativement différent selon la Période (Kruskal-Wallis, p.value = 0.0035316) et plus précisémment entre les périodes 10001-200001 (Dunn, p.adj = 0.0326639) et 20001-200001 (Dunn, p.adj = 0.0066709).
Cependant, le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) n’a pas d’effet significatif sur la variance de la Précision moyenne Maximale (Max_avg_accuracy) elle-même (Anova, Pr(>F) = 0.6127592). De plus, l’interaction de la Période et du Rang d’atteinte de la Précison moyenne Maximale (Rank_max_avg_accuracy) n’a pas non plus d’effet significatif sur la Précision moyenne Maximale (Pr(>F) = 0.4205027).
Il a été observé plus haut que les résultats aux tests de Kruskal-Wallis et de Dunn sont les mêmes pour la Précision moyenne Finale (Final_avg_accuracy) et la Précision moyenne Maximale (Max_avg_accuracy). Autrement dit, ces deux variables ne diffèrent pas en termes de distribution sur le rang, mais diffèrent en termes de valeurs absolues.
En effet, les statistiques descriptives présentées en première partie montrent que ces deux variables sont identiques pour la Période 200001 correspondant à l’absence de renouvellement des agents, mais une différence entre les moyennes et les écart-types de ces deux variables s’observent notamment pour la Période 5001.
C’est pourquoi il est proposé de poursuivre l’analyse de la variance de la Différence entre ces deux mesures selon la Période.
Periode | Mean_Max | Mean_Final | Difference | Count |
---|---|---|---|---|
200001 | 0.8587500 | 0.8587500 | 0.0000000 | 5 |
5001 | 0.6758437 | 0.6317500 | 0.0440938 | 5 |
10001 | 0.9224375 | 0.9118438 | 0.0105937 | 5 |
20001 | 0.9597812 | 0.9544375 | 0.0053437 | 5 |
Df | Sum_Sq | Mean_Sq | F_value | Pr_F |
---|---|---|---|---|
3 | 0.0059205 | 0.0019735 | 29.5906 | 9.180e-07 |
16 | 0.0010671 | 0.0000667 | NA | NA |
diff | lwr | upr | p adj | |
---|---|---|---|---|
5001-200001 | 0.0440938 | 0.0293165 | 0.0588710 | 0.0000013 |
10001-200001 | 0.0105937 | -0.0041835 | 0.0253710 | 0.2110995 |
20001-200001 | 0.0053437 | -0.0094335 | 0.0201210 | 0.7321800 |
10001-5001 | -0.0335000 | -0.0482772 | -0.0187228 | 0.0000405 |
20001-5001 | -0.0387500 | -0.0535272 | -0.0239728 | 0.0000069 |
20001-10001 | -0.0052500 | -0.0200272 | 0.0095272 | 0.7423991 |
Variance.inter.groupe | Variance.intra.groupe | Variance.totale | F.ratio | p.value | R² |
---|---|---|---|---|---|
0.0019735 | 6.67e-05 | 0.0003678 | 29.5906 | 9.180e-07 | 0.847 |
La Différence, entre précisions moyennes Maximale et Finale, varie significativement selon la période (ANOVA, Pr_F = 9.180e-07) et plus précisémment entre la Période 5001 et les autres Périodes (test de Tukey, p-adj < 0.05).
C’est pourquoi il est maintenant proposé de réaliser une analyse de la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon son Rang d’atteinte, la Période, et la Difference entre précisions moyennes Maximale et Finale.
Factor | Df | Sum Sq | Mean Sq | F value | Pr(>F) | |
---|---|---|---|---|---|---|
Periode | Periode | 3 | 0.2381771 | 0.0793924 | 308.1426583 | 0.000000 |
Rank_max_avg_accuracy | Rank_max_avg_accuracy | 1 | 0.0000683 | 0.0000683 | 0.2649433 | 0.614774 |
Difference | Difference | 1 | 0.0001954 | 0.0001954 | 0.7582386 | 0.398566 |
Residuals | Residuals | 14 | 0.0036071 | 0.0002576 | NA | NA |
Seule la Période a un effet significatif (p-value = 0) sur la variance de la Précision moyenne Maximale (Max_avg_accuracy).
Cependant, le Taux de succès moyen (Max_avg_successRate) n’a pas encore été examiné.
C’est pourquoi, une analyse de la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon le Taux de succès moyen est maintenant proposée.
Factor | Df | Sum Sq | Mean Sq | F value | Pr(>F) | |
---|---|---|---|---|---|---|
Max_avg_successRate | Max_avg_successRate | 1 | 0.1157702 | 0.1157702 | 16.50224 | 0.0007311 |
Residuals | Residuals | 18 | 0.1262776 | 0.0070154 | NA | NA |
L’ANOVA ci-dessus indique un effet significatif du Taux de succès moyen (Max_avg_successRate) sur la Précision moyenne maximale (Max_avg_accuracy) avec Pr(>F) = 0.0007311.
Néanmoins, puisque ces deux variables sont dépendantes de la Période (qui est ici la seule variable indépendante), cet effet du Taux de succès moyen sur la Précision moyenne maximale pourrait être principalement induit par leur dépendance commune à la Période.
Taux de succès selon la PériodeDf | Sum_Sq | Mean_Sq | F_value | Pr_F |
---|---|---|---|---|
3 | 0.6060732 | 0.2020244 | 5941.965 | 1.396e-24 |
16 | 0.0005440 | 0.0000340 | NA | NA |
diff | lwr | upr | p adj | |
---|---|---|---|---|
5001-200001 | -0.4704741 | -0.4810250 | -0.4599233 | 0 |
10001-200001 | -0.2583660 | -0.2689169 | -0.2478152 | 0 |
20001-200001 | -0.1264131 | -0.1369640 | -0.1158622 | 0 |
10001-5001 | 0.2121081 | 0.2015572 | 0.2226589 | 0 |
20001-5001 | 0.3440610 | 0.3335102 | 0.3546119 | 0 |
20001-10001 | 0.1319529 | 0.1214021 | 0.1425038 | 0 |
Variance.inter.groupe | Variance.intra.groupe | Variance.totale | F.ratio | p.value | R² |
---|---|---|---|---|---|
0.2020244 | 3.4e-05 | 0.0319272 | 5941.965 | 1.396e-24 | 0.999 |
En effet, les analyses ci-dessus indiquent un effet très significatif de la Période sur la variance du Taux de succès (Anova, pr_F = 1.396e-24) et qui s’observe entre toutes les Périodes (Test de Tukey, p adj = 0). De plus, l’analyses des variances intra et inter groupes indique que la Période explique 99.9% (R²) de la variance du Taux de succès moyen.
Cela explique qu’avec l’ANOVA à 2 facteurs ci-dessous, qui examine la variance de la Précision moyenne Maximale selon la Période et le Taux de succès moyen, seule la Période a un effet significatif sur la Précision moyenne maximale, tandis que l’effet du Taux de succès moyen n’est plus significatif (p-value = 0.3387694).
Factor | Df | Sum Sq | Mean Sq | F value | Pr(>F) | |
---|---|---|---|---|---|---|
Periode | Periode | 3 | 0.2381771 | 0.0793924 | 423.5292844 | 0.0000000 |
Max_avg_successRate | Max_avg_successRate | 1 | 0.0001861 | 0.0001861 | 0.9926196 | 0.3387694 |
Periode:Max_avg_successRate | Periode:Max_avg_successRate | 3 | 0.0014352 | 0.0004784 | 2.5520400 | 0.1045255 |
Residuals | Residuals | 12 | 0.0022495 | 0.0001875 | NA | NA |
Le Taux de succès moyen (Max_avg_successRate) n’a pas d’effet significatif sur la Précision moyenne Maximale (F value = 0.99, Pr(>F) = 0.3387694), alors que la Période influence très significativement la Précision moyenne Maximale (F value = 423.53, Pr(>F) = 0).
De plus, cette Anova à 2 facteurs indique que l’interaction de la Période avec le Taux de succes moyen n’a pas non plus d’effet significatif sur la Précision moyenne Maximale (Pr(>F) = 0.1045255). Autrement dit, l’effet de la Période sur la Précision moyenne Maximale est indépendant du Taux de succès moyen.
Pour conclure, il est proposé de réaliser une analyse de la variance de la Précison moyenne Maximale (Max_avg_accuracy) selon l’ensemble des variables ici considérées : son Rang d’atteinte (Rank_max_avg_accuracy), la Période, la Difference entre les moyennes des précisions moyennes maximale et finale, et le Taux de succès moyen (Max_avg_successRate).
Factor | Df | Sum Sq | Mean Sq | F value | Pr(>F) | |
---|---|---|---|---|---|---|
Periode | Periode | 3 | 0.2381771 | 0.0793924 | 299.7330369 | 0.0000000 |
Rank_max_avg_accuracy | Rank_max_avg_accuracy | 1 | 0.0000683 | 0.0000683 | 0.2577127 | 0.6201990 |
Max_avg_successRate | Max_avg_successRate | 1 | 0.0001771 | 0.0001771 | 0.6686461 | 0.4282573 |
Difference | Difference | 1 | 0.0001819 | 0.0001819 | 0.6868205 | 0.4222036 |
Residuals | Residuals | 13 | 0.0034434 | 0.0002649 | NA | NA |
Seule la Période a un effet significatif (très significatif, p-value = 0) sur la variance de la Précision moyenne Maximale (Max_avg_accuracy).
Il a ainsi été établi que :
le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) est significativement plus élevé pour les Périodes 10001 et 20001 et présente un écart-type plus important pour les Périodes 5001 et 10001. Toutefois, le Rang d’atteinte de la précision moyenne maximale (Rank_max_avg_accuracy) n’a pas d’effet significatif sur la Précision moyenne Maximale elle-même ;
la Différence entre la Précision moyenne Maximale (Max_avg_accuracy) et Finale (Final_avg_accuracy) est significative pour la Période 5001 ;
seule la Période a un effet significatif sur la variance de la Précision moyenne Maximale (Max_avg_accuracy) et explique 98.4% (R²) de sa variance, et cet effet est indépendant du Taux de succès moyen.
Ces résultats confirment les analyses de Yasser Bourahla et indiquent que par rapport à la Précision moyenne (Finale et Maximale) qui s’observe dans une population sans renouvellement d’agents (Période 200001, 0.86), la Précision moyenne (Finale et Maximale) est :
significativement supérieure avec les Périodes 10001 (0.91 et 0.92) et 20001 (0.95 et 0.96) ;
significativement inférieure avec la Période 5001 (0.63 et 0.67).
Dès lors, il serait intéressant d’examiner plus finement l’intervalle de périodes auquel les populations d’agents passent d’une précision moyenne inférieure à celle qui s’observe dans une population sans renouvellement, à une précision moyenne qui lui est supérieure. Cela permettrait de voir si cette bascule de l’évolution de la précision moyenne selon la période se fait par de petites variations graduelles ou présente au contraire des effets de seuils.
This file can be retrieved from URL https://sake.re/20210601-DOTG-a
It is possible to check out the repository by cloning https://felapton.inrialpes.fr/cakes/20210601-DOTG-a.git