par eleve17 » jeu. 28 juin 2018 12:46
Bonjour,
Excusez-moi d’avoir interrompu impoliment notre conversation ; ma vie fut fortement bousculée, ma mère ayant subi un accident grave. Et puis le BAC est arrivé...Bref, je n’avais pas le courage de vous répondre...Toujours intéressé au problème en question dont nous avons parlé ( et attiré par les maths en général ! ), bien qu’ayant terminé le lycée, permettez-moi de nouveau de solliciter de votre bienveillance.
Je vous remercie d’avoir mis en évidence les imprécisions de mon langage. J’essaye une fois encore de reformuler ( en améliorant ) mes pensées ; vous me direz svp, si cela est correct :
on dispose d’un modèle statistique théorique ( du caractère étudié ) dont tous les paramètres
( une proportion p par exemple ) sont connus . On veut savoir, si le comportement statistique
dudit caractère dans l’ensemble d’une population réelle correspond à ce modèle. On prélève donc un échantillon, à partir duquel on obtient des paramètres empiriques ( la fréquence observée f par exemple ). On vérifie la compatibilité de cet échantillon avec le modèle théorique .
Avec l’intervalle de fluctuation, il y a donc deux possibilités, suivant la valeur
| f –– p | ( ≤ 1,96σ ou > 1,96σ ) , à savoir :
Hypothèse H : « il y a une correspondance entre la réalité et le modèle théorique »
Hypothèse ¬H : « il n’y a pas de correspondance entre la réalité et le modèle théorique »
Supposons qu’on est forcé ( ayant obtenu par exemple | f –– p | = 1,96σ exactement ) d’accepter à contre-coeur H, l’intuition et l’observation des faits nous suggérant d’opter plutôt pour ¬H.
On s’intéresse alors à l’évaluation de l’erreur β ( dont l’existence fut injustement caviardée dans le manuel ), et qui est la probabilité conditionnelle d’accepter H, sachant qu’il n’y a pas vraiment de correspondance entre la réalité et le modèle théorique . On notera cette probabilité
β = P ( «H »| «¬H» ).
J’ai utilisé des guillemets, car autrement cette notation n’aurait aucun sens formel (logique).
Puisqu’on est persuadé qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, IL CONVIENDRAIT d’admettre pour le calcul, qu’alors les données empiriques
( et non théoriques ) sont compatibles de façon satisfaisante avec la réalité en général ; cela nous entraine à construire autour de la fréquence observée f une seconde distribution statistique ( de variance f (1–– f )/n ), avec sa fluctuation qu’on acceptera au seuil de 0,95. Ainsi
P ( «H »| «¬H» ) = P («H » ∩ «¬H» ) / P («¬H» ).
Dans ce calcul, P («H » ∩ «¬H» ) devra alors être interprétée comme l’intersection de zones d’acceptation au-dessous des deux courbes normales, et P («¬H» ) – justement - puisqu’on est persuadé ( on est pratiquement sûr ) qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, prendrait la valeur 0,95 ( seuil de fiabilité des calculs ).
Cette dernière constatation reste un peu délicate, vous n’étiez pas d’accord, mais comment le faire autrement ? ( J’ai effectué des recherches approfondies à ce sujet sur l’internet ; dans quelques sources il est dit sans justifier, que β est purement représenté sous forme d’intersection de zones d’acceptation au-dessous des deux courbes de densité en question, ce qui suggérerait que P («¬H» ) = 1...Mais pourquoi ? )
Merci de vos avis.
Nicolas.
Bonjour,
Excusez-moi d’avoir interrompu impoliment notre conversation ; ma vie fut fortement bousculée, ma mère ayant subi un accident grave. Et puis le BAC est arrivé...Bref, je n’avais pas le courage de vous répondre...Toujours intéressé au problème en question dont nous avons parlé ( et attiré par les maths en général ! ), bien qu’ayant terminé le lycée, permettez-moi de nouveau de solliciter de votre bienveillance.
Je vous remercie d’avoir mis en évidence les imprécisions de mon langage. J’essaye une fois encore de reformuler ( en améliorant ) mes pensées ; vous me direz svp, si cela est correct :
on dispose d’un modèle statistique théorique ( du caractère étudié ) dont tous les paramètres
( une proportion[b] [i]p[/i][/b] par exemple ) sont connus . On veut savoir, si le comportement statistique
dudit caractère dans l’ensemble d’une population réelle correspond à ce modèle. On prélève donc un échantillon, à partir duquel on obtient des paramètres empiriques ( la fréquence observée [i][b]f[/b][/i] par exemple ). On vérifie la compatibilité de cet échantillon avec le modèle théorique .
Avec l’intervalle de fluctuation, il y a donc deux possibilités, suivant la valeur
| [i][b]f[/b][/i] –– [i][b]p[/b][/i] | ( ≤ 1,96[i][b]σ[/b][/i] ou > 1,96[i][b]σ[/b] [/i] ) , à savoir :
Hypothèse [b]H[/b] : « il y a une correspondance entre la réalité et le modèle théorique »
Hypothèse ¬[b]H[/b] : « il n’y a pas de correspondance entre la réalité et le modèle théorique »
Supposons qu’on est forcé ( ayant obtenu par exemple | [i][b]f[/b] [/i]–– [i][b]p[/b] [/i]| = 1,96[b][i]σ[/i][/b] exactement ) d’accepter à contre-coeur [b]H[/b], l’intuition et l’observation des faits nous suggérant d’opter plutôt pour ¬[b]H[/b].
On s’intéresse alors à l’évaluation de l’erreur [i][b]β[/b][/i] ( dont l’existence fut injustement caviardée dans le manuel ), et qui est la probabilité conditionnelle d’accepter [b]H[/b], sachant qu’il n’y a pas vraiment de correspondance entre la réalité et le modèle théorique . On notera cette probabilité
[i][b]β[/b][/i] = P ( «[b]H[/b] »| «¬[b]H[/b]» ).
J’ai utilisé des guillemets, car autrement cette notation n’aurait aucun sens formel (logique).
Puisqu’on est persuadé qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, IL CONVIENDRAIT d’admettre pour le calcul, qu’alors les données empiriques
( et non théoriques ) sont compatibles de façon satisfaisante avec la réalité en général ; cela nous entraine à construire autour de la fréquence observée [i][b]f[/b][/i] une seconde distribution statistique ( de variance [b][i]f[/i][/b] (1–– [b][i]f[/i][/b] )/[i][b]n[/b][/i] ), avec sa fluctuation qu’on acceptera au seuil de 0,95. Ainsi
P ( «[b]H[/b] »| «¬[b]H[/b]» ) = P («[b]H[/b] » ∩ «¬[b]H[/b]» ) / P («¬[b]H[/b]» ).
Dans ce calcul, P («[b]H[/b] » ∩ «¬[b]H[/b]» ) devra alors être interprétée comme l’intersection de zones d’acceptation au-dessous des deux courbes normales, et P («¬[b]H[/b]» ) – justement - puisqu’on est persuadé ( on est pratiquement sûr ) qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, prendrait la valeur 0,95 ( seuil de fiabilité des calculs ).
Cette dernière constatation reste un peu délicate, vous n’étiez pas d’accord, mais comment le faire autrement ? ( J’ai effectué des recherches approfondies à ce sujet sur l’internet ; dans quelques sources il est dit sans justifier, que [i][b]β[/b][/i] est purement représenté sous forme d’intersection de zones d’acceptation au-dessous des deux courbes de densité en question, ce qui suggérerait que P («¬[b]H[/b]» ) = 1...Mais pourquoi ? )
Merci de vos avis.
Nicolas.