Intervalle de fluctuation
Intervalle de fluctuation
Bonjour,
J’ai un énorme problème de compréhension de la notion du risque d’erreur lors d’une prise de décision à l’aide d’un intervalle de fluctuation.
Dans notre manuel ( « Odyssée TS », page 433 ) on lit à ce propos :
► a) dans le cas où on accepte l’hypothèse faite sur la proportion p, le risque d’erreur n’est pas quantifié ;
► b) le risque de 5% signifie que la probabilité que l’on rejette à tort l’hypothèse faite sur la proportion p alors qu’elle est vraie est APPROXIMATIVEMENT égale à 0,05. C’est une probabilité conditionnelle.
Donc, si je comprends bien, ce risque de 5% d’erreur dans le cas de rejet d’une hypothèse valide, n’est pas une conséquence directe du fait que la fréquence observée dans un échantillon tombe en dehors de la « zone d’acceptation » du modèle théorique engendré ( dans 95% des cas ) par l’intervalle de bornes p±1,96σ, car il s’agirait d’une probabilité conditionnelle...
QUESTION
1) Comment alors procède-t-on pour calculer cette probabilité conditionnelle et retrouver le résultat approximatif 0,05 ? [cas b) ]
2) Pourquoi n’est-il pas possible ( ce qui logiquement est incohérent )– toujours dans l’esprit de probabilités conditionnelles – et en utilisant une méthode similaire – d’évaluer le risque d’erreur d’accepter une hypothèse alors qu’elle st fausse ? [ cas a) ]
Merci de vos éclaircissements.
Nicolas
J’ai un énorme problème de compréhension de la notion du risque d’erreur lors d’une prise de décision à l’aide d’un intervalle de fluctuation.
Dans notre manuel ( « Odyssée TS », page 433 ) on lit à ce propos :
► a) dans le cas où on accepte l’hypothèse faite sur la proportion p, le risque d’erreur n’est pas quantifié ;
► b) le risque de 5% signifie que la probabilité que l’on rejette à tort l’hypothèse faite sur la proportion p alors qu’elle est vraie est APPROXIMATIVEMENT égale à 0,05. C’est une probabilité conditionnelle.
Donc, si je comprends bien, ce risque de 5% d’erreur dans le cas de rejet d’une hypothèse valide, n’est pas une conséquence directe du fait que la fréquence observée dans un échantillon tombe en dehors de la « zone d’acceptation » du modèle théorique engendré ( dans 95% des cas ) par l’intervalle de bornes p±1,96σ, car il s’agirait d’une probabilité conditionnelle...
QUESTION
1) Comment alors procède-t-on pour calculer cette probabilité conditionnelle et retrouver le résultat approximatif 0,05 ? [cas b) ]
2) Pourquoi n’est-il pas possible ( ce qui logiquement est incohérent )– toujours dans l’esprit de probabilités conditionnelles – et en utilisant une méthode similaire – d’évaluer le risque d’erreur d’accepter une hypothèse alors qu’elle st fausse ? [ cas a) ]
Merci de vos éclaircissements.
Nicolas
-
- Messages : 1427
- Enregistré le : ven. 20 juin 2014 15:58
Re: Intervalle de fluctuation
Bonjour Nicolas,
Les risques d'erreurs, c'est un point délicat effectivement...
Il faut dire que dans le cas des tests d'hypothèses, il existe plusieurs types d'erreurs : Le risque \(\alpha\) de rejeter l'hypothèse faite sur la proportion p (\(H_0\)) est choisi (déterminé) au départ et aura pour conséquence une amplitude plus ou moins grande de l'intervalle de fluctuation asymptotique calculé. Il n'est pas lié du tout à la fréquence observée ultérieurement et est bien une probabilité conditionnelle puisque on fait "comme si" la proportion de la population était p.
Le second risque évoqué s'appelle \(\beta\) et correspond à accepter l'hypothèse sur la population à tort, c'est aussi une probabilité conditionnelle. Plus le premier risque est faible, plus ce second risque va augmenter...
Cette notion n'est pas encore au programme de terminale. Le calcul n'est donc pas à faire pour le moment.
Je te donne le lien vers la page Wikipédia si tu veux en savoir plus
https://fr.wikipedia.org/wiki/Test_statistique
Et vers un très bon site de révision pour t'aider sur cette notion :
http://www.jaicompris.com/lycee/math/pr ... uation.php
J'espère que tu auras mieux compris, à bientôt
Les risques d'erreurs, c'est un point délicat effectivement...
Il faut dire que dans le cas des tests d'hypothèses, il existe plusieurs types d'erreurs : Le risque \(\alpha\) de rejeter l'hypothèse faite sur la proportion p (\(H_0\)) est choisi (déterminé) au départ et aura pour conséquence une amplitude plus ou moins grande de l'intervalle de fluctuation asymptotique calculé. Il n'est pas lié du tout à la fréquence observée ultérieurement et est bien une probabilité conditionnelle puisque on fait "comme si" la proportion de la population était p.
Le second risque évoqué s'appelle \(\beta\) et correspond à accepter l'hypothèse sur la population à tort, c'est aussi une probabilité conditionnelle. Plus le premier risque est faible, plus ce second risque va augmenter...
Cette notion n'est pas encore au programme de terminale. Le calcul n'est donc pas à faire pour le moment.
Je te donne le lien vers la page Wikipédia si tu veux en savoir plus
https://fr.wikipedia.org/wiki/Test_statistique
Et vers un très bon site de révision pour t'aider sur cette notion :
http://www.jaicompris.com/lycee/math/pr ... uation.php
J'espère que tu auras mieux compris, à bientôt
Re: Intervalle de fluctuation
Bonjour une fois encore,
Enfin j’ai compris le risque α . Merci pour votre explication bien claire !
Quant au risque β, qui ne figure pas au programme ( par ailleurs, c’est bien dommage que le manuel suggère qu’il ne soit pas calculable, cela m’a complètement dérouté...), j’ai imaginé une intérprètation suivante ; je vous prie de me dire, si cela est correct :
Soit H l’hypothèse à vérifier.On suppose que cette hypothèse est de type « OUI /NON » ( par exemple « pièce monnaie équilibrée/non équilibrée ») On notera ךH l’hypothèse contraire de type « NON/OUI ».Ayant construit l’intervalle de fluctuation autour de p, on prélève un échantillon et on obtient une fréquence observée f. Imaginons que f tombe dans la « zone d’acceptation » mais f est infiniment proche de p+1,96σ ainsi on est obligé d’accepter H à contre-coeur, on se pose donc des questions sur la validité d’une telle démarche... On veut donc évaluer la probabilité d’accepter H sachant qu’elle est fausse. On a alors :
P( accepter H | H est fausse ) = P( accepter H | ךH est vraie ) =
= P( accepter H ∩ ךH est vraie ) / P(ךH est vraie ) = 100/95 * P( accepter H ∩ ךH est vraie ).
Mais si ךH est vraie , alors il est possible de construire une distribution normale autour de la fréquence observée f. Le calcul de P( accepter H ∩ ךH est vraie ) consiste à déterminer l’intersection de zones d’acceptation engendrées par les deux courbes puis de calculer son aire...
Merci de votre réponse.
Nicolas.
Enfin j’ai compris le risque α . Merci pour votre explication bien claire !
Quant au risque β, qui ne figure pas au programme ( par ailleurs, c’est bien dommage que le manuel suggère qu’il ne soit pas calculable, cela m’a complètement dérouté...), j’ai imaginé une intérprètation suivante ; je vous prie de me dire, si cela est correct :
Soit H l’hypothèse à vérifier.On suppose que cette hypothèse est de type « OUI /NON » ( par exemple « pièce monnaie équilibrée/non équilibrée ») On notera ךH l’hypothèse contraire de type « NON/OUI ».Ayant construit l’intervalle de fluctuation autour de p, on prélève un échantillon et on obtient une fréquence observée f. Imaginons que f tombe dans la « zone d’acceptation » mais f est infiniment proche de p+1,96σ ainsi on est obligé d’accepter H à contre-coeur, on se pose donc des questions sur la validité d’une telle démarche... On veut donc évaluer la probabilité d’accepter H sachant qu’elle est fausse. On a alors :
P( accepter H | H est fausse ) = P( accepter H | ךH est vraie ) =
= P( accepter H ∩ ךH est vraie ) / P(ךH est vraie ) = 100/95 * P( accepter H ∩ ךH est vraie ).
Mais si ךH est vraie , alors il est possible de construire une distribution normale autour de la fréquence observée f. Le calcul de P( accepter H ∩ ךH est vraie ) consiste à déterminer l’intersection de zones d’acceptation engendrées par les deux courbes puis de calculer son aire...
Merci de votre réponse.
Nicolas.
-
- Messages : 1427
- Enregistré le : ven. 20 juin 2014 15:58
Re: Intervalle de fluctuation
Merci Nicolas,
Malheureusement, je pense que tu fais erreur en pensant qu'on 'vérifie' une hypothèse
on détermine alors le fameux intervalle (sous l'hypothèse H)
on teste si une mesure observée est ou pas dans l'intervalle, et on accepte H (ou ךH)
Ce qui est important : on fait ce test avec une certaine probabilité de se tromper.
De plus, le test Vrai/Faux n'est pas vraiment adéquat ici, puisque en déterminant l'intervalle de fluctuation asymptotique, on teste si une valeur mesurée d'un échantillon est oui ou non dans l'intervalle.
Enfin dans ton calcul de probabilité conditionnelle, P(ךH est vraie ) n'est pas égale à 95/100 ...
Les tests statistiques sont vraiment une partie délicate en mathématiques, selon la suite de vos études, vous aurez peut être à les étudier plus précisément, et dans ce cas, le professeur vous expliquera les tenants et les aboutissants de la construction de ces tests délicats !!
à très bientôt
Malheureusement, je pense que tu fais erreur en pensant qu'on 'vérifie' une hypothèse
En fait, on suppose cette hypothèse H vraie, (et on énonce l'alternative ךH)Soit H l’hypothèse à vérifier.On suppose que cette hypothèse est de type « OUI /NON » ( par exemple « pièce monnaie équilibrée/non équilibrée »)
on détermine alors le fameux intervalle (sous l'hypothèse H)
on teste si une mesure observée est ou pas dans l'intervalle, et on accepte H (ou ךH)
Ce qui est important : on fait ce test avec une certaine probabilité de se tromper.
De plus, le test Vrai/Faux n'est pas vraiment adéquat ici, puisque en déterminant l'intervalle de fluctuation asymptotique, on teste si une valeur mesurée d'un échantillon est oui ou non dans l'intervalle.
Enfin dans ton calcul de probabilité conditionnelle, P(ךH est vraie ) n'est pas égale à 95/100 ...
Les tests statistiques sont vraiment une partie délicate en mathématiques, selon la suite de vos études, vous aurez peut être à les étudier plus précisément, et dans ce cas, le professeur vous expliquera les tenants et les aboutissants de la construction de ces tests délicats !!
à très bientôt
Re: Intervalle de fluctuation
Bonjour,
Excusez-moi d’avoir interrompu impoliment notre conversation ; ma vie fut fortement bousculée, ma mère ayant subi un accident grave. Et puis le BAC est arrivé...Bref, je n’avais pas le courage de vous répondre...Toujours intéressé au problème en question dont nous avons parlé ( et attiré par les maths en général ! ), bien qu’ayant terminé le lycée, permettez-moi de nouveau de solliciter de votre bienveillance.
Je vous remercie d’avoir mis en évidence les imprécisions de mon langage. J’essaye une fois encore de reformuler ( en améliorant ) mes pensées ; vous me direz svp, si cela est correct :
on dispose d’un modèle statistique théorique ( du caractère étudié ) dont tous les paramètres
( une proportion p par exemple ) sont connus . On veut savoir, si le comportement statistique
dudit caractère dans l’ensemble d’une population réelle correspond à ce modèle. On prélève donc un échantillon, à partir duquel on obtient des paramètres empiriques ( la fréquence observée f par exemple ). On vérifie la compatibilité de cet échantillon avec le modèle théorique .
Avec l’intervalle de fluctuation, il y a donc deux possibilités, suivant la valeur
| f –– p | ( ≤ 1,96σ ou > 1,96σ ) , à savoir :
Hypothèse H : « il y a une correspondance entre la réalité et le modèle théorique »
Hypothèse ¬H : « il n’y a pas de correspondance entre la réalité et le modèle théorique »
Supposons qu’on est forcé ( ayant obtenu par exemple | f –– p | = 1,96σ exactement ) d’accepter à contre-coeur H, l’intuition et l’observation des faits nous suggérant d’opter plutôt pour ¬H.
On s’intéresse alors à l’évaluation de l’erreur β ( dont l’existence fut injustement caviardée dans le manuel ), et qui est la probabilité conditionnelle d’accepter H, sachant qu’il n’y a pas vraiment de correspondance entre la réalité et le modèle théorique . On notera cette probabilité
β = P ( «H »| «¬H» ).
J’ai utilisé des guillemets, car autrement cette notation n’aurait aucun sens formel (logique).
Puisqu’on est persuadé qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, IL CONVIENDRAIT d’admettre pour le calcul, qu’alors les données empiriques
( et non théoriques ) sont compatibles de façon satisfaisante avec la réalité en général ; cela nous entraine à construire autour de la fréquence observée f une seconde distribution statistique ( de variance f (1–– f )/n ), avec sa fluctuation qu’on acceptera au seuil de 0,95. Ainsi
P ( «H »| «¬H» ) = P («H » ∩ «¬H» ) / P («¬H» ).
Dans ce calcul, P («H » ∩ «¬H» ) devra alors être interprétée comme l’intersection de zones d’acceptation au-dessous des deux courbes normales, et P («¬H» ) – justement - puisqu’on est persuadé ( on est pratiquement sûr ) qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, prendrait la valeur 0,95 ( seuil de fiabilité des calculs ).
Cette dernière constatation reste un peu délicate, vous n’étiez pas d’accord, mais comment le faire autrement ? ( J’ai effectué des recherches approfondies à ce sujet sur l’internet ; dans quelques sources il est dit sans justifier, que β est purement représenté sous forme d’intersection de zones d’acceptation au-dessous des deux courbes de densité en question, ce qui suggérerait que P («¬H» ) = 1...Mais pourquoi ? )
Merci de vos avis.
Nicolas.
Excusez-moi d’avoir interrompu impoliment notre conversation ; ma vie fut fortement bousculée, ma mère ayant subi un accident grave. Et puis le BAC est arrivé...Bref, je n’avais pas le courage de vous répondre...Toujours intéressé au problème en question dont nous avons parlé ( et attiré par les maths en général ! ), bien qu’ayant terminé le lycée, permettez-moi de nouveau de solliciter de votre bienveillance.
Je vous remercie d’avoir mis en évidence les imprécisions de mon langage. J’essaye une fois encore de reformuler ( en améliorant ) mes pensées ; vous me direz svp, si cela est correct :
on dispose d’un modèle statistique théorique ( du caractère étudié ) dont tous les paramètres
( une proportion p par exemple ) sont connus . On veut savoir, si le comportement statistique
dudit caractère dans l’ensemble d’une population réelle correspond à ce modèle. On prélève donc un échantillon, à partir duquel on obtient des paramètres empiriques ( la fréquence observée f par exemple ). On vérifie la compatibilité de cet échantillon avec le modèle théorique .
Avec l’intervalle de fluctuation, il y a donc deux possibilités, suivant la valeur
| f –– p | ( ≤ 1,96σ ou > 1,96σ ) , à savoir :
Hypothèse H : « il y a une correspondance entre la réalité et le modèle théorique »
Hypothèse ¬H : « il n’y a pas de correspondance entre la réalité et le modèle théorique »
Supposons qu’on est forcé ( ayant obtenu par exemple | f –– p | = 1,96σ exactement ) d’accepter à contre-coeur H, l’intuition et l’observation des faits nous suggérant d’opter plutôt pour ¬H.
On s’intéresse alors à l’évaluation de l’erreur β ( dont l’existence fut injustement caviardée dans le manuel ), et qui est la probabilité conditionnelle d’accepter H, sachant qu’il n’y a pas vraiment de correspondance entre la réalité et le modèle théorique . On notera cette probabilité
β = P ( «H »| «¬H» ).
J’ai utilisé des guillemets, car autrement cette notation n’aurait aucun sens formel (logique).
Puisqu’on est persuadé qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, IL CONVIENDRAIT d’admettre pour le calcul, qu’alors les données empiriques
( et non théoriques ) sont compatibles de façon satisfaisante avec la réalité en général ; cela nous entraine à construire autour de la fréquence observée f une seconde distribution statistique ( de variance f (1–– f )/n ), avec sa fluctuation qu’on acceptera au seuil de 0,95. Ainsi
P ( «H »| «¬H» ) = P («H » ∩ «¬H» ) / P («¬H» ).
Dans ce calcul, P («H » ∩ «¬H» ) devra alors être interprétée comme l’intersection de zones d’acceptation au-dessous des deux courbes normales, et P («¬H» ) – justement - puisqu’on est persuadé ( on est pratiquement sûr ) qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, prendrait la valeur 0,95 ( seuil de fiabilité des calculs ).
Cette dernière constatation reste un peu délicate, vous n’étiez pas d’accord, mais comment le faire autrement ? ( J’ai effectué des recherches approfondies à ce sujet sur l’internet ; dans quelques sources il est dit sans justifier, que β est purement représenté sous forme d’intersection de zones d’acceptation au-dessous des deux courbes de densité en question, ce qui suggérerait que P («¬H» ) = 1...Mais pourquoi ? )
Merci de vos avis.
Nicolas.
Re: Intervalle de fluctuation
Je vous remercie d’avoir mis en évidence les imprécisions de mon langage. J’essaye une fois encore de reformuler ( en améliorant ) mes pensées ; vous me direz svp, si cela est correct :
on dispose d’un modèle statistique théorique ( du caractère étudié ) dont tous les paramètres
( une proportion p par exemple ) sont connus . On veut savoir, si le comportement statistique
dudit caractère dans l’ensemble d’une population réelle correspond à ce modèle. On prélève donc un échantillon, à partir duquel on obtient des paramètres empiriques ( la fréquence observée f par exemple ). On vérifie la compatibilité de cet échantillon avec le modèle théorique .
Avec l’intervalle de fluctuation, il y a donc deux possibilités, suivant la valeur
| f –– p | ( ≤ 1,96σ ou > 1,96σ ) , à savoir :
Hypothèse H : « il y a une correspondance entre la réalité et le modèle théorique »
Hypothèse ¬H : « il n’y a pas de correspondance entre la réalité et le modèle théorique »
Supposons qu’on est forcé ( ayant obtenu par exemple | f –– p | = 1,96σ exactement ) d’accepter à contre-coeur H, l’intuition et l’observation des faits nous suggérant d’opter plutôt pour ¬H.
On s’intéresse alors à l’évaluation de l’erreur β et qui est la probabilité conditionnelle d’accepter H, sachant qu’il n’y a pas vraiment de correspondance entre la réalité et le modèle théorique . On notera cette probabilité
β = P ( «H »| «¬H» ).
J’ai utilisé des guillemets, car autrement cette notation n’aurait aucun sens formel (logique).
Puisqu’on est persuadé qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, IL CONVIENDRAIT d’admettre pour le calcul, qu’alors les données empiriques
( et non théoriques ) sont compatibles de façon satisfaisante avec la réalité en général ; cela nous entraine à construire autour de la fréquence observée f une seconde distribution statistique ( de variance f (1–– f )/n ), avec sa fluctuation qu’on acceptera au seuil de 0,95. Ainsi
P ( «H »| «¬H» ) = P («H » ∩ «¬H» ) / P («¬H» ).
Dans ce calcul, P («H » ∩ «¬H» ) devra alors être interprétée comme l’intersection de zones d’acceptation au-dessous des deux courbes normales, et P («¬H» ) – justement - puisqu’on est persuadé ( on est pratiquement sûr ) qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, prendrait la valeur 0,95 ( seuil de fiabilité des calculs ).
Cette dernière constatation reste un peu délicate, vous n’étiez pas d’accord, mais comment le faire autrement ? ( J’ai effectué des recherches approfondies à ce sujet sur l’internet ; dans quelques sources il est dit sans justifier, que β est purement représenté sous forme d’intersection de zones d’acceptation au-dessous des deux courbes de densité en question, ce qui suggérerait que P («¬H» ) = 1...Mais pourquoi ? )
Merci de vos avis.
Nicolas.
on dispose d’un modèle statistique théorique ( du caractère étudié ) dont tous les paramètres
( une proportion p par exemple ) sont connus . On veut savoir, si le comportement statistique
dudit caractère dans l’ensemble d’une population réelle correspond à ce modèle. On prélève donc un échantillon, à partir duquel on obtient des paramètres empiriques ( la fréquence observée f par exemple ). On vérifie la compatibilité de cet échantillon avec le modèle théorique .
Avec l’intervalle de fluctuation, il y a donc deux possibilités, suivant la valeur
| f –– p | ( ≤ 1,96σ ou > 1,96σ ) , à savoir :
Hypothèse H : « il y a une correspondance entre la réalité et le modèle théorique »
Hypothèse ¬H : « il n’y a pas de correspondance entre la réalité et le modèle théorique »
Supposons qu’on est forcé ( ayant obtenu par exemple | f –– p | = 1,96σ exactement ) d’accepter à contre-coeur H, l’intuition et l’observation des faits nous suggérant d’opter plutôt pour ¬H.
On s’intéresse alors à l’évaluation de l’erreur β et qui est la probabilité conditionnelle d’accepter H, sachant qu’il n’y a pas vraiment de correspondance entre la réalité et le modèle théorique . On notera cette probabilité
β = P ( «H »| «¬H» ).
J’ai utilisé des guillemets, car autrement cette notation n’aurait aucun sens formel (logique).
Puisqu’on est persuadé qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, IL CONVIENDRAIT d’admettre pour le calcul, qu’alors les données empiriques
( et non théoriques ) sont compatibles de façon satisfaisante avec la réalité en général ; cela nous entraine à construire autour de la fréquence observée f une seconde distribution statistique ( de variance f (1–– f )/n ), avec sa fluctuation qu’on acceptera au seuil de 0,95. Ainsi
P ( «H »| «¬H» ) = P («H » ∩ «¬H» ) / P («¬H» ).
Dans ce calcul, P («H » ∩ «¬H» ) devra alors être interprétée comme l’intersection de zones d’acceptation au-dessous des deux courbes normales, et P («¬H» ) – justement - puisqu’on est persuadé ( on est pratiquement sûr ) qu’il n’y a pas de correspondance entre la réalité et le modèle théorique, prendrait la valeur 0,95 ( seuil de fiabilité des calculs ).
Cette dernière constatation reste un peu délicate, vous n’étiez pas d’accord, mais comment le faire autrement ? ( J’ai effectué des recherches approfondies à ce sujet sur l’internet ; dans quelques sources il est dit sans justifier, que β est purement représenté sous forme d’intersection de zones d’acceptation au-dessous des deux courbes de densité en question, ce qui suggérerait que P («¬H» ) = 1...Mais pourquoi ? )
Merci de vos avis.
Nicolas.
-
- Messages : 6351
- Enregistré le : mer. 5 sept. 2007 12:10
Re: Intervalle de fluctuation
Bonjour Nicolas,
Je ne comprends pas ce que vous recherchez.
Vous voulez calculer P( «H »| «¬H» ) … mais P( «H »| «¬H» ) = 0 car «H » ∩ «¬H» = {}.
SoSMath.
Je ne comprends pas ce que vous recherchez.
Vous voulez calculer P( «H »| «¬H» ) … mais P( «H »| «¬H» ) = 0 car «H » ∩ «¬H» = {}.
SoSMath.