Monday, 20 February 2017

Comment Faire Manova In Stata Forex

ANOVA bidirectionnelle dans Stata Introduction L'ANOVA bidirectionnelle compare les différences moyennes entre les groupes qui ont été divisés sur deux variables indépendantes (appelées facteurs). Le but principal d'une ANOVA bidirectionnelle est de comprendre s'il existe une interaction entre les deux variables indépendantes sur la variable dépendante. Par exemple, vous pourriez utiliser une ANOVA bidirectionnelle pour comprendre s'il y a une interaction entre le niveau d'études et le type de diplôme sur le salaire (c'est à dire que votre variable dépendante serait le salaire, mesuré sur une échelle continue en dollars US et vos variables indépendantes seraient , Qui a trois groupes de ndash de premier cycle, de maîtrise et de doctorat ndash et le type de diplôme, qui a cinq groupes: études commerciales, psychologie, sciences biologiques, ingénierie et droit). Alternativement, vous pouvez utiliser une ANOVA bidirectionnelle pour comprendre s'il existe une interaction entre le niveau d'activité physique et le sexe sur la concentration de cholestérol sanguin chez les enfants (c. à d. Votre variable dépendante serait la concentration du cholestérol sanguin, mesurée sur une échelle continue en mmolL et votre Variables indépendantes serait le niveau d'activité physique, qui a trois groupes ndash bas, modéré et élevé ndash et le sexe, qui a deux groupes: les hommes et les femmes). Remarque: Si vous avez trois variables indépendantes plutôt que deux, vous avez besoin d'une ANOVA à trois voies. Si vous avez une interaction statistiquement significative entre vos deux variables indépendantes sur la variable dépendante, vous pouvez suivre ce résultat en déterminant s'il y a des effets principaux quotsimples et, le cas échéant, quels sont ces effets (par exemple, peut être des femmes ayant une formation universitaire Avaient un plus grand intérêt pour la politique que les hommes avec une éducation universitaire). Nous revenons à des effets principaux simples plus tard. Dans ce guide de démarrage rapide, nous vous montrons comment effectuer une ANOVA bidirectionnelle en utilisant Stata, ainsi que d'interpréter et de rapporter les résultats de ce test. Cependant, avant de vous présenter cette procédure, vous devez comprendre les différentes hypothèses que vos données doivent satisfaire afin qu'une ANOVA bidirectionnelle vous donne un résultat valide. Nous discutons ces hypothèses à la suite. Hypothèses Six hypothèses sous tendent l'ANOVA bidirectionnelle. Si l'une de ces six hypothèses n'est pas remplie, vous ne pouvez pas analyser vos données à l'aide d'une ANOVA bidirectionnelle car vous n'obtiendrez pas un résultat valide. Puisque les hypothèses 1, 2 et 3 se rapportent à la conception de votre étude et au choix des variables, elles ne peuvent être testées pour l'utilisation de Stata. Cependant, vous devez décider si votre étude répond à ces hypothèses avant de passer à autre chose. Hypothèse 1: Votre variable dépendante doit être mesurée au niveau continu. (Mesurée en degrés Celsius), le salaire (mesuré en dollars américains), le temps de révision (mesuré en heures), l'intelligence (mesurée à l'aide du score de QI), le temps de réaction En millisecondes), la performance des tests (mesurée de 0 à 100), les ventes (mesurées en nombre de transactions par mois), et ainsi de suite. Si vous ne savez pas si votre variable dépendante est continue (c'est à dire mesurée au niveau de l'intervalle ou du ratio), consultez notre guide Types de variables. Hypothèse 2: Vos deux variables indépendantes devraient chacune se composer de deux ou plus catégoriques. Indépendants (non apparentés). Les exemples de variables catégorielles incluent le genre (par exemple 2 groupes: hommes et femmes), l'appartenance ethnique (par exemple 3 groupes: caucasien, afro américain et hispanique), la profession (5 groupes: chirurgien, médecin, infirmière, dentiste, thérapeute) . Hypothèse 3: Vous devez avoir l'indépendance des observations. Ce qui signifie qu'il n'y a pas de relation entre les observations dans chaque groupe ou entre les groupes eux mêmes. Par exemple, il doit y avoir différents participants dans chaque groupe, aucun participant n'étant dans plus d'un groupe. Si vous n'avez pas l'indépendance des observations, il est probable que vous ayez des groupes apparentés, ce qui signifie que vous pourriez avoir besoin d'utiliser un ANOVA à deux sens des mesures répétées au lieu de la ANOVA bidirectionnelle. Heureusement, vous pouvez vérifier les hypothèses 4, 5 et 6 en utilisant Stata. En passant aux hypothèses 4, 5 et 6, nous suggérons de les tester dans cet ordre parce qu'il représente un ordre dans lequel, si une violation à l'hypothèse n'est pas corrigible, vous ne pourrez plus utiliser une ANOVA bidirectionnelle. En fait, ne soyez pas surpris si vos données échouent à une ou plusieurs de ces hypothèses, car cela est assez typique lorsque vous travaillez avec des données du monde réel plutôt que des exemples de manuels, qui souvent ne vous montrent comment effectuer une ANOVA bidirectionnelle lorsque tout va bien. Cependant, ne vous inquiétez pas parce que même lorsque vos données échouent certaines hypothèses, il ya souvent une solution pour surmonter cela (par exemple, transformer vos données ou en utilisant un autre test statistique à la place). N'oubliez pas que si vous ne vérifiez pas que vos données respectent ces hypothèses ou si vous les testez de manière incorrecte, les résultats obtenus lors de l'exécution d'une ANOVA bidirectionnelle pourraient ne pas être valides. Hypothèse 4: Il ne devrait pas y avoir de valeurs aberrantes significatives. Un outlier est tout simplement un seul cas dans votre ensemble de données qui ne suit pas le schéma habituel (par exemple, dans une étude de 100 élèves IQ scores, où le score moyen était de 108 avec seulement une petite variation entre les étudiants, un étudiant avait un score de 156 , Ce qui est très inhabituel, et peut même la mettre dans le top 1 des scores de QI dans le monde). Le problème avec les valeurs aberrantes est qu'ils peuvent avoir un effet négatif sur la variance à deux voies, ce qui réduit la précision de vos résultats. Heureusement, lorsque vous utilisez Stata pour exécuter une ANOVA bidirectionnelle sur vos données, vous pouvez facilement détecter d'éventuels outliers. Hypothèse 5: Votre variable dépendante devrait être approximativement distribuée normalement pour chaque combinaison des groupes des deux variables indépendantes. Vos données doivent seulement être approximativement normales pour exécuter une ANOVA bidirectionnelle car elle est assez robuste aux violations de la normalité, ce qui signifie que cette hypothèse peut être un peu violée et encore fournir des résultats valables. Vous pouvez tester la normalité en utilisant le test de normalité Shapiro Wilk, qui est facilement testé pour l'utilisation de Stata. Hypothèse 6: Il faut qu'il y ait homogénéité des variances pour chaque combinaison des groupes des deux variables indépendantes. Vous pouvez tester cette hypothèse dans Stata en utilisant le test de Levenes pour l'homogénéité des variances. En pratique, la vérification des hypothèses 4, 5 et 6 prendra probablement la plus grande partie de votre temps lors de la réalisation d'une ANOVA bidirectionnelle. Cependant, ce n'est pas une tâche difficile, et Stata fournit tous les outils dont vous avez besoin pour ce faire. Dans la section Procédure de test de Stata. Nous illustrons la procédure Stata requise pour effectuer une ANOVA bidirectionnelle en supposant qu'aucune hypothèse n'a été violée. Tout d'abord, nous présentons l'exemple que nous utilisons pour expliquer la procédure ANOVA bidirectionnelle dans Stata. Un chercheur s'intéressait à savoir si l'intérêt des individus pour la politique était influencé par leur niveau d'éducation et leur sexe. Par conséquent, la variable dépendante était l'intérêt pour la politique, et les deux variables indépendantes étaient le sexe et le niveau d'éducation. En particulier, le chercheur voulait savoir s'il y avait une interaction entre le niveau d'éducation et le sexe. Pour répondre à cette question, un échantillon aléatoire de 60 participants a été recruté pour participer à l'étude ndash 30 mâles et 30 femelles ndash également répartis par niveau De l'éducation: l'école, le collège et l'université (soit 10 participants par groupe). Chaque participant à l'étude a rempli un questionnaire qui a marqué son intérêt pour la politique sur une échelle de 0 à 100, avec des scores plus élevés indiquant un plus grand intérêt pour la politique. L'intérêt des participants pour la politique a été enregistré dans la variable IntPolitics. Leur sexe dans la variable Genre. Et leur niveau d'éducation dans la variable, EduLevel. En termes variables, le chercheur voulait savoir s'il existait une interaction entre Gender et EduLevel sur IntPolitics. Configuration dans Stata Dans Stata, nous avons séparé les individus dans leurs groupes appropriés en utilisant deux colonnes représentant les deux variables indépendantes, et les avons étiquetés Gender et EduLevel. Pour le sexe. Nous avons codé Male comme 1 et Female comme 2. Et pour EduLevel. Nous avons codé l'école comme 1. Collège 2 et Université 3. L'intérêt des participants pour la politique ndash la variable dépendante ndash a été saisie sous le nom de la variable, IntPolitics. La configuration de cet exemple peut être vue ci dessous: Publié avec l'autorisation écrite de StataCorp LP. Les scores pour les variables indépendantes, EduLevel et Gender. Ainsi que les scores pour la variable dépendante, IntPolitics. Ont ensuite été saisis dans la feuille de calcul Editeur de données (Éditer), comme indiqué ci dessous: Publié avec l'autorisation écrite de StataCorp LP. Procédure de test dans Stata Dans cette section, nous vous montrons comment analyser vos données en utilisant une ANOVA bidirectionnelle dans Stata lorsque les six hypothèses dans la section précédente, Hypothèses. N'ont pas été violés. Vous pouvez effectuer une ANOVA bidirectionnelle à l'aide d'un code ou d'une interface graphique utilisateur Stats (GUI). Après avoir effectué votre analyse, nous vous montrerons comment interpréter vos résultats. Tout d'abord, choisissez si vous souhaitez utiliser le code ou Statas interface graphique utilisateur (GUI). Dans la première section ci dessous, nous avons défini le code pour effectuer une ANOVA bidirectionnelle. Tout le code est entré dans la boîte de Statas, comme illustré ci dessous: Publié avec l'autorisation écrite de StataCorp LP. Le code pour exécuter une ANOVA bidirectionnelle sur vos données prend la forme: anova DependentVariable FirstIndependentVariableSecondIndependentVariable En utilisant notre exemple où la variable dépendante est IntPolitics et les deux variables indépendantes sont Gender et EduLevel. Le code requis est: anova IntPolitics GenderEduLevel Par conséquent, entrez le code et appuyez sur le bouton ReturnEnter de votre mot clé. Vous pouvez voir la sortie de Stata qui sera produite ici. S'il ya une interaction statistiquement significative, vous pouvez effectuer des effets principaux simples. Nous en discuterons plus tard. Interface utilisateur graphique (GUI) Cliquez sur Statistiques gt Modèles linéaires et connexes gt ANOVAMANOVA gt Analyse de la variance et de la covariance sur le menu supérieur comme indiqué ci dessous. Publié avec l'autorisation écrite de StataCorp LP. Vous obtiendrez l'anova suivante Boîte de dialogue Analyse de variance et covariance: Publié avec l'autorisation écrite de StataCorp LP. Sélectionnez la variable dépendante IntPolitics. Dans la case déroulante Variable dépendante: et cliquez sur le bouton de trois points,, à l'extrême droite de la zone de liste déroulante Modèle :. Publié avec l'autorisation écrite de StataCorp LP. Vous obtiendrez la boîte de dialogue suivante Créer une varlist avec variables factor: Publié avec l'autorisation écrite de StataCorp LP. Conservez l'option Variable Facteur sélectionnée dans le ndashType de la zone variablendash. Dans la zone ndashAdd factor variablendash, sélectionnez l'option dans la zone de liste déroulante Spécification:. Vous obtiendrez une deuxième zone de liste déroulante Variables, comme indiqué ci dessous: Publié avec l'autorisation écrite de StataCorp LP. Pour la variable 1. sélectionnez Genre dans la zone de liste déroulante Variables et cliquez sur la zone de liste déroulante Base. Pour Variable 2. sélectionnez EduLevel sous la zone de liste déroulante Variables et cliquez sur la zone de liste déroulante Base. Ensuite, cliquez sur le bouton, qui ajoutera le terme Modèle, GenderEduLevel. Dans la zone Varlist:. Publié avec l'autorisation écrite de StataCorp LP. Remarque: Nous n'avons pas coché la case à cocher, sous c. Pour l'une de nos deux variables indépendantes, Gender ou EduLevel. C'est parce que l'hypothèse 2 d'une ANOVA bidirectionnelle est que les deux variables indépendantes sont des variables factorielles (c. à d. Des variables catégorielles), c'est à dire que le sexe a deux catégories (c. à d. Mâle et femelle), tandis que EduLevel a trois catégories ). Cliquez sur le bouton. On vous présentera la boîte de dialogue Anova Analyse de la variance et de la covariance, mais maintenant avec le terme Modèle, GenderEduLevel. Après avoir été ajouté dans la boîte modèle :, comme indiqué ci dessous: Publié avec l'autorisation écrite de StataCorp LP. Cliquez sur le bouton. Cela générera la sortie Stata pour la variance ANOVA bidirectionnelle, illustrée dans la section suivante. Sortie de l'ANOVA bidirectionnelle dans Stata Si vos données ont passé l'hypothèse 4 (c'est à dire qu'il n'y avait pas de valeurs aberrantes significatives), l'hypothèse 5 (c'est à dire que votre variable dépendante était approximativement distribuée normalement pour chaque groupe de la variable indépendante) Homogénéité des variances), que nous avons expliqué précédemment dans la section «Hypothèses», vous n'aurez qu'à interpréter la sortie Stata suivante pour la variante ANOVA bidirectionnelle: Publié avec l'autorisation écrite de StataCorp LP. Le genre . Les lignes EduLevel et GenderEduLevel dans la sortie ci dessus expliquent si nous avons des effets statistiquement significatifs pour nos deux variables indépendantes, Gender et EduLevel. Et pour leur interaction, GenderEduLevel. Nous examinons d'abord l'interaction GenderEduLevel parce que c'est le résultat le plus important que nous recherchons. Nous pouvons voir à partir de la colonne Prob gt F que nous avons une interaction statistiquement significative au niveau p .0016. Vous voudrez peut être également signaler les résultats de Gender and EduLevel. Nous pouvons voir à partir de la sortie ci dessus qu'il n'y avait pas de différence statistiquement significative dans l'intérêt pour la politique entre les sexes (p. 4987), mais il y avait des différences statistiquement significatives entre les niveaux d'éducation (p lt. Enfin, si vous avez une interaction statistiquement significative, vous devrez également signaler des effets principaux simples, c'est à dire l'effet d'une des variables indépendantes à un niveau particulier de l'autre variable indépendante. Dans notre exemple, il s'agirait de déterminer la différence moyenne d'intérêt en politique entre les sexes à chaque niveau d'éducation, ainsi qu'entre le niveau d'éducation pour chaque sexe (par exemple, peut être les femmes ayant une formation universitaire s'intéressaient davantage à la politique que les hommes à une université éducation). Sinon, si vous n'avez pas une interaction statistiquement significative, vous pouvez signaler les effets principaux à la place. Les effets principaux simples et les effets principaux peuvent être calculés en utilisant Stata. Rapporter les résultats d'une ANOVA bidirectionnelle Lorsque vous signalez la sortie de votre ANOVA bidirectionnelle, il est bon d'inclure: A. Une introduction à l'analyse que vous avez effectuée. B. Des renseignements sur votre échantillon (y compris le nombre de participants dans chacun de vos groupes si la taille des groupes était inégale ou s'il y avait des valeurs manquantes). C. Une déclaration indiquant s'il y avait une interaction statistiquement significative entre vos deux variables indépendantes sur la variable dépendante (y compris la valeur F F observée, les degrés de liberté df et le niveau de signification, ou plus spécifiquement la valeur p à 2 queues Si l'interaction était statistiquement significative, une énumération des groupes des deux variables indépendantes a montré des différences statistiquement significatives en termes de variable dépendante, c'est à dire les effets principaux simples (indiquant quels groupes étaient ou non statistiquement significatifs) Les résultats de cette étude sont les suivants (NB, nous avons également inclus un exemple d'effets principaux simples): Une ANOVA bidirectionnelle a été exécutée sur une base de données F (2, 52) 7,33, p. 0016. Il existe une interaction significative entre les effets du genre et du niveau d'éducation sur l'intérêt pour la politique. Une simple analyse des effets principaux a montré que les hommes étaient significativement plus intéressés par la politique que les femmes lorsqu'ils étaient scolarisés au niveau universitaire (p. 002), mais il n'y avait pas de différence entre les sexes lorsqu'ils étaient scolarisés (p.465) ou collégial (p. . NOTICE: Le groupe de consultation IDRE Statistical migrera le site Web vers le WordPress CMS en février pour faciliter la maintenance et la création de nouveaux contenus. Certaines de nos anciennes pages seront supprimées ou archivées de sorte qu'elles ne seront plus conservées. Nous essaierons de maintenir les redirections afin que les anciennes URL continuent à fonctionner de la meilleure façon possible. Bienvenue à l'Institut de recherche et d'éducation numériques Aidez le Stat Consulting Group en donnant un cadeau. Stata Annotated Output MANOVA Cette page montre un exemple d'analyse multivariée de la variance (MANOVA) dans Stata avec des notes de bas de page expliquant la sortie. Les données utilisées dans cet exemple proviennent de l'expérience suivante. Un chercheur affecte au hasard 33 sujets à l'un des trois groupes. Le premier groupe reçoit des informations techniques nutritionnelles de façon interactive à partir d'un site Web en ligne. Le groupe 2 reçoit les mêmes renseignements d'une infirmière praticienne, tandis que le groupe 3 reçoit l'information d'une cassette vidéo faite par la même infirmière praticienne. Chaque sujet a alors fait trois notes: la difficulté, l'utilité et l'importance de l'information dans la présentation. Le chercheur examine trois classements différents de la présentation (difficulté, utilité et importance) pour déterminer s'il existe une différence dans les modes de présentation. En particulier, le chercheur s'intéresse à savoir si le site Web interactif est supérieur parce que c'est la façon la plus rentable de fournir l'information. Dans l'ensemble de données, les notes sont présentées dans les variables utiles. Difficulté et importance. Le groupe de variables indique le groupe auquel un sujet a été assigné. Nous sommes intéressés par la façon dont la variabilité des trois notations peut être expliquée par un groupe de sujets. Groupe est une variable catégorielle avec trois valeurs possibles: 1, 2 ou 3. Comme nous avons plusieurs variables dépendantes qui ne peuvent pas être combinées, nous choisirons d'utiliser MANOVA. Notre hypothèse nulle dans cette analyse est qu'un groupe de sujets n'a aucun effet sur aucune des trois cotes différentes. Nous pouvons commencer par examiner les trois variables de résultat. Notez que Stata marque le groupe 1 comme groupe de traitement, le groupe 2 comme témoin1. Et le groupe 3 comme témoin2. Ensuite, nous pouvons entrer notre commande MANOVA. En examinant nos résultats, nous allons nous référer aux valeurs propres de la matrice somme des carrés du modèle et de la matrice somme des carrés de l'erreur. Ces valeurs seront instructives dans la compréhension de la sortie MANOVA. Pour afficher les valeurs, nous demandons à Stata d'énumérer la matrice des valeurs propres du modèle. Valeurs propres a Sortie MANOVA b a. Valeurs propres Il s'agit des valeurs propres du produit de la matrice somme des carrés du modèle et de la matrice somme des carrés de l'erreur. Il existe une valeur propre pour chacun des trois vecteurs propres du produit de la somme du modèle de la matrice des carrés et la somme des erreurs de la matrice des carrés, une matrice 3x3. Puisque seulement deux sont énumérés ici, nous pouvons supposer que la troisième valeur propre est zéro. Ces valeurs propres sont parmi les résultats enregistrés de notre manova à Stata. Ils sont utilisés dans le calcul des statistiques de test multivariées et sont donc utiles à considérer lors de l'examen de la production de MANOVA. B. Sortie MANOVA Dans Stata, la sortie MANOVA comprend quatre statistiques de test multivariées pour chaque variable prédictive. Les quatre tests sont listés au dessus de la table de sortie. Pour chacune des quatre statistiques de test, une statistique F et une valeur p associée sont également affichées. C. Wilks lambda Cela peut être interprété comme la proportion de la variance dans les résultats qui n'est pas expliqué par un effet. Pour calculer Wilks Lambda, pour chaque valeur propre, calculez 1 (1 la valeur propre), puis trouvez le produit de ces ratios. Donc, dans cet exemple, vous devez d'abord calculer 1 (10.8919879) 0.5285446, 1 (10.00524207) 0.9947853 et 1 (10) 1. Ensuite, multipliez 0,5285446 0,9947853 1 0,5258. ré. Pillais trace Ceci est une autre statistique de test multivariée. Pour calculer la trace de Pillais, divisez chaque valeur propre par 1 la racine caractéristique, puis additionnez ces rapports. Donc, dans cet exemple, vous devez d'abord calculer 0,8919879 (10,8919879) 0,471455394, 0,00524207 (10,00524207) 0,005214734 et 0 (10) 0. Quand on les ajoute, on arrive à la trace de Pillais: (0,471455394 0,005214734 0) 0,4767. E. Lawley Hotelling trace C'est très semblable à Pillais Trace. C'est la somme des racines du produit de la matrice somme des carrés du modèle et de la matrice somme des carrés de l'erreur pour les deux fonctions de régression linéaire et est une généralisation directe de la statistique F dans l'ANOVA. On peut calculer la trace d'Hotelling Lawley en additionnant les racines caractéristiques énumérées dans la sortie: 0.8919879 0.00524207 0 0.8972. F. Principale racine de Roys Il s'agit de la plus grande des racines du produit de la matrice somme des carrés du modèle et de la matrice somme des carrés de l'erreur pour les deux fonctions de régression linéaire. Parce que c'est un maximum, il peut se comporter différemment des trois autres statistiques de test. Dans les cas où les trois autres ne sont pas significatifs et Roys est significatif, l'effet devrait être considéré comme insignifiant. g. Source Indique la variable prédictive en question. Dans notre modèle, nous considérons le groupe comme une source de variabilité dans les notations. H. Statistique Il s'agit de la statistique de test pour la source donnée énumérée dans la colonne précédente et de la statistique multivariée indiquée par la lettre (W, P, L ou R). Pour chaque variable indépendante, on calcule quatre statistiques de test multivariées. Voir les exposants c, d, e et f. je. Df C'est le nombre de degrés de liberté. Ici, notre prédicteur a trois catégories et notre ensemble de données a 33 observations, nous avons donc 2 degrés de liberté pour l'hypothèse, 30 degrés résiduels de liberté et 32 ​​degrés de liberté totale. J. F (df1, df2), F Les deux premières colonnes (df1 et df2) énumèrent les degrés de liberté utilisés pour déterminer les statistiques F. La troisième colonne énumère la statistique F pour la source donnée et le test multivarié. K. Prob gt F Il s'agit de la valeur p associée à la statistique F d'un effet donné et d'une statistique de test. L'hypothèse nulle selon laquelle un prédicteur donné n'a aucun effet sur l'un ou l'autre des résultats est évaluée à l'égard de cette valeur p. Pour un niveau alpha donné, si la valeur p est inférieure à alpha, l'hypothèse nulle est rejetée. Sinon, nous ne rejetons pas l'hypothèse nulle. Dans cet exemple, nous rejetons l'hypothèse nulle selon laquelle le groupe n'a aucun effet sur les trois notations différentes au niveau alpha .05 parce que les valeurs p sont toutes inférieures à 0,05. L. E exacte, approximative, u borne supérieure sur F Ceci indique comment la statistique F a été calculée (qu'il s'agisse d'un calcul exact, d'une approximation ou d'une limite supérieure) pour chacun des tests multivariés. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web particulier, d'un livre ou d'un produit logiciel par l'Université de Californie.


No comments:

Post a Comment