Sunday 23 July 2017

Rescaling Daten In Stata Forex


HINWEIS: Die IDRE Statistical Consulting Group wird im Februar die Website auf das WordPress CMS migrieren, um die Wartung und die Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group durch ein Geschenk Stata Learning Modul Erstellen und Umkodieren von Variablen Dieses Modul zeigt, wie Sie Variablen erstellen und rekodieren. In Stata können Sie neue Variablen mit generieren und Sie können die Werte einer vorhandenen Variablen mit Ersetzen und mit Recode ändern. Berechnen neuer Variablen mit generieren und ersetzen Lets verwenden die Auto-Daten für unsere Beispiele. In diesem Abschnitt sehen wir, wie man Variablen mit Generieren und Ersetzen berechnen kann. Die variable Länge enthält die Länge des Autos in Zoll. Nachfolgend sehen wir eine zusammenfassende Statistik für die Länge. Mit dem Befehl "generate" können Sie eine neue Variable erstellen, die die Länge in Fuß anstelle von Inches hat, lenft genannt. Wir sollten betonen, dass generieren ist für die Schaffung einer neuen Variable. Für eine vorhandene Variable müssen Sie den Befehl replace (nicht generieren) verwenden. Wie unten gezeigt, verwenden wir replace, um die Zuweisung an lenft zu wiederholen. Die Syntax von generate und replace ist identisch mit Ausnahme von: - generieren, wenn die Variable noch nicht existiert und einen Fehler gibt, wenn die Variable bereits existiert. - ersetzen Sie die Arbeit, wenn die Variable bereits existiert, und gibt einen Fehler, wenn die Variable noch nicht vorhanden ist. Angenommen, wir wollten eine Variable namens length2 erstellen, die die Länge quadriert hat. Oder möchten wir vielleicht loglen, die die natürliche Länge der Länge ist. Lets get die mittlere und Standardabweichung der Länge und wir können Z-Scores der Länge zu machen. Der Mittelwert beträgt 187,93 und die Standardabweichung ist 22,27, so dass die Zlenge berechnet werden kann, wie unten gezeigt. Mit generieren und ersetzen können Sie - für Addition und Subtraktion, die Sie für Multiplikation und Division verwenden können, für Exponenten (z. B. length2) verwenden, mit denen Sie die Reihenfolge der Operationen () steuern können. Recoding neue Variablen mit generieren und ersetzen Angenommen, wir wollten mpg in drei Kategorien brechen. Lassen Sie uns eine Tabelle von mpg betrachten, um zu sehen, wo wir die Linien für solche Kategorien zeichnen konnten. Lets konvertieren mpg in drei Kategorien zu helfen, diese besser lesbar. Hier konvertieren wir mpg in drei Kategorien mit generieren und ersetzen. Mit Hilfe von tabulate können Sie überprüfen, ob das korrekt funktioniert hat. Tatsächlich können Sie sehen, dass ein Wert von 1 für mpg3 von 12-18 geht, ein Wert von 2 von 19-23 geht und ein Wert von 3 von 24-41 geht. Jetzt könnten wir mpg3 verwenden, um eine Kreuztabelle von mpg3 von fremden zu zeigen, um die Meilenzahl der fremden und heimischen Autos zu kontrastieren. Die oben dargestellte Kreuztabelle zeigt, dass 21 der heimischen Autos in die Kategorie der hohen Kilometer fallen, während 55 der ausländischen Autos in diese Kategorie passen. Recoding-Variablen mit recode Es gibt eine einfachere Möglichkeit, mpg zu drei Kategorien mithilfe von generieren und recode recode. Zuerst machen wir eine Kopie von mpg. Nennen es mpg3a. Dann verwenden wir recode, um mpg3a in drei Kategorien umzuwandeln: min-18 in 1, 19-23 in 2 und 24-max in 3. Lets doppelte Kontrolle, um zu sehen, dass dies korrekt funktionierte. Wir sehen, dass es einwandfrei funktionierte. Recodes mit if Lets erstellen eine Variable namens mpgfd, dass die Kilometerleistung der Autos in Bezug auf ihre Herkunft bewertet. Dies ist eine 01 Variable namens mpgfd, die: 0, wenn unter dem Median mpg für ihre Gruppe (foreigndomestic) 1, wenn oben auf der Median-mpg für ihre Gruppe (foreigndomestic). Wir sehen, dass der Median 19 für die inländischen (foreign0) Autos und 24.5 für die fremden (foreign1) Autos ist. Die generierten und recode Befehle unten recode mpg in mpgfd auf der Grundlage der inländischen Auto-Median für die heimischen Autos, und auf der Grundlage der ausländischen Auto-Median für die ausländischen Autos. Wir können mit diesem unten zu überprüfen, und der umcodierte Wert mpgfd sieht richtig. Erstellen Sie eine neue Variable lenft, die die Länge dividiert durch 12 ist. Ändern Sie die Werte einer vorhandenen Variablen namens lenft. Recode mpg in mpg3. Mit drei Kategorien mit generieren und ersetzen if. Recode mpg in mpg3a. Mit drei Kategorien, 1 2 3, mit generieren und recode. Recode mpg in mpgfd. Mit zwei Kategorien, aber mit verschiedenen Cutoffs für ausländische und inländische Autos. Der Inhalt dieser Website sollte nicht als eine Bestätigung für ein bestimmtes Website-, Buch - oder Softwareprodukt von der Universität von Kalifornien ausgelegt werden. SDLIM: Stata-Modul, um Variablen, die mit einer begrenzten Bewertungsskala gemessen wurden, zu skalieren Wenn Sie eine Korrektur anfordern, erwähnen Sie bitte Diese Elemente behandeln: RePEc: boc: bocode: s457182. Siehe allgemeine Informationen zur Korrektur von Material in RePEc. Für technische Fragen zu diesem Artikel oder zur Korrektur von Autoren, Titeln, Abstracts, Bibliographien oder Download-Informationen wenden Sie sich an: (Christopher F Baum) Wenn Sie diesen Artikel verfasst haben und noch nicht bei RePEc registriert sind, empfehlen wir Ihnen, es hier zu tun . Dadurch können Sie Ihr Profil mit diesem Element verknüpfen. Es erlaubt Ihnen auch, potenzielle Zitate zu diesem Punkt zu akzeptieren, dass wir uns unsicher sind. Wenn Referenzen vollständig fehlen, können Sie sie über dieses Formular hinzufügen. Wenn die vollständigen Referenzen ein Element auflisten, das in RePEc vorhanden ist, aber das System nicht mit ihm verknüpft ist, können Sie mit diesem Formular helfen. Wenn Sie über fehlende Elemente wissen, können Sie uns helfen, diese Links zu erstellen, indem Sie die relevanten Referenzen in der gleichen Weise wie oben hinzufügen. Wenn Sie ein registrierter Autor dieses Artikels sind, können Sie auch die Registerkarte Zitate in Ihrem Profil überprüfen, da es einige Zitate gibt, die auf die Bestätigung warten. Bitte beachten Sie, dass Korrekturen einige Wochen dauern können, um die verschiedenen RePEc-Dienste zu filtern. Mehr Dienste Folgen Serien, Zeitschriften, Autoren amp mehr Neue Papiere per E-Mail Neuzugänge zu RePEc abonnieren Autor-Registrierung Öffentliche Profile für Wirtschaftswissenschaftler Verschiedene Rankings der Forschung in Wirtschaftswissenschaften amp verwandte Bereiche Wer war ein Student von wem, mit RePEc RePEc Biblio Kuratierte Artikel amp Papiere zu verschiedenen Themen der Wirtschaftswissenschaften Hochladen Sie Ihr Papier auf RePEc und IDEAS aufgeführt werden EconAcademics Blog Aggregator für die Wirtschaft Forschung Plagiat Plagiate in Wirtschaftswissenschaften Job-Marktpapiere RePEc Arbeitspapierreihe auf dem Arbeitsmarkt Fantasy League Vorgeben Sie sind an der Spitze einer Volkswirtschaft Abteilung Services von den StL Fed Daten, Forschung, Anwendungen amp mehr aus dem St. Louis FedSDLIM: Stata-Modul, um Variablen, die mit einer begrenzten Bewertung Skala gemessen werden Wenn Sie eine Korrektur anfordern, erwähnen Sie bitte diese Elemente behandeln: RePEc: boc: bocode: s457182. Siehe allgemeine Informationen zur Korrektur von Material in RePEc. Für technische Fragen zu diesem Artikel oder zur Korrektur von Autoren, Titeln, Abstracts, Bibliographien oder Download-Informationen wenden Sie sich an: (Christopher F Baum) Wenn Sie diesen Artikel verfasst haben und noch nicht bei RePEc registriert sind, empfehlen wir Ihnen, es hier zu tun . Dadurch können Sie Ihr Profil mit diesem Element verknüpfen. Es erlaubt Ihnen auch, potenzielle Zitate zu diesem Punkt zu akzeptieren, dass wir uns unsicher sind. Wenn Referenzen vollständig fehlen, können Sie sie über dieses Formular hinzufügen. Wenn die vollständigen Referenzen ein Element auflisten, das in RePEc vorhanden ist, aber das System nicht mit ihm verknüpft ist, können Sie mit diesem Formular helfen. Wenn Sie über fehlende Elemente wissen, können Sie uns helfen, diese Links zu erstellen, indem Sie die relevanten Referenzen in der gleichen Weise wie oben hinzufügen. Wenn Sie ein registrierter Autor dieses Artikels sind, können Sie auch die Registerkarte Zitate in Ihrem Profil überprüfen, da es einige Zitate gibt, die auf die Bestätigung warten. Bitte beachten Sie, dass Korrekturen einige Wochen dauern können, um die verschiedenen RePEc-Dienste zu filtern. Mehr Dienste Folgen Serien, Zeitschriften, Autoren amp mehr Neue Papiere per E-Mail Neuzugänge zu RePEc abonnieren Autor-Registrierung Öffentliche Profile für Wirtschaftswissenschaftler Verschiedene Rankings der Forschung in Wirtschaftswissenschaften amp verwandte Bereiche Wer war ein Student von wem, mit RePEc RePEc Biblio Kuratierte Artikel amp Papiere zu verschiedenen Themen der Wirtschaftswissenschaften Hochladen Sie Ihr Papier auf RePEc und IDEAS aufgeführt werden EconAcademics Blog Aggregator für die Wirtschaft Forschung Plagiat Plagiate in Wirtschaftswissenschaften Job-Marktpapiere RePEc Arbeitspapierreihe auf dem Arbeitsmarkt Fantasy League Vorgeben Sie sind an der Spitze einer Volkswirtschaft Abteilung Services aus den StL Fed Data, Research, Apps verstärkt mehr aus dem St. Louis FedNOTICE: Die IDRE Statistical Consulting Group wird im Februar die Website auf das WordPress CMS migrieren, um die Wartung und die Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata FAQ Wie kann ich eine stückweise Regression in Stata Say, dass Sie die Beziehung zwischen, wie viel ein Kind spricht am Telefon und das Alter schauen Des Kindes. Sie erhalten eine Stichprobe von 200 Kindern und fragen sie, wie alt sie sind und wie viele Minuten verbringen sie reden am Telefon. Sie beginnen mit einem Scatterplot der Daten wie unten. Betrachten Sie dies sind Sie nicht glücklich mit der Nichtlinearität, die Sie in den Daten sehen, so versuchen, eine quadratische passen hinzuzufügen. Denken Sie darüber mehr, entscheiden Sie, dass Sie denken, dass die Menge an Zeit, die Kinder sprechen am Telefon ändert sich dramatisch im Alter von 14, und dass die Steigung könnte auch in diesem Alter zu ändern. Sie denken, dass eine stückweise Regression sinnvoller sein könnte, wo vor dem 14. Lebensjahr ein Intercept und ein linearer Hang vorhanden ist, und nach dem 14. Lebensjahr gibt es einen anderen Intercept und eine andere lineare Steigung, wie unten abgebildet mit nur freier Zeichnung dessen, Könnten zwei Regressionslinien aussehen. Versuchen Sie 1: Separate Regressionen Um dies zu untersuchen, können wir zwei getrennte Regressionen, eine für vor dem 14. und eine für das 14. Lebensjahr, durchführen. Wir können die Ergebnisse dieser beiden Modelle vergleichen. Beachten Sie, wie die Pisten für die beiden Gruppen ganz anders aussehen. Allerdings sind die Abschnitte dont viel Sinn machen, da sie die vorhergesagte Zeit sprechen am Telefon, wenn man 0 Jahre alt ist. Versuchen Sie 2: Getrennte Regression mit dem Alter zentriert bei 14 Lets retten (Mitte) Alter durch Subtraktion 14. Dann, wenn das Alter 0 ist, das bezieht sich wirklich auf 14 Jahre alt. Beachten Sie, wie die Pisten für die beiden Gruppen gleich geblieben sind, aber jetzt sind die Abschnitte (cons) die vorhergesagte Gesprächszeit mit 14 Jahren für die beiden Gruppen. Wir sehen, dass es im Alter von 14 Jahren nicht nur eine Änderung der Steigung (von 0,682 auf 3,62), sondern auch einen Sprung in der Abzweigung (von 17,6 auf 25,8) zu geben scheint. Dies deutet darauf hin, dass im Alter von 14, es gibt diskontinuierliche Sprung in der Zeit sprechen am Telefon sowie eine Änderung in der Steigung als auch. Allerdings ist dies nur suggestiv, sollten wir wirklich testen, diese in einem kombinierten Modell. Probieren Sie 3: Kombiniertes Modell, Kodierung für separate Steigung und Abzweigung Wir kombinieren nun die beiden Modelle zu einem einzigen Modell. Dazu müssen wir einige neue Variablen erstellen. Alter1 ist das Alter um das Alter 14 zentriert, aber umgewandelt in 0s nach Alter 14 (was die Wirkung des Alters für vor 14 Jahre alt). Alter2 ist das Alter um das Alter 14 zentriert, aber umgewandelt in 0s vor 14 (was die Wirkung des Alters für nach 14-Jährigen). Int1 ist 1 vor dem 14. Lebensjahr (was die Abschnitte für vor 14-Jährigen darstellt). Int2 ist 1 nach dem Alter von 14 Jahren (was die Abschnitte für nach 14-Jährigen darstellt). Das könnte verwirrend gewesen sein, so lassen Sie uns zeigen, was diese Variablen in einer Tabelle unten aussehen. Beachten Sie, dass wir eine fremde Person, die 13,9999 Jahre alt ist (sehr sehr nahe an 14, aber nicht ganz). Diese Person ist hilfreich für das Sehen der Wirkung des Sprungs von gehen von unter 14 bis zu 14. Jetzt sind wir bereit, unsere kombinierte Regression laufen. Wir verwenden die Option hascons, weil unser Modell eine implizierte Konstante int1 plus int2 hat, die zu 1 addiert. Durch die Einbeziehung dieser Option ist der Gesamttest des Modells angemessen und Stata versucht nicht, eine eigene Konstante einzuschließen. Nun können die vorhergesagten Werte erhalten werden (siehe nachstehende Tabelle) und diese mit der Bedeutung der obigen Koeffizienten in Beziehung setzen. Alter1 ist die Steigung, wenn das Alter unter 14 liegt. Wenn Sie beispielsweise im Alter von 5 bis 6 Jahren reden, reicht das Telefonieren von 11.48 bis 12.17 und das entspricht .68 (mit Rundung). Alter2 ist die Steigung, wenn Alter 14 oder höher ist. Zum Beispiel, wenn Sie von 15 bis 16 Jahre alt sind, geht das Telefonieren von 29,46 auf 33,09 und das entspricht 3,62 (mit Rundung). Int1 ist das vorhergesagte Mittel für jemanden, der gerade unendlich nahe ist, 14 Jahre alt zu sein (aber nicht ganz 14). Beachten Sie, dass, wenn jemand 13,9999 ihre vorhergesagte Mittel ist das gleiche wie int1. Int2 ist das vorhergesagte Mittel für jemanden, der gerade erst 14 Jahre alt geworden ist, und beachten Sie, dass 25.83 der Wert für int2 ist und der Wert für den vorhergesagten Wert mit genau dem Alter von 14 ist. Hier machen wir ein Diagramm der Ergebnisse. Vielleicht möchten Sie testen, ob der Unterschied in den Abschnitten 0 ist, so können wir dies unten tun. In der Tat, wie Sie 14 Jahre alt drehen, haben Sie einen quotjumpquot in der Zeit, die Sie am Telefon sprechen, um 8,2 Minuten. Sie können auch testen, ob die Pisten unterschiedlich sind. Die Steigung nach 14 ist um 2,94 größer, und diese Differenz (2,94) unterscheidet sich signifikant von 0.Try 4: Alternative Codierung, Codierung, um Abzweigung und Steilheit zu vergleichen Dies ist eine andere Möglichkeit, dieses Modell zu codieren. Beachten Sie, dass wir Alter14 und Alter2 für die beiden Begriffe für Alter und Cons und int2 für die Intercept-Werte darstellen. Mit dieser Codierung stellen age2 und int2 die Änderung von weniger als 14 bis 14 und älter dar. Unter Verwendung dieses Codierungsschemas ist hier die Bedeutung der Koeffizienten. Alter14 ist die Steigung, wenn das Alter weniger als 14. Alter2 ist die Änderung in der Steigung als Folge des Werdens Alter 14 oder höher (im Vergleich zu weniger als 14). Beachten Sie, wie dieser Wert von 2,94 entspricht dem lincom-Befehl über dem Vergleich der Steigung für nach 14 bis die Steigung vor 14. Nachteile ist die vorhergesagte Mittel für jemanden, der gerade unendlich nah an 14 Jahre alt ist (aber nicht ganz 14). Int2 ist das vorhergesagte Mittel für jemanden, der gerade erst 14 Jahre alt geworden ist, abzüglich des vorhergesagten Mittelwerts für jemanden, der unendlich nahe ist, 14 Jahre alt zu sein (der Sprung, der im Alter von 14 Jahren auftritt). Beachten Sie, wie dies dem Ergebnis des lincom-Befehls über dem Ergebnis der Differenz in den Abschnitten entspricht. Wie Sie sehen können, konzentrieren sich die Koeffizienten für age2 und int2 nun auf die Veränderung, die sich aus dem Werden von 14 Jahren ergibt. Wir berechnen die vorhergesagten Werte yhat2. Beachten Sie, dass die vorhergesagten Werte für dieses Modell und für das vorhergehende Modell dieselben sind, da die Modelle im Wesentlichen dieselben sind, werden sie nur anders parametrisiert. Versuchen Sie 5: Verwenden von mkspline und erhalten separate Steigung Kodierung Stata hat einen sehr schönen Komfort Befehl für diese Arten von Modellen namens mkspline. Im folgenden verwenden wir den Befehl, um die Variablen xage1 (Alter vor 14) und xage2 (Alter nach 14) zu erstellen. Wir zeigen dann die Codierung unten. Wir führen dann die Regression unten. Beachten Sie, dass der Effekt für xage1 die Steigung vor dem Alter von 14 ist und xage2 die Steigung nach dem Alter von 14 ist. Der Begriff int2 entspricht dem Sprung in den Regressionsgeraden bei Alter 14. Der Wert für cons ist der vorhergesagte Betrag des Sprechens für jemanden, der Ist null Jahre alt. Versuchen Sie 6: Verwenden von mkspline und erhalten Codierung zu vergleichen Pisten Wir wiederholen die gleichen Befehle von oben, aber verwenden Sie die marginale Option auf den Befehl mkspline und erstellen Sie diesmal Variablen mit dem Namen yage1 und yage2. Die Codierung ist unten gezeigt. Beachten Sie, dass alle Koeffizienten die gleichen sind wie das letzte Modell, mit Ausnahme von yage2. Dieser Koeffizient ist nun die Änderung in der Steigung von nach dem Alter von 14 bis vor dem Alter von 14 (d. h. 3,62 - 0,68 2,94). In dieser Weise codiert, yage2 Tests für Unterschiede in den Pisten. Diese kurze FAQ verglichen verschiedene Möglichkeiten, um stückweise Regressionsmodelle zu erstellen. Alle diese Modelle sind äquivalent, da der Gesamttest des Modells genau derselbe ist (immer F (3, 196) 210.66) und alle die exakten vorhergesagten Werte erzeugen. Die Unterschiede in der Parametrisierung sind lediglich eine Reskrambling der Abschnitte und Neigungen für die beiden Segmente des Regressionsmodells. Sie können die Codierungsstrategie wählen, die Ihnen am besten gefällt, aber beachten Sie, dass Sie lincom verwenden können, um Koeffizienten zu kombinieren oder zu vergleichen, um Vergleiche zu bilden, die im ursprünglichen Modell nicht vorhanden waren. Während der Befehl mkspline sehr praktisch ist, können einige die manuellen Codierungsschemata, die wir aufgrund der Interpretation, die sie in Bezug auf die Intercept-Termini darstellen, darstellen, bevorzugen. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.

No comments:

Post a Comment