Monday 17 April 2017

Rescaling Daten In Stata Forex

Willkommen im Institut für digitale Forschung und Bildung Stata FAQ Wie kann ich kontinuierliche Variablen in Gruppen umkodieren Es kann vorkommen, dass Sie eine kontinuierliche Variable in Gruppen umwandeln möchten. Sie können z. B. einen kontinuierlichen Lesefaktor zwischen 0 und 100 in 3 Gruppen (z. B. niedrig, mittel und hoch) umwandeln. Sie können egen mit der Funktion cut () verwenden, um dies schnell und einfach durchzuführen, wie unten dargestellt. Wir veranschaulichen dies mit der Datei hsb2 mit einer Variablen namens write, die von 31 bis 67 reicht. Wir können egen mit der Funktion cut () verwenden, um eine Variable namens writecat zu erstellen, die die Variable write in die folgenden 4 Kategorien gruppiert. 30 bis 40 40 bis 50 40 Bis zu (aber nicht eingeschlossen) 60 60 bis (aber nicht eingeschlossen) 70 Der folgende Tabellenbefehl wird verwendet, um zu überprüfen, ob die Daten als gruppiert sind wir erwarteten. Wir können sehen, dass, wenn writecat in der niedrigsten Kategorie (30) ist, die Bereiche von 31 bis 39 schreiben, und so weiter, wie wir erwarten, z. B. Die Werte, wenn writecat in Kategorie 30 ist, entsprechen dem Schreiben mit Werten von 30 bis (aber nicht enthalten) 40. Hier verwenden wir den gleichen Befehl, aber unsere letzte Kategorie ist von 50 bis 60. Wie Sie sehen, erzeugt es einen fehlenden Wert, weil Gibt es eine Anzahl von Werten, die 60 oder höher und somit außerhalb des angegebenen Bereichs liegen. Dies zeigt, dass Werte, die außerhalb des von Ihnen angegebenen Bereichs liegen, mit einem fehlenden Wert vergeben werden. Wenn wir die Option icodes verwenden, erzeugt cut () ganzzahlige Codes 0, 1, 2 und so weiter. Im folgenden Beispiel sehen Sie, dass es die Codes 0, 1, 2 und 3 erstellt hat. Wenn Sie die Beschriftungsoption (die automatisch impliziert, dass icode) verwendet, erzeugt sie ganzzahlige Werte wie oben. Wie Sie unten sehen, ist die Variable writecat4 mit 30- 40- 50- und 60- bezeichnet. Wir verwenden die Option nolabel, um die Anzeige der Wertbeschriftungen zu unterdrücken und Sie können sehen, dass die Variable wirklich 0, 1, 2 und 3 codiert ist. Wenn Sie es vorziehen, können Sie cut () fragen, um die Cutoffs zu bilden, um Gruppen mit ungefähr zu bilden Die gleiche Zahl pro Gruppe. Im Folgenden bitten wir um die Erstellung von 4 (grob) gleichgroßen Gruppen. Weitere Informationen finden Sie im Hilfe - oder Referenzhandbuch zu egen. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, Buch oder Software-Produkt von der Universität von Kalifornien ausgelegt werden. Willkommen für das Institut für digitale Forschung und Bildung Stata FAQ Wie kann ich standardisieren Variablen in Stata Eine standardisierte Variable (manchmal auch als z-Score oder als Standardwert bezeichnet) ist eine Variable, die mit einem Mittelwert von Null und einer Standardabweichung von 1 neu skaliert wurde. Für eine standardisierte Variable gibt jeder Wert auf der standardisierten Variablen den Unterschied zum Mittelwert der ursprünglichen Variablen in der Anzahl der Standardabweichungen (der ursprünglichen Variablen) an. Zum Beispiel zeigt ein Wert von 0,5 an, dass der Wert für diesen Fall eine halbe Standardabweichung über dem Mittelwert ist, während ein Wert von -2 angibt, dass ein Fall einen Wert mit zwei Standardabweichungen aufweist, die niedriger als der Mittelwert sind. Variablen sind aus einer Vielzahl von Gründen standardisiert, um z. B. sicherzustellen, dass alle Variablen gleichmäßig zu einer Skala beitragen, wenn Elemente addiert werden, oder um es einfacher zu machen, Ergebnisse einer Regression oder einer anderen Analyse zu interpretieren. Die Standardisierung einer Variablen ist ein relativ einfaches Verfahren. Zuerst wird der Mittelwert von dem Wert für jeden Fall subtrahiert, was zu einem Mittelwert von Null führt. Dann wird die Differenz zwischen dem Punktwert und dem Mittelwert durch die Standardabweichung dividiert, was zu einer Standardabweichung von eins führt. Wenn wir mit einer Variablen x beginnen. Und erzeugen eine Variable x. Das Verfahren ist: wobei m der Mittelwert von x ist. Und sd die Standardabweichung von x ist. Um den Prozess der Standardisierung zu veranschaulichen, verwenden wir die High School und Beyond Datenmenge (hsb2). Wir erstellen standardisierte Versionen von drei Variablen, Mathematik. Wissenschaft. Und soz. Diese Variablen enthalten Schüler Punkte auf Tests der Kenntnisse der Mathematik (Mathematik), Wissenschaft (Wissenschaft), Sozialstudien (socst). Zuerst verwenden wir den Summarize-Befehl (abgekürzt als Summe unten), um die Mittelwert - und Standardabweichung für jede Variable zu erhalten. Der Mittelwert der Mathematik ist 52.645, und seine Standardabweichung ist 9.368448. Basierend auf diesen Informationen können wir eine standardisierte Version von Mathematik mit dem Namen z1math generieren. Der Code unten führt dies mit dem Generierungsbefehl (abgekürzt für Gen) aus und verwendet dann zusammenfassen, um zu bestätigen, dass der Mittelwert von z1math sehr nahe bei Null liegt (aufgrund eines Rundungsfehlers ist der Mittelwert einer standardisierten Variablen selten genau 0) und Die Standardabweichung ist eins. Unten tun wir dasselbe für Wissenschaft und Gesellschaft. Erstellen von zwei neuen Variablen, z1science und z1socst. Wobei ihre jeweiligen Mittel und Standardabweichungen aus der ersten Tabelle der Zusammenfassungsstatistiken entnommen wurden. Die nachstehende Tabelle der Zusammenfassungsstatistiken zeigt, daß beide Variablen tatsächlich standardisiert sind. Die Standardisierung von Variablen ist nicht schwierig, aber um diesen Vorgang einfacher und weniger fehleranfällig zu machen, können Sie mit dem Befehl egen standardisierte Variablen erstellen. Die folgenden Befehle vereinheitlichen die Werte von math. Wissenschaft. Und soz. Erstellen von drei neuen Variablen, z2math. Z2science. Und z2socst. Wiederum können wir eine Tabelle mit zusammenfassenden Statistiken ansehen, um zu bestätigen, dass diese Variablen standardisiert sind. Beachten Sie, dass die Mittel nicht genau Null sind, noch passen sie mit den Mitteln aus dem Satz von standardisierten Variablen, die oben mit dem Generierungsbefehl erstellt wurden. In beiden Fällen ist dies auf einen sehr geringen Rundungsfehler zurückzuführen. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.


No comments:

Post a Comment