Organisieren und Visualisieren von Variablen

(Mradul Dwivedi) (25. Dezember 2020)

Business Case: Sie wurden gebeten, Daten zu einigen Pensionsfonds auf diese Weise zu definieren, zu sammeln, zu organisieren und zu visualisieren könnte potenziellen Kunden dabei helfen, Entscheidungen über die Fonds zu treffen, in die sie investieren.

Daten: Sie 361 Pensionsfonds zur Analyse erhalten

Beginn: Sie definieren zunächst Variablen für Schlüsselmerkmale von Jeder Fonds, z. B. die Wertentwicklung jedes Fonds in der Vergangenheit, die Höhe des von einem Fonds verwalteten Vermögens und die Frage, ob das Ziel des Fonds darin besteht, in Unternehmen zu investieren, deren Erträge in Zukunft voraussichtlich erheblich wachsen werden (Wachstumsfonds), oder in Unternehmen zu investieren, deren Aktienkurs ist unterbewertet (Value Fund).

Sie coll ect Daten aus Quellen und organisieren Daten. Es wäre keine so gute Idee, einem Kunden ein Blatt mit 361 Zeilen zu zeigen. Sie möchten nun die Daten zusammenfassen und Erkenntnisse gewinnen, um dem Kunden zu helfen, eine fundierte Entscheidung zu treffen.

Dieser Artikel enthält nicht viel Material zum Lesen. Es enthält nur die Schlüsselwörter, damit Sie die Google-Suche nach nicht vertrauten Elementen durchführen können.

Foto von Clay Banks auf Unsplash

Organisieren kategorialer Variablen:

Die Übersichtstabelle:

Hilft bei der Anzeige einer aggregierten Ansicht jeder Kategorie in Prozent oder Häufigkeit oder Menge.

Die Kontingenztabelle:

Kreuztabellenwerte von 2 oder mehr kategorialen Variablen in Prozent der Zeilensumme, des Prozentsatzes der Spaltensumme, des Prozentsatzes der Gesamtsumme, der Häufigkeit oder des Betrags.

Organisieren numerischer Variablen:

Das geordnete Array:

Ordnen Sie numerische Daten in aufsteigender oder absteigender Reihenfolge an.

Die Häufigkeitsverteilung:

Satz numerisch geordneter Klassen, jede Klasse Die Gruppe hat ein Klassenintervall mit einem sich gegenseitig ausschließenden Wertebereich.

Die Summe der Frequenzspalten muss immer der Anzahl der Werte entsprechen.

Klassengrenzen und Klassenmittelpunkte.

Intervallbreite = (höchster Wert – niedrigster Wert) / (Anzahl der Klassen)

Die relative Häufigkeitsverteilung und die prozentuale Verteilung:

Wenn Sie zwei oder mehr Gruppen vergleichen, ist es nützlicher, den Anteil der Gesamtzahl für jede Gruppe zu kennen, als die Häufigkeit jeder Gruppe zu kennen.

Anteil = relative Häufigkeit = (Anzahl der Werte in jeder Klasse ) / (Gesamtzahl der Werte)

Die kumulative Verteilung:

Dies ist die laufende Summe jeder vorhergehenden Unterklasse und Klasse.

Visualisierung kategorialer Variablen:

Balkendiagramm

Kreisdiagramm

Paretodiagramm

Balkendiagramm nebeneinander

Visualisierung numerischer Variablen:

Stamm-Blatt-Anzeige

Histogramm

Prozentuales Polygon

Kumulativer Prozentsatz ge Polygon

Visualisierung von zwei numerischen Variablen:

Streudiagramm

Zeitreihendiagramm

Organisieren und Visualisieren einer Reihe von Variablen:

Mehrdimensionale Kontingenztabelle

Datenermittlung