Organizzazione e visualizzazione di variabili

(Mradul Dwivedi) (25 dicembre 2020)

Caso aziendale: Ti è stato chiesto di definire, raccogliere, organizzare e visualizzare i dati su alcuni fondi pensione in modi che potrebbe aiutare i potenziali clienti a prendere decisioni sui fondi in cui investire.

Dati: Tu sono stati forniti 361 fondi pensione da analizzare

Inizio: Si inizia definendo le variabili per le caratteristiche chiave di ogni fondo, come la performance passata di ogni fondo, lammontare delle attività che un fondo gestisce e se lobiettivo del fondo è investire in società i cui guadagni dovrebbero crescere sostanzialmente in futuro (fondo di crescita) o investire in società i cui il prezzo delle azioni è sottovalutato (value fund).

You coll ect dati da fonti e organizzare i dati. Ora, mostrare un foglio di 361 righe a un cliente non sarebbe una buona idea. Quindi, vorresti ora riassumere i dati e portare fuori approfondimenti per aiutare il cliente a prendere una decisione informata.

Questo articolo non contiene molto materiale su cui leggere. Contiene solo le parole chiave in modo da poter cercare su Google non familiari.

Foto di Clay Banks su Unsplash

Organizzazione delle variabili categoriali:

La tabella di riepilogo:

Aiuta a vedere una vista aggregata di ciascuna categoria in termini di percentuale, frequenze o importo.

La tabella di contingenza:

Tabella incrociata dei valori di 2 o più variabili categoriali in termini di percentuale del totale della riga, percentuale del totale della colonna, percentuale del totale complessivo, frequenze o importo.

Organizzazione delle variabili numeriche:

La matrice ordinata:

Disporre i dati numerici in ordine crescente o decrescente.

La distribuzione della frequenza:

Insieme di classi ordinate numericamente, ciascuna classe gruppo ha un intervallo di classe con un intervallo di valori che si escludono a vicenda.

Il totale della colonna di frequenza deve sempre essere uguale al numero di valori.

Limiti di classe e punti medi di classe.

Larghezza intervallo = (valore più alto – valore più basso) / (numero di classi)

La distribuzione della frequenza relativa e la distribuzione percentuale:

Quando confronti due o più gruppi, conoscere la proporzione del totale per ogni gruppo è più utile che conoscere la frequenza di ogni gruppo.

Proporzione = frequenza relativa = (numero di valori in ogni classe ) / (numero totale di valori)

La distribuzione cumulativa:

È il totale parziale di ogni sottoclasse e classe precedente.

Visualizzazione delle variabili categoriali:

Grafico a barre

Grafico a torta

Grafico di Pareto

Grafico a barre affiancato

Visualizzazione di variabili numeriche:

Visualizzazione stem-and-leaf

Istogramma

Poligono percentuale

Percenta cumulativa ge Polygon

Visualizzazione di due variabili numeriche:

Grafico a dispersione

Grafico di serie temporali

Organizzazione e visualizzazione di un insieme di variabili:

Tabella di contingenza multidimensionale

Data Discovery