Organizace a vizualizace proměnných

(Mradul Dwivedi) (25. prosince 2020)

Obchodní případ: Byli jste požádáni, abyste definovali, shromažďovali, organizovali a vizualizovali údaje o některých penzijních fondech způsobem, který může potenciálním klientům pomoci při rozhodování o fondech, do kterých budou investovat.

Data: Vy dostali 361 penzijních fondů k analýze

Začátek: Začnete definováním proměnných pro klíčové charakteristiky každý fond, jako je minulá výkonnost každého fondu, výše aktiv, která fond spravuje, a to, zda je cílem fondu investovat do společností, u nichž se očekává, že v budoucnu podstatně porostou (zisky), nebo investovat do společností, cena akcií je podhodnocena (hodnotový fond).

Sb ect data ze zdrojů a organizovat data. Ukázat klientovi list 361 řádků by teď nebyl tak dobrý nápad. Nyní byste tedy chtěli shrnout data a získat poznatky, které klientovi pomohou učinit informované rozhodnutí.

Tento článek neobsahuje mnoho materiálu ke čtení. Obsahuje pouze klíčová slova, takže lze vyhledávat na Googlu neznámé.

Fotografie Clay Banks na Unsplash

Organizace kategoriálních proměnných:

Souhrnná tabulka:

Pomáhá zobrazit agregované zobrazení každé kategorie z hlediska procenta, četnosti nebo množství.

Kontingenční tabulka:

Křížové tabulky obsahují hodnoty 2 nebo více kategorických proměnných, pokud jde o procento z celkového počtu řádků, procento z celkového počtu sloupců, procento z celkového součtu, četnosti nebo množství. p>

Uspořádání číselných proměnných:

Uspořádané pole:

Uspořádejte číselná data ve vzestupném nebo sestupném pořadí.

Distribuce frekvence:

Sada číselně seřazených tříd, každá třída skupina má interval třídy se vzájemně se vylučujícím rozsahem hodnot.

Součet sloupce frekvence se musí vždy rovnat počtu hodnot.

Hranice třídy a střední body třídy.

Šířka intervalu = (nejvyšší hodnota – nejnižší hodnota) / (počet tříd)

Relativní distribuce frekvence a procentuální distribuce:

Když porovnáváte dvě nebo více skupin, znát podíl celkového počtu pro každou skupinu je užitečnější než znát frekvenci každé skupiny.

Proporce = relativní frekvence = (počet hodnot v každé třídě ) / (celkový počet hodnot)

Kumulativní distribuce:

Je to průběžný součet každé podtřídy a třídy před ní.

Vizualizace kategorických proměnných:

Sloupcový graf

Výsečový graf

Paretův graf

Sloupcový graf vedle sebe

Vizualizace číselných proměnných:

Zobrazení kmenových listů

Histogram

Procentuální polygon

Kumulativní procenta ge Polygon

Vizualizace dvou numerických proměnných:

Bodový graf

Graf časové řady

Organizace a vizualizace sady proměnných:

Multidimenzionální kontingenční tabulka

Zjišťování údajů