A Tableau Prep bemutatása

A Tableau Prep egy vizuális adatelőkészítő eszköz. Az adatok tisztítását és átalakítását drag&drop működés és egy-kattintásos funkciók tárháza könnyíti egy interaktív és minden tekintetben a folyamatot támogató felületen.

Az adatelőkészítési folyamat akadálytalan működését a beépített elemek támogatják, mint a pivotálás, aggregálás, szűrés vagy éppen a ’srting’-ek automatikus szétvágása. A cél az, hogy a Tableau Desktop számra könnyen emészthető adatforrást állítsunk elő – lehetőleg egy rendezett táblát, aminek a soraiban az elemek, oszlopaiban pedig azok a dimenziók szerepelnek, amik szerint majd elemezni akarunk, minél kevesebb hiányzó adattal, és minél egységesebb formában.

A Tableau Prep képes ezt előállítani nekünk akár egyetlen sor kód megírása nélkül. Nem azért fontos ez, mert nem tudnánk megírni a kódokat, hanem azért, mert ezzel időt spórolunk, amit utána a fő célunkra – az információ kinyerésére, az elemzésre fordíthatunk.

Lássuk működés közben.

Az első feladat, hogy kapcsolódjunk az adatokhoz.

A Tableau Desktop-nál már megszokott módon a bal oldalon találjuk az adatokhoz való kapcsolódás lehetőségét. A kapcsolódás után az adatforrásban levő táblák vagy sheet-ek megjelennek a felületen, és innen a vászonra húzva őket már meg is tettük az első lépést az adatelőkészítési folyamatunkban.

1_connect_to_data
– kapcsolódás az adatokhoz –

Ez a felület a [flow pane] – én úgy hívom magyarul, hogy az adatelőkészítés folyamatábrája – azért, mert egy részletes, mégis könnyen áttekinthető folyamatábráról van szó, ami az adatelőkészítés lépéseit tartalmazza. Ezeket a lépéseket akár el is nevezhetjük, hogy egy pontos és teljes listát kapjunk az elvégzendő lépésekről.

2_drag_file_to_flow– táblák/sheet-ek felhasználása – 

Az első táblát/sheet-et a ’flow pane’-re húzva kiválaszthatjuk, hogy csak ezzel az elemmel szeretnénk dolgozni, vagy az adatforrásból érkező összes komponenst fel akarjuk használni. A jobb alsó részen pedig láthatjuk a mezőket, amiket be akarunk emelni az adott táblákból, és kiválaszthatjuk közülük a valóban szükségeseket, hogy csak azokkal dolgozzunk tovább. Mielőtt továbbmennénk, nevezzük el az új elemünket.

3_connect_to_table
– táblák/sheet-ek felhasználása – 

Rendben, eddig megvagyunk.

Most lássunk hozzá az adat-előkészítéshez.

4_add_stepA beemelt táblánk jobb oldalán levő ’+’ jelre kattintva megannyi lehetőség közül választhatunk, maradjunk most annál, hogy „hozzáadunk egy lépést”. Ez a „lépés” jelent mindent, ami a lenyíló listában nem volt felsorolva. Miután hozzáadtuk, a felületen egy ’clean1’ elnevezésű elem jelenik meg, a vászon alsó részén pedig láthatunk egy összefoglalót az adatainkról, ami segít megtalálnunk, hogy hogyan is folytassuk a tisztítást. Ez a [profile pane] egy összefoglaló nézet az adatok összetételérről – hívhatnám az adatok profiljának is.

5_profile_pane
– profile pane – 

A felületnek ez a része semmilyen más adatelemző/előkészítő eszközben nem található meg. Egyedi és zseniális ötlet, mert abszolút interaktív és tökéletesen támogatja a szélsőértékek, adathibák, hiányos adatok, vagy épp a saját adatelőkészítés során elkövetett tévedéseink azonnali megtalálását – ami minden adattisztítási feladatot meggyorsít és pontosabbá tesz.


 Ha szívesen olvasnál hasonlókat rendszeresen,
iratkozz fel HÍRLEVELünkre 


Ezen a területen minden mezőhöz tartozik egy kártya, amin a mezőhöz tartozó adatok eloszlása és gyakorisága jelenik meg. Adott értékre kattintva megnézhetjük, hogy hol és hogyan szerepel ehhez kapcsolódó adat a többi kártyán és rászűrhetünk a konkrétan ide tartozó sorokra a [data grid]-en, egy részletes nézet a sor szintű adatokkal – pont mintha egy Excel táblában néznénk az elkészült eredményt.

6_panes
– a Tableau Prep részei – 

Természetesen mindhárom terület szorosan összekapcsolódik, és a végrehajtott adatmanipulációk hatása mindegyiken aktuálisan látható.

De térjünk vissza az adattisztításhoz.

Nézzük meg az ’Info’ mezőt kicsit közelebbről (például ebben segít nekünk a data grid nézet). Egy szöveget találunk, ami többféle elválasztóval van tagolva: a cím és az író között függőleges vonal, ugyanez választja el az ártól az ISBN kódot, az összeg előtt viszont $ jelet találunk, de semmi egyéb elválasztót. A Tableau Prep készítőinek határozott célja volt, hogy az ilyen rendszeresen előforduló esetekre kész megoldásokkal álljanak elő – ezzel időt spórolva nekünk.

7_spit

A kártyára kattintva a jobb felső sarkában megjelenik a Desktop-ból már jól ismert lenyíló menü. Itt a Split Values/Automatic Split lehetőséget választva pontosan az fog történni, amit szeretnénk. Ha mégsem ez lett volna az eredmény, a visszavonás gomb itt is rendelkezésre áll, hogy visszamehessünk oda, amikor még minden a terv szerint ment. Most pedig, hogy kész a szétvágás, átnevezhetjük az oszlopainkat tetszés szerint (figyeljük meg, hogy a Prep-nek arra is volt gondja, hogy az „ISBN:” szövegeket is levágja a kódok elől). Az Ár mező most szöveg típusú, de ahhoz, hogy használni tudjuk, számmá kell alakítanunk. A jólismert módszerrel az adattípus jelére kattintva megváltoztathatjuk azt.

Most, hogy a tisztítási lépésen belül végeztünk valamit, a profile pane bal oldalán a changes felirat mellett elkezdtek növekedni a számok. Ezt a felületrészt kinyitva megnézhetjük az összes változtatásunkat lépésről lépésre. Ezek csak ikonként kerülnek fel e flow pane-re, hogy az átláthatóság mindvégig megmaradjon. Minden clean lépés ilyen alábontásokat takar.

8_changes_on_profilepane
 – az adattisztítás lépésben elvégzett műveletek listája –

Menjünk tovább!

Adjunk az eddigiekhez új adatforrásokat!

Ennek a menete ugyanaz lesz, mint az első fájl estében: a bal oldalon kiválasztjuk a forrást, amihez kapcsolódni szeretnénk és a megjelenő táblák közül a flow pane-re húzzuk azt, amit használni szeretnénk (a megfelelő feltételt választva, az összes a megjelölt forrásban talált tábát/sheet-et beimportálhatjuk – wildcard union).

9_unionAhhoz, hogy a két adatforrásunkat összekapcsoljuk, nem kell mást tennünk, csak az egyiket a másikra húzva megjelenő join és union lehetőségek közül kiválasztani a megfelelőt. Ebben az esetben a két táblánk oszlop-struktúrája megegyezik, és a célunk a különböző hetek adatainak összefésülése, így a union-t választjuk.

A profile pane-en ellenőrizhetjük, hogy az összefésülés rendben ment-e. Ha esetleg vannak olyan oszlopok, amik a fejléc alapján nem feleltethetők meg egymásnak, ezeket külön meg fogjuk találni és egy mozdulattal a helyükre illeszthetjük őket.

10_union_details
– adatforrások összekapcsolása –

Most jöhet egy kis átalakítás:

tegyük a már elkészített adattisztítási fázist a megfelelő helyre a flow-ban!

11_step_order

Ehhez nem kell mást tennünk, mint ezt a lépést elválasztani a jenlegi forrásától, és megadni neki az új megelőző lépést: ez esetben a union-t. Ehhez húzzuk a union lépést a tisztítási lépésünkre s válasszuk a megjelenő Add lehetőséget a bal oldalon. Minden lépés elé beszúrhatunk újabbakat ezzel a drag&drop módszerrel, de esetenként ehhez szükség van a lépés függetlenítésére (ahogy itt) is.

A végeredmény pedig:

Most, hogy előkészítettük az adatainkat, adjunk a flow-hoz egy kimeneti lépést így:
                      + output step ▼

12_add_output

Majd beállíthatjuk, hogy milyen formátumban szeretnénk elmenteni az újonnan elkészített adatforrásunkat és hová kerüljön ez a fájl.  ▼

13_output

 

 

Akár a Tableau Online/Server felületre is publikálhatunk közvetlenül, hogy a munkatársaink is fel tudják használni ezt a megtisztított, előkészített adathalmazt. A futtatás után elkészül az új forrás.

 

Természetesen a műveleteinket is elmenthetjük a fájl menüpontban, hogy később szerkeszthessük vagy újra futtathassuk.

Összefoglalva

Mint látjátok a Tableau Prep-ben nagyon sokféle lépésen keresztül tudjuk vezetni az adatainkat, amíg eléjük az elvárt struktúrát. Szinte mindenre találunk egyszerű és gyors megoldást, de ha valami mást szeretnénk, saját kalkulációkat is készíthetünk. A flow felület könnyű áttekinthetősége miatt mindig tudjuk, hogy hol tartunk éppen, a profile pane pedig folyamatosan tájékoztat arról, hogy a megtett lépéseink milyen következménnyel járnak, így magabiztosan haladhatunk a végeredmény felé. Az elkészített új adatforrást pedig egyszerűen menthetjük vagy megoszthatjuk másokkal, hogy közös alapokról kezdjük az elemzéseket.

Akinek megtetszett és kipróbálná: Tableau Prep

Aki pedig a többi Tableau termékről is olvasna: Tableau Online, Tableau Server| Tableau Desktop

Aki pedig képezné magát a témában: Tableau alapok tanfolyam


KAPCSOLÓDÓ TARTALMAK

abacus-1866497_1920    A TABLEAU – ÁLTALÁNOS ÁTTEKINTÉS

connect-to-data-04-eloqua   TABLEAU 2018.1 RELEASE

Capture  TABLEAU DESKTOP BEMUTATÁSA

Névtelen terv  TABLEAU ONLINE/ SERVER BEMUTATÁSA

2018. október 1-3.   TABLEAU ALAPOK TANFOLYAM

colorful-concentration-cube-54101   ADATELŐKÉSZÍTÉS – BEST PRACTICES

agriculture-315510_1280  6-LÉPÉSES KÉZIKÖNYV AZ ADATTISZTÍTÁSHOZ

 

 

 

Advertisements

5 thoughts on “A Tableau Prep bemutatása

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s