Čo sú štruktúrované dáta a ako ich analyzovať? Aké programy sú najvhodnejšie pre správnu analýzu dát?
Čo sú štruktúrované dáta?
So štruktúrovanými dátami sa už pravdepodobne stretla každá firma. Hovoríme o nich ako o štruktúrovaných, pokiaľ sú organizované v klasickej tabuľkovej štruktúre, čiže vo forme riadkov, stĺpcov a vzájomných vzťahov medzi tabuľkami. Sú definované tzv. syntaktickými pravidlami a je ich možné spracovať automatizovane. Každá firma by sa mala snažiť získať poznatky zo svojich štruktúrovaných dát, ktoré predstavujú základ dátovej analýzy. Ide napríklad o informácie týkajúce sa zákazníkov, dodávateľov, účtovníctva, geolokácie alebo predajov.
Práca so štruktúrovanými dátami v Exceli
Excel je vo väčšine firiem stále najdôležitejším nástrojom na prácu so štruktúrovanými dátami, mnohí nedajú dopustiť na tento, dnes už doslova legendárny, tabuľkový program od Microsoftu, ktorý je jedným z vôbec najpoužívanejších softvérov na svete. Ako takmer každý nástroj, aj Excel má svoje pozitívne a negatívne stránky, ktoré sa navyše časom môžu meniť.
Výhody Excelu:
- vysoká poznateľnosť (s Excelom vie pracovať prakticky každé oddelenie vo firme),
- relatívne jednoduché získanie nového zamestnanca, ktorý program ovláda,
- cenová dostupnosť.
Nevýhody Excelu:
- limit na množstvo spracovávaných dát,
- pomalý výkon pri vyšších objemoch dát,
- časová náročnosť čistenia dát a komplikovanejších analýz,
- obmedzené možnosti automatizácie,
- zvýšená chybovosť pri manuálnej práci s dátami.
Excel je síce lacný nástroj, ale náročný na prácnosť
Niektoré zo spomínaných nedostatkov síce čiastočne eliminujú vyššie verzie Excelu s doplnkami PowerQuery a PowerPivot alebo databázový nástroj Microsoft Access, ani tieto programy však nedokážu plnohodnotne podporovať dátovú analytiku. Excel je síce na prvý pohľad lacným riešením, no v konečnom dôsledku môže byť pre firmu tou nákladnejšou alternatívou z dôvodu nárokov na vyššiu prácnosť, a teda čas zamestnancov. Ani výstupy nevyzerajú uspokojivo v porovnaní s modernými softvérovými nástrojmi.
Prácu so štruktúrovanými dátami uľahčujú softvéry pre biznis inteligenciu
Softvéry pre biznis inteligenciu, možno známejšie pod anglických názvom self-service business intelligence, umožňujú dátovú analytiku na podstatne vyššej úrovni ako Excel, stále však bez nevyhnutnej podpory drahých zdrojov z IT oddelenia. Ide o riešenia, pomocou ktorých sa biznisovo orientovaní zamestnanci spoločnosti dokážu dostať rýchlo a pomerne jednoducho ku väčšine dát vo firme, a to v užívateľsky mimoriadne prívetivej forme.
Týmito softvérmi dokážete ľahko prepojiť dáta z množstva rôznych zdrojov, či už ide o interné podnikové ERP systémy, rôzne typy SQL databáz, dáta uložené v cloude, excelové dokumenty alebo napríklad dáta z Google Analytics. Po jednoduchom očistení je možné z dát vybudovať prehľadné a vizuálne mimoriadne príťažlivé reporty alebo dashboardy, ktoré sú navyše v maximálnej možnej miere interaktívne. To znamená, že finálny užívateľ môže reporty takmer ľubovoľne filtrovať a zobrazovať si pre neho potrebné dáta. Asi najväčšou výhodou softvérov pre biznis inteligenciu je možnosť automatického obnovenia dát v reporte spolu so zdieľaním výstupov. Čiže s reportom, ktorý raz vo firme vybudujete, už nemáte žiadne starosti, nemusí ho každý deň zamestnanec prácne manuálne aktualizovať a rozposielať manažérom. Report sa obnoví automaticky a oprávnená osoba má k aktuálnym dátam prístup kedykoľvek. Jedinou podmienkou je funkčné internetové pripojenie.
Špecializované softvéry sú lepším nástrojom na reporting ako Excel
Primárne využitie špecializovaných softvérov, či informačných systémov obsahujúcich biznis inteligenciu, je na účely reportingu. Ak potrebujete mať neustály prehľad o predajných výsledkoch, návštevnosti vo vašich prevádzkach alebo skladových zásobách, ide o ideálne riešenie. Vďaka takto pripraveným reportom lepšie porozumiete firemným dátam a dokážete s nimi rýchlejšie pracovať. No správny softvér vás môže posunúť ešte ďalej. Neustále sú pridávané aj nové analytické funkcionality, takže už pre vás nebude problém predikovať budúci vývoj alebo zhodnotiť minulé trendy a odchýlky od plánovaného stavu.
Na trhu je množstvo dostupných alternatív, odlišujúcich sa vo svojich funkcionalitách a cene. Tými najznámejšími a aktuálne vo svete najpopulárnejšími analytickými softvérmi sú Salesforce, Qlik, Tableau a Microsoft PowerBI. Výberu konkrétneho nástroja v optimálnom prípade predchádza dôkladná interná analýza, ako „vodítko“ však môže poslúžiť aj matica spoločnosti Gartner. Prestížna poradenská spoločnosť pravidelne analyzuje platformy pre biznis inteligenciu. Kým pred niekoľkými rokmi bolo hodnotenie viacerých softvérov viac-menej vyrovnané, v poslednom období sa do pomerne jasného líderstva, najmä v dôsledku kontinuálnych inovácií, posunul nástroj od Microsoftu PowerBI, ktorý začína používať aj čoraz viac slovenských spoločností. V závese sa nachádza Tableau, ostatné nástroje už veľmi výrazne zaostávajú. A pravdepodobne sa na tejto skutočnosti nič nezmení ani pri ďalšom vydaní štúdie v roku 2021.
PowerBI je momentálne lídrom medzi softvérmi na biznis inteligenciu
Ak vo vašej firme ešte stále používate iba Excel, možno v kombinácii s Accessom, určite stojí za zváženie presun reportingu do softvérov pre biznis inteligenciu. Takýto presun by bol spojený s nutnosťou preškolenia zamestnancov, no priemerne technicky zdatní užívatelia Excelu nebudú mať výraznejší problém ani s ovládaním špecializovaného softvéru. Excel bude mať aj naďalej vo vašej firme svoje miesto, napríklad pri ad hoc analýze ostáva tým najvhodnejším nástrojom, ostatné potreby ale zabezpečí špecializovaný softvér na podstatne kvalitnejšej úrovni.
Dolovanie dát (Data Mining)
V každej firme je obrovské množstvo dát. Excel dokáže spracovať viac ako milión riadkov (hoci je v takomto prípade už pomalý), softvér pre biznis inteligenciu si poradí s násobne vyšším objemom. Ak však ani to nestačí, alebo chcete z dát zistiť nejaký skrytý význam, potrebujete použiť proces dolovania dát.
Dolovanie dát je interdisciplinárny odbor, ktorého cieľom je nájsť vo veľkom objeme dát istú skrytú pravidelnosť, trendy či korelácie, na základe ktorých bude následne možné interpretovať získanú informáciu. Využívajú sa pritom predovšetkým štatistické metódy, najčastejšie používané sú programovacie nástroje ako R alebo Python.
Data mining dokáže napríklad výrazne zlepšiť kvalitu zákazníckej segmentácie. Analyzovaním vzťahov medzi množstvom parametrov od veku, pohlavia zákazníka, cez jeho predošlé nákupy, až po konkrétny čas či kanál nákupu, dokážete odhadnúť jeho budúce správanie a správne zacieliť svoju marketingovú kampaň.