Slovník údajov: ako a osvedčené postupy

Dátový slovník je zoznam kľúčových pojmov a metrík s definíciami, obchodný glosár. Aj keď to znie jednoducho, takmer triviálne, jeho schopnosť zladiť podnikanie a odstrániť zmätok môže byť hlboká. V skutočnosti je dátový slovník pravdepodobne jedným z najcennejších artefaktov, ktoré môže dátový tím dodať podniku.

Väčšina firiem má aspoň jeden koncept, výraz alebo metriku, ktorá sa medzi tímami používa alebo interpretuje inak. Keď sa to stane, panuje zmätok. Tvorcovia rozhodnutí môžu nesúhlasiť s tým, čo ukazujú údaje a aké kroky majú podniknúť. V prehľadoch medzi tímami sa môžu zobraziť rôzne čísla pre rovnakú metriku z toho istého zdroja údajov z dôvodu nejednotnej obchodnej logiky. Tímy sa môžu dokonca hádať o správnej definícii a obhajovať svoj trávnik, pravdepodobne preto, že ich definícia spôsobuje, že ich čísla vyzerajú lepšie. To nie je dobré pre podnikanie.

Keď už máte dátový slovník, je to dokument, na ktorý sa môžu odvolávať všetci zamestnanci a nachádzať sa na tej istej stránke, uľahčuje vstup nových zamestnancov do tímu a tím Business Intelligence (BI) má krištáľovo jasné požiadavky na implementáciu týchto metrík.

Aby sme to vyjasnili, v tomto prípade neuvažujeme o dokumentácii so surovou databázovou tabuľkou, hoci je to tiež dôležité, ale o zozname obchodných výrazov a metrík na vyššej úrovni. Ako premýšľa podnik ako celok o „užívateľovi“, „výnose“ alebo „nákladoch na získanie“? Má každý rovnaké porozumenie alebo „predajné územie“, „priemerný čas prepravy“ alebo „stretnutie“? Cieľom by malo byť, aby juniorský, netechnický zamestnanec, napríklad agent zákazníckeho servisu, mohol prečítať časť pre svoju časť podnikania a porozumieť relevantným pojmom, ale dostatočne podrobným a presným na zachytenie obchodnej logiky. týchto metrík.

V tomto príspevku podrobne popíšem niektoré osvedčené postupy týkajúce sa údajových slovníkov a postup, ako ich vytvoriť. Toto v žiadnom prípade nebude fungovať, ale prinajmenšom pre mňa pracoval. Tu predpokladám, že tím BI riadi tento proces. Podľa môjho názoru by mali vlastniť dátový slovník a implementáciu metrík do nástrojov BI.

1. Zbierajte podmienky

Prvým krokom je zostavenie zoznamu výrazov. To znamená, že tím BI by mal vytvoriť tabuľku so zoznamom názvov obchodných konceptov a metrík (mier) a spôsobu rozdelenia a nakrájania údajov (dimenzie). Aj keď to znie skľučujúco, jedným prístupom je ísť obchodným tímom obchodným tímom a preskúmať vzorku všetkých ich štandardných správ a dashboardov. Vymenujte všetky štítky osí z grafov, hlavičky stĺpcov z tabuliek prehľadov a rozmery spôsobu otočenia údajov. Správa ukazujúca príjmy podľa územia (na určité časové obdobie) tak prináša dva kľúčové pojmy: „príjem“ a „územie“. V tejto fáze zostavujete zoznam názvov výrazov, nie ich definícií.

Výstupom je zoznam mena tímu, názvu termínu, typu údajov, vzorovej hodnoty alebo dvoch, a možno odkaz na príklad správy používajúcej tento výraz. Ďalšie stĺpce, ktoré je užitočné pridať, sú stĺpec označujúci, či ide o dimenziu alebo mieru (všeobecne existuje väčšia zhoda v otázke rozmerov ako mier) a stĺpec špecifikujúci zdroj pravdy.

Krok 1: zoznam výrazov bez definícií

Usporiadajte a zoskupte zoznam podľa obchodných funkcií, ako sú finančné metriky, marketingové metriky, metriky zákazníckych služieb atď. Môžete tiež rozobrať skutočne všeobecné dimenzie („rok“, „product_id“, „krajina“ atď.), Ktoré pokrývajú mnoho tímy do ich vlastnej sekcie.

Zoznam pravdepodobne nie je taký dlhý, ako by ste mohli očakávať. Dôvodom je, že tímy majú zvyčajne k dispozícii relatívne malú metriku, ktorú sa snažia sledovať a optimalizovať pomocou relatívne malej páky - napríklad online marketing sa môže zamerať na niekoľko kľúčových aspektov, ako sú kampaň, kanál, utrácať a segmentovať.

Požiadajte obchodný tím, aby sa zoznámil s týmto zoznamom, najmä s jeho časťou, a pridal všetky chýbajúce výrazy. Ak majú rozsiahlu sadu informačných panelov a prehľadov, pravdepodobne máte komplexný zoznam. Ak to tak nie je, poskytuje to ďalšie koncepty, ktoré je potrebné zhromaždiť.

2. Definujte pojmy

Tím BI by teraz mal urobiť prvý pokus o zostavenie alebo vytvorenie definícií.

Najskôr vytiahnite všetky definície z existujúcej dokumentácie. Môže to byť z wiki, výročných správ alebo zo skutočného kódu, ako sú dotazy SQL alebo makrá Excel. Vymedzenie pojmov by malo byť jasné a jednoznačné. Ak je jasnejšie ukázať jednoduchý vzorec (ako napríklad ARPU = total_revenue / number_subscribers), než napísať definíciu, ukážte to. Väčšina zamestnancov by mala byť schopná porozumieť definícii, aj keď musia krížovo odkázať na niektoré podmienky.

Po druhé, sadnite si jeden po druhom do tímov a požiadajte o pomoc s vysvetlením akýchkoľvek chýbajúcich definícií alebo ich upresnením. (Urobíte lepší pokrok, keď začnete definíciou, aj keď je nesprávna, ako prázdnou bunkou.) Môže to vyžadovať určité kroky tam a späť, až kým sa v rámci daného tímu nedohodnete. Môže tiež vyžadovať určitý prieskum o tom, ako sa v súčasnosti počíta metrika.

Dôležité je, že sa nepýtate „čo je súčasná definícia?“, „Ako by sa to malo definovať?“ Ak súčasná implementácia nie je ich ideálnou definíciou, je to pre obchodný tím ideálna príležitosť na určenie ideálneho stavu. Napríklad je to šanca na zjednodušenie, ak ste zdedili príliš zložitú definíciu. Akonáhle je táto ideálna definícia zachytená, potom existuje ďalší tlak na dátový tím, technický tím alebo iné časti podniku, aby dodali danú metriku podľa definície.

3. Identifikujte konflikty

Toto je kľúčový krok: zakoreniť všetky pojmy, kde sa jeho definícia medzi tímami líši.

4. Získajte zarovnanie

Pre podmienky, ktoré sa líšia medzi tímami, priveďte príslušné tímy do tej istej miestnosti (a zamknite dvere). Nechajte ich diskutovať o tom, ako a prečo sa líšia.

Na tomto stretnutí by mala existovať dohoda iba s dvoma výsledkami:

* jeden tím súhlasí s prijatím definície druhého tímu.

* majú legitímne dôvody, prečo sa líšia. V takom prípade sa dohodnite na novom názve pre jednu alebo obe podmienky.

(Tretia možnosť, keď sa oba tímy dohodnú na zmene svojej definície na spoločnú definíciu, je možná, ale menej pravdepodobná.)

Mená by mali byť také dlhé, ako je potrebné, aby sa predišlo nejasnostiam alebo nejasnostiam. Ak je „community_adjusted_editba“ vhodnejším a vhodnejším výrazom, ktorý ho odlišuje od bežného výrazu „ebitda“, použite tento dlhší a popisnejší pojem. Cieľom je odstrániť zmätenosť, aby nebola strnulá.

5. Získajte odhlásenie

Nechajte hlavy tímov odhlásiť sa. To je rozhodujúce. Nechcete, aby tím BI definoval pojem a obchodný tím tajne nesúhlasil. V takom prípade podnik iba pôjde a implementuje svoju vlastnú logiku v programe Excel a vrátite sa naspäť na druhý. Ako odborníci v oblasti a ako ľudia, ktorí budú robiť obchodné rozhodnutia na základe týchto ukazovateľov, musia byť títo vlastníci podnikov plne na palube.

Vo Warby Parker sme využili pomoc generálnych riaditeľov, aby sme požadovali, aby sa vedúci tímov odhlásili a urobili to do určitého dátumu. Vedúci tímov sú zaneprázdnení a dátový slovník sa nemusí zdať najvyššou prioritou, aj keď vidia hodnotu. Táto podpora zhora nadol sa teda ukázala ako veľmi hodnotná.

6. Zverejniť

Publikujte dátový slovník ako jednostránkový dokument, kde je prístupný celej spoločnosti - teda nielen v nástroji BI. Tieto definície by mali byť všeobecne chápané a prijaté nielen exekutívami, analytikmi a tvorcami rozhodnutí, ale všetkými zamestnancami. Zviditeľnenie je preto rozhodujúce. Ak spoločnosť používa wiki intenzívne, uverejňuje ich tu. Malo by to byť miesto, kde ľudia očakávajú.

Z koncepčného hľadiska sú tieto výrazy nezávislé od akéhokoľvek jedného systému alebo zdroja údajov, a preto nie sú viazané na nástroj BI. Jednotlivé definície by sa však podľa možnosti mali vložiť do nástrojov BI. Ak to nástroj podporuje, keď prejdete kurzorom na určitú dimenziu alebo mierku, mala by sa zobraziť definícia a príklad.

Vzhľadom na to, že tieto definície sa môžu objaviť na viacerých miestach, dátový tím by sa mal usilovať o automatické vygenerovanie dátového slovníka z jedného zdroja, ako je napríklad databázová tabuľka alebo archív kódov, a nie manuálnu údržbu statickej tabuľky. Napríklad vo Warby Parker bol náš dátový slovník vygenerovaný z úlohy Jenkins. Ak bol úložisko upravené, regenerovalo sa naša dokumentácia (vyhradená interná webová stránka alebo „dátová kniha“ pre všetku dokumentáciu).

7. Údržba

Aj keď kľúčové metriky by mali byť relatívne stabilné, môžu existovať legitímne obchodné dôvody, pre ktoré sa môže zmeniť definícia metriky. Táto zmena a nové vymedzenie by mali pochádzať od obchodného tímu. Na to, aby sa zmena vykonala a oznámila, však bude vyžadovať pomoc dátového tímu.

Tím BI by mal posúdiť vplyv zmeny pred jej zavedením. Napríklad pripravte graf ukazujúci metriku so starou aj novou definíciou metriky a stanovte očakávania, ako sa môžu čísla zmeniť.

Zaobchádzajte s touto zmenou definície ako s vydaním produktu: oznámte zmenu definície vopred, povedzte ľuďom, čo majú očakávať, a zdokumentujte zmenu v dátovom slovníku, napríklad pomocou protokolu zmien v dolnej časti dokumentu.

Nenechajte synchronizáciu rôznych systémov; Preto je automatické generovanie dokumentácie cenné.

Vytvorenie dátového slovníka podľa vyššie uvedeného postupu nie je malé úsilie. Bude to pravdepodobne trvať niekoľko mesiacov, pretože si vyžaduje konverzáciu a koordináciu medzi mnohými zamestnancami. Je to veľké tímové úsilie, riadené a koordinované tímom BI, ale vyžaduje si široký nákup, spoluprácu a úsilie a pomlčku zhora nadol.

Neodporúčam postupovať postupne. Napríklad nevytvárajte plne upečený marketingový dátový slovník s očakávaním, že sa neskôr dostane financovanie dátového slovníka. To sťažuje prístup k diskusiám o vyrovnaní (krok 4) medzi tímami, a to je skutočná návratnosť. Sekvenčná povaha tiež uľahčuje stratu pary. Na dosiahnutie cieľa potrebujete súbežné diskusie medzi tímami so spoločným dátumom odhlásenia.