Kolik stojí Microsoft Fabric? | Mňamka #528

Microsoft Fabric je už nějakou dobu obecně dostupný! Prach se trošičku usadil, první velké implementace jsou na světe a vy si říkáte, možná bychom měli ten Fabric zvážit. 

V tu chvíli tou nejdůležitější otázkou, kterou si asi pokládáte je, kolik mě to vlastně bude stát?

Protože ano, je skvělé mít k dispozici jednotné analytické řešení a všechny “zbraně” Fabricu, ale na konci dne je taktéž důležité vědět, kolik mi zbyde v peněžence. :)

Takže, pojďme se pokusit rozebrat všechny dostupné možnosti, klíčové komponenty a vysvětlit některé koncepty, které mohou ovlivnit vaší cenu za využití MS Fabric. 

Z čeho se skládá cena MS Fabric?

Cena MS Fabric se skládá ze několika prvků, které musíte zohlednit.

Microsoft Fabric Capacity (F SKUs)

Licence kapacity jsou rozděleny do jednotek Stock Keeping Units (SKU), které poskytují sadu úrovní zdrojů MS Fabric. Tyto úrovně jsou měřeny v jednotkách kapacity (CU), což je nový koncept používaný k měření výpočetního výkonu dostupného pro každé SKU.

Jinými slovy, vše co se v MS Fabric děje konzumuje CU. Jedná se o jednotku kapacity, která kombinuje jednotlivé zdroje v rámci cloudu MS Azure - jako například CPU, Paměť, Disk IO, Network bandwidth, atd.

Storage = Úložiště

Ve Fabricu jsou všechna vaše data uložena ve OneLake a stejně jako u jiných moderních datových platforem (Databricks, Snowflake atd.), je i v Microsoft Fabric úložiště z hlediska cenotvorby odděleno od výpočetního výpočetního výkonu.

Power BI Licence

Power BI bude pravděpodobně číslo jedna v rámci následné vizualizace a interpretace dat.

Co je taktéž důležitým faktorem v rámci rozhodování je to, že SKU menší než F64 vyžadují licenci Pro nebo Premium Per User (PPU) k používání Power BI.

Od SKU F64 výše je poté možné využívat Power BI v neomezeném počtu uživatelů bez dodatečných nákladů (jediné co může být ještě zaúčtováno jsou dodatečné náklady za úložiště). A pokud se budeme bavit o firmě se stovkami licencovaných uživatelů, jedná se už o celkem zajímavou úsporu.

Bandwitdth (Šířka pásma)

Šířka pásma se týká dat přenášených do a z datových center Azure a mezi nimi. I když je to důležitá součást, její dopad na náklady je často minimální ve srovnání se spotřebou jednotek kapacity (CU) a licencemi Power BI:

  • Přenos dat dovnitř: Zdarma pro data přesouvající se do datových center Azure.

  • V rámci stejné dostupnostní zóny: Zdarma

    • Dostupnostní zóna je izolované místo v rámci regionu Azure, vybavené vlastní energií, chlazením a sítí k ochraně aplikací a dat před selháním datového centra. Zajišťuje vysokou dostupnost a odolnost tím, že umožňuje rozložení zdrojů do několika nezávislých fyzických míst v rámci konkrétního regionu.

  • Mezi dostupnostními zónami: Od 21.5. 2024 je i tento přenos zdarma, předtím se jednalo o centy €.

  • Mezi regiony: Cena se pohybuje mezi 0,019 € až 0,148 € za GB.

  • Mezikontinentální přenos: Cena se pohybuje mezi 0,047 € až 0,148 € za GB. 

  • Výstup na internet: Prvních 100 GB/měsíc zdarma; další náklady se liší podle regionu.

Více informací o cenách Bandwidth: https://azure.microsoft.com/en-us/pricing/details/bandwidth/

Jaké jsou cenové modely MS Fabric?

Jak už jste si asi všimli na prvním obrázku, existují dva dostupné cenové modely pro nákup kapacit Microsoft Fabric:

Pay-as-you-go (Platba podle použití)

Tato možnost byla (je) k dispozici od doby, kdy byl Fabric oznámen v rámci veřejného preview v květnu 2023. 

Tento model umožňuje zákazníkům platit pouze za skutečně využité zdroje. Taktéž lze pozastavit Fabric kapacitu, což nabízí flexibilitu nákladů a poplatky se účtují pouze tehdy, když je kapacita aktivně používána.

Ceny startují na konkurenceschopné úrovni ~10 € za den, což činí Fabric dostupým i pro menší organizace.

Kapacitní rezervace

Nyní se dostáváme k zajímavější části, zejména pokud jste větší firma a/nebo preferujete mít předvídatelné měsíční náklady na Fabric. Můžete si rezervovat zdroje a “uzamknout” cenu na měsíční bázi na období jednoho roku.

Současné ceny jsou výrazně nižší než v modelu pay-as-you-go, a to o ~40.5%, což může být dobrým podnětem k volbě tohoto modelu.

Proměnné, které určují pro jakou licenci / licence se nakonec rozhodnout

Provoz

Microsoft Fabric v pay-as-you-go umožňuje pozastavit a obnovit kapacitu, když není v provozu, což může ušetřit náklady vaší organizace. Později, když chcete znovu zahájit práci s využitím své kapacity, můžete ji znovu aktivovat.

Pokud vaše společnost během víkendu s daty nebo analytikou nic nedělá, můžete kapacitu jednoduše pozastavit a ušetřit přibližně 20 % měsíčních nákladů.

Stejně tak lze pozastavit a pustit oddělenou kapacitu pro vývoj. A to i automatizovaně.

Jednotky kapacity (CUs) = výkon

O jednotkách kapacity (CUs) už byla řeč - každá operace ve Fabricu spotřebovává CU, vyšší počet CUs znamená vyšší výkon.

Ale kolik té kapacity vlastně teda budu potřebovat?

To zprvu nikdo neví, ano jsou odhady z hlediska velikosti firmy, počtu datových zdrojů, náročnosti vývoje a pracovní zátěže, ale určitě doporučujeme jednoduché pravidlo:

Začněte s Pay-as-you-go a nižšími kapacitami. Ve chvíli, kdy máte funkční a stabilizované řešení, u kterého znáte spotřebu jednotek kapacity, podívejte se zda nevychází lépe rezervace kapacit. Samozřejmě i s ohledem na licenční politiku MS Power BI.

K sledování využití MS Fabric kapacity skvěle poslouží aplikace Microsoft Fabric Capacity Metrics, o které se můžete více dozvědět zde: https://learn.microsoft.com/cs-cz/fabric/enterprise/metrics-app

Bursting, Smoothing a Throttling

Bursting (prasknutí)

Vaše kapacity mají období, kdy jsou méně využívány (under-utilized) a naopak mohou narážet na svůj strop (over-utilized, peak).

Když kapacita provádí více úloh, může se náhle zvýšit poptávka po výpočetním výkonu, která překročí limity zakoupené kapacity. Skladové a SQL analytické koncové body poskytují bursting kapacitu, která umožňuje pracovním zátěžím využít více zdrojů k dosažení lepšího výkonu.

Jinými slovy Bursting (dynamické škálování či dočasné zvýšení kapacity) vám umožňuje použít více výkonu, než jste zakoupili (v rámci konkrétního časového období), tak aby úloha byla efektivně a zdárně dokončena.

Děje se na pozadí a automaticky. Má taktéž svůj škálovací faktor, který je stanoven podle kapacity, kterou využíváte.

Když je škálovací faktor vyšší než 1, znamená to, že je používána bursting kapacita k uspokojení požadavků dané úlohy (pracovní zátěže). Také to znamená, že vaše pracovní zátěž si půjčuje kapacitní jednotky z budoucího časového intervalu, což je je základní koncept Microsoft Fabric nazývaný smoothing.

Smoothing (vyhlazování)

Smoothing znamená rozložení zátěže (hodnocení výpočetní kapacity) rovnoměrněji v čase. To zajišťuje, že úlohy, které zákazníci provádějí, nebudou mít náhlé výkyvy v potřebné kapacitě, což by mohlo způsobit problémy nebo zpomalení. Místo toho se kapacita spravuje tak, aby úlohy probíhaly plynule a efektivně, bez ohledu na momentální špičky v zátěži.

Smoothing neovlivní dobu provádění. Pomáhá zefektivnit správu kapacity tím, že zákazníkům umožňuje dimenzovat kapacitu na základě průměrného, nikoli maximálního využití.

Jde vám z toho hlava kolem? Pojďme si říct důležité shrnutí: 

MS Fabric vám automaticky poskytne více výkonu, když je potřeba a naopak si ho vezme, když jej nepotřebujete. Pořád a dokola platíte jen za výkon a čas, který je k dokončení dané úlohy potřeba. Co byste raději - datovou transformaci, která trvá na SKU F2 hodinu nebo transformaci, kterou s burstingem na přibližné kapacitě F8 máte hotovou za 15min, když zaplatíte stejně?

Throttling (přiškrcení)

Asi si říkáte, co ale když pustí datový engineer nebo analytik omylem úlohu, která by spotřebovala velké množství kapacity? Kde je strop, jak budu chráněn proti nechtěnému velkému naškálování a následné platbě za spotřebované velké množství kapacity? Tak k tomu slouží throtlling, který “přiškrtní” v případě nadměrného spotřebování “vypůjčené” budoucí kapacity.

V Microsoft Fabric jsou fáze omezení rozděleny do čtyř etap:

Jak je uvedeno v tabulce výše:

  • Do 10 minut ekvivalentu budoucího využití kapacity nebude nic omezeno. 

  • První omezení, které můžete spozorovat, zahrnuje zpoždění 20 sekund pro interaktivní operace (uživatelsky vyžádané - např. otevření reportu), pokud úloha konzumuje více jak 10 minut z budoucího využití kapacity.

  • V případě, že ekvivalent budoucího využití kapacity přesáhne 60 minut, interaktivní požadavky jsou zamítnuty a uživatelé začnou při iniciování požadavků, například při otevírání Power BI reportu, dostávat chybové hlášky.

  • Poslední fáze omezení nastane, jakmile ekvivalent využití budoucí kapacity přesáhne 24 hodin. V tomto případě budou odmítnuty i operace na pozadí, například aktualizace datasetů.

Je důležité poznamenat, že operace, které jsou již v průběhu, nejsou omezeny. Výše uvedené zásady se uplatňují pouze na operace, které jsou požadovány po zahájení omezení.

Power BI

Power BI je jedna z proměnných, která nejvíce ovlivňuje cenu, kterou ve výsledku bude třeba zaplatit. Cena každé Power BI PRO licence je 9.40 € na uživatele/měsíc a 18.7 € na uživatele pro licence Power BI Premium per user (PPU).

Jak bylo již napsáno výše, od SKU F64 výše je možné využívat Power BI v neomezeném počtu uživatelů bez dodatečných nákladů.

A proto, pokud máte více než 500 uživatelů (250 uživatelů s licencí PPU), kteří spotřebovávají a sdílejí obsah Power BI, doporučuje se zakoupit licenci F64 nebo vyšší.

Závěrečná doporučení a scénáře

Pochopení nákladů spojených s Microsoft Fabric je zásadní pro efektivní plánování rozpočtu. Níže jsou poskytnuty 4 tipy a 3 scénáře, které vám pomohou ještě lépe pochopit, jak můžete odhadnout licencování, které bude nejlépe vyhovovat vaší organizaci.

Tipy

  1. Začněte s Pay-as-go. I v případě, že vaše firma má více jak 500 uživatelů Power BI (250 PPU užitatelů), tak pravděpodobně nebudou ode dne jedna konzumovat obsah v PBI. Velikost licence přizpůsobte objemu dat, komplexnosti datových úloh a velikosti vývojového týmu (různé scénáře jsou k dispozici dále).

  2. Používejte Aplikace pro monitoring a vyhodnocování využití kapacity pro volbu vhodné kapacity.

  3. Pro vývojáře (datové analytiky, datové engineery, apod.) dedikujte pay-as-you-go separátní kapacitu, vyhnete se tak nechtěnému throttlingu a zároveň zajistíte efektivnější vývoj.

  4. Zvažte, kdy se vám vyplatí přejít z pay-as-you-go na rezervaci kapacit. Dobrým vodítkem je si uvědomit, že tu máme na pozadí bursting/smoothing/trotthling (platí pro oba dva cenové modely) a měsíc má v realitě ~730 hodin. Pokud tedy jsme schopni zpracovat více jak 730 hodin určité kapacity bez výrazného throttlingu, tak je moudré tuto kapacitu rezervovat a ušetřit ~40.5% nákladů.

Scénáře

V následujících odstavcích je nastíněny scénáře možného pricingu u organizací různých velikostí již v době zavedení datového řešení do provozu.

Scénář 1 - Malá firma s mírnou zátěží

Počet uživatelů, kteří budou spotřebovávat obsah Power BI: 20 uživatelů

Provozní hodiny: 8 hodin/den (pozastavení kapacity mimo pracovní dobu a o víkendech)

Pracovní zátěž: Mírná

Úložiště: 100GB v OneLake

Doporučená licence: F2-F4 SKU (PAY-AS-YOU-GO, sdílená jak pro provoz tak vývoj)

Scénář 2 - Středně velká organizace se 100 uživateli, střední zátěží a špičkami v rámci vytížení kapacity


Počet uživatelů: 100

Provozní hodiny: 

  • produkce a staging: 10 hodin/den, 6 dní v týdnu (pondělí až sobota)

  • vývoj: 2 vývojáři x 5 hodin denně x 20 dní v měsíci

Pracovní zátěž: střední, špičky v intenzivním zpracování dat, zejména během nočních časů, kdy dochází k nápočtu dat za předchozí den (přibližně 3 hodiny denně)

Úložiště: 1TB v OneLake

Doporučená licence: F8 (pay-as-you-go pro produkci), F2-F4 pro vývojáře

Scénář 3 - Velká korporace s špičkami při měsíčním uzávěrkovém reportování


Počet uživatelů: 500

Provozní hodiny: 

  • produkce a staging: 24 hodin denně, 7 dní v týdnu

  • vývoj: 8 vývojáři x 5 hodin denně x 20 dní v měsíci

Pracovní zátěž: Běžné operace se SKU F64, škálování na F128 během špiček vytížení kapacity (přibližně 30 hodin měsíčně)

Úložiště: 10TB v OneLake

Šířka pásma: Mezikontinentální přenos v rámci Evropy a Asie o velikosti 5TB.

Doporučená licence: SKU F64 (předplacená), ale během období vysoké poptávky škáluje až na F128, pro vývojáře F4-F8 pro vývojáře

Zdroje


Patrik
datový detektiv

LinkedIn

Pojďme společně prozkoumat možnosti pro váš růst!

Naším cílem je naslouchat a porozumět, bez závazků a prodejních taktik.

Naše první setkání je věnováno vám. Chceme navnímat vaše podnikání a zjistit, zda můžeme podpořit váš růst a rozvoj.