Když se bere kanón na mouchu | Mňamka #52
Štěstí přeje připraveným
Ještě si živě pamatuju, když všechny moje projekty v Pythonu začínaly následujícími řádkami:

Přišlo mi to neprůstřelný. Nemůže mi přece chybět žádný modul, když je tam mám všechny. Četné nadávky linteru jsem ignoroval s myšlenkou: Já přece vím, co používám. Na první pohled je z importů zřejmé, že se jednalo o aplikaci, která pracovala se souborovým systémem, konkrétně pak s daty ve formátech JSON a CSV. Navíc docela nízkoúrovňově přistupovala k síti, s daty dělala nějakou tu dejta sájenc a byla to… hra?
Moje teorie byla taková, že když během kódění zjistím, že něco potřebuju, už to prostě rovnou budu mít. Štěstí přeje připraveným, ne?
Na zkoušku jsem vytvořil venv a nahrál do něj pomocí pip výše zmíněné balíčky. Prázdný venv má u mě kolem 7 MB, po nainstalování balíčků to bylo 150 MB. Samotný pandas má po instalaci všech závislostí (jako je třeba numpy) 113 MB. Dneska nikoho megabajt sem nebo megabajt tam úplně netrápí; v době, kdy váš repozitář může existovat v nesčetně kopiích napříč datovými centry a CDN po celém světě, a nikdo jeho 113 MB pandasu a jeden prázdný soubor s názvem hello-world.py nezaznamená, se to může zdát jako zbytečná buzerace, ale já když vidím ve skriptu na převedení TSV do CSV na začátku import pandas as pd, většinou se zhluboka nadechnu a začnu dělat problémy.
Orat se dá lecčím
Když zjistíte, že se vaším nosem dá tak trochu orat v zemi, stejně si radši na pole pořídíte třeba rádlo. A stejně je to s pandasem. Ono se to dá použít na otevření CSV. Ale ono to k tomu není primárně určené. pandas je jako švýcarák, a setsakramentsky dobrej švýcarák, ale víno se prostě většinou otevírá líp vývrtkou.
Může to vypadat, že jsem si zasedl na pandas; já opravdu vím, že je to skvělý balík modulů. Ale z mé zkušenosti se občas používá moc. Na srazu dejta sájentistů si musí pandas připadat trochu jako jediná žena na gang bangu.
Každý sklízí, co zasel
V Bizztreat jsem se naučil jedno strašně pěkný pravidlo - používej správný nástroj na požadovanou činnost.

O hodinu později koukám, co se hergot děje, že se mi ten obraz nechce a nechce sestavit. Nahlédnu do Dockerfile a představuji si, že takhle nějak vypadaly myšlenky autora:
- Tom říkal, ať ty obrazy děláme malý, postavím to na Alpine Linux.
- Moje appka používá pandas, tak teda pip install pandas.
- Ahá, ono to na Alpine nejde, tak já tam přidám závislosti pro sestavování C knihoven pro Python.
- pip install pandas
- Ty jo, trvá to docela dlouho, ale sestavilo se to.
- Hotovka libovka.
A na co appka ten pandas potřebuje?
Zjišťuje záhlaví céesvéčka.
Až se ucho utrhlo
Abych nebyl jenom za nerváka, co nadává na pandas, takhle prosím se dá docela snadno otevřít céescvéčko bez něj:

Tom
Ikony v reportu: Zaujměte na první pohled a zjednodušte navigaci | Mňamka #543
Vizuální zkratky, které promění datovou džungli v přehlednou mapu. Zjistěte, jak s pomocí ikon zjednodušit navigaci, zvýraznit klíčové informace a proměnit suchá data v poutavý příběh. Naučte se vybírat vhodné ikony, pracovat s nimi efektivně a odhalte, proč je jejich správné použití klíčové pro srozumitelnost a úspěch vašich reportů.
Jak předvídat chování zákazníků: Churn, životní hodnota a další klíčové ukazatele | Mňamka #542
Porozumění chování zákazníků a jeho predikce jsou dnes klíčové pro firmy, které chtějí budovat loajalitu, zlepšit cílení kampaní a efektivně řídit své marketingové investice. Jak předpovědět, kdy zákazník odejde, jakou má pro firmu hodnotu nebo kdy s největší pravděpodobností znovu nakoupí? V článku se podíváme na klíčové koncepty, jako je predikce odchodu zákazníků (churn), výpočet jejich životní hodnoty (Lifetime Value), odhad pravděpodobnosti další interakce či modelování sklonu k nákupu. Získané poznatky mohou pomoci vytvářet efektivnější marketingové strategie a lepší zákaznickou zkušenost.
MS Fabric: Pojďte si s námi vytvořit první pipeline - 2.část | Mňamka #541
Otevřeli jste poprvé MS Fabric a vůbec se nerorientujete? Už máte zadání a nevíte kam dřív? V tom případě jste tady správně, protože vás provedeme prvními krůčky, jak si dotáhnout do Fabricu první data, zpracovat je a nastavit celý proces v jednoduché pipeline. Ukažte ostatním, jak se to dělá! V tomto článku si představíme konkrétně kroky jako kopírování dat, dataflow, notebooky a zprovoznění pipeline.