PLÁNOVÁNÍ experimentů DOE

"Někdy jediná věc, kterou můžete udělat se špatně navrženým experimentem, je pokusit se zjistit, na čem zkolaboval." - Sir Ronald A. Fisher

DOE je zkratka z anglického Design of Experiments neboli navrhování experimentů. Je to metoda experimentování založená na statistických a matematických principech tak, aby bylo z co nejmenšího počtu provedených pokusů získáno maximální množství informací o chování produktu nebo procesu. To ocení kromě samotných experimentátorů i management, který ví, že čas a zdroje pro experimentování jsou omezené a každý bezhlavě provedený pokus navíc se může pořádně prodražit.
DOE je moderní metoda experimentování, při které se současně mění hladiny několika zkoumaných faktorů ovlivňujících chování produktu nebo procesu. To šetří čas v porovnání s rozšířenějšími metodami experimentování a zvyšuje se efektivita, jak ukazuje graf napravo. Zároveň DOE umožňuje zjistit, jak se vzájemně jednotlivé faktory ovlivňují. Často jsou to právě interakce mezi faktory, které rozhodují o úspěchu provedeného experimentu a přitom rozšířenější metody experimentování interakce zcela nesprávně zanedbávají. Více se o metodách experimentování, o fázích navrhování experimentů a případových studiích dozvíte níže.

Hlavním odvětvím pro uplatnění statisticky navržených experimentů DOE byl chemický a zemědělský průmysl. Později si efektivní experimentování osvojily i další odvětví jako automobilový a farmaceutický průmysl v rámci iniciativ Six Sigma a Quality by Design. Nejnověji se navrhování experimentů začíná uplatňovat i v marketingu a službách.
V dnešní době je více pozornosti věnováno umělé inteligenci a strojovému učení, nicméně tyto obory se s plánováním experimentů výborně doplňují. Umělá inteligence může poskytnout rešerši řešeného projektu. Strojové učení vyžaduje mít nasbíraná historická data, na kterých se bude model trénovat. Pokud data nemůžete získat v potřebném množství a kvalitě nebo je jejich sběr složitý, vzniká příležitost pro naplánování experimentu DOE. Pomocí statistiky se pečlivě rozhodne, který pokus provést, aby byl experiment ekonomický a zároveň aby poskytl věrohodný a užitečný model zkoumaného produktu či procesu. Pokud chcete konzultovat návrh experimentu, kontaktujte mě přes formulář níže.

Růst efektivity experimentování při statisticky naplánovaném experimentu v porovnání s obvyklejší metodou zkoumání jednoho faktoru naráz
Odezvová plocha a vrstevnicový graf vás navedou k optimálnímu řešení
Limonáda z pokusu (1, 1) a (2, 2) je stejná a tak byl vyplýtván jeden pokus
metody experimentování

Měnit pouze jeden nebo více faktorů současně během experimentování?

screening (prosévání)

Tento typ experimentu se používá v případě, kdy je potřeba z velkého množství faktorů určit ty, které mají na vlastnosti produktu nebo procesu největší vliv.

cHARAKTErizace

Tento typ experimentu se používá v případě, kdy je potřeba nejenom rozpoznat faktory mající největší vliv na vlastnosti produktu nebo procesu, ale popsat i vzájemné interakce mezi těmito faktory.

optimalizace

Tento typ experimentu se používá v případě, kdy je potřeba nalézt optimální podmínky procesu nebo optimální vlastnosti produktu a to i v případě několika sledovaných odezev (výstupů) experimentu a několika omezujících podmínek.

A/B testování je jednoduchým typem plánovaného experimentu, ve kterém je testována změna pouze u jednoho faktoru. Tento typ experimentů je často využívaný hlavně v marketingových aplikacích jako třeba zvyšování návštěvnosti webů.

DATA SCIENCE

Data science neboli datová věda je interdisciplinární obor, který využívá vědecké metody a počítačové algoritmy pro získávání znalostí z dat. Datová věda propojuje statistiku s analýzou velkého objemu datData v dnešní době pocházejí ze všech možných zdrojů - z číselných tabulek, obrázků, textu, webu a datoví vědci umí všechny tyto formy dat analyzovat, nacházet v nich skryté vzory a převést je na praktické rady a lepší rozhodnutí. 
Na obrázcích níže je zobrazena důležitá část datové vědy - ukázka vizualizace dat, grafy, které jsem vytvořil v programovacím jazyku Python. Pokud mi svěříte Vaše data, pomohu Vašemu byznysu vytěžit z dat maximum informací a souvislostí. Kontaktujte mě přes formulář níže.

Graf důležitosti efektů faktorů ukazuje, které parametry mají největší váhu při tvorbě predikce modelu

PRIORITY

Se znalostí důležitosti efektů jednotlivých procesních parametrů na výsledek se můžete snadno zaměřit na ty s největším dopadem.

Korelační mapa přehledně vyznačuje sílu korelace, zvláště když se zkoumá mnoho parametrů najednou

SOUVISLOSTI

Korelace neznamená kauzalitu, přesto je užitečné znát vzájemné vztahy a míru závislosti mezi zkoumanými procesními parametry.

ROZHODOVÁNÍ

Mít mapu a vědět, kam vás zavedou různá nastavení procesních parametrů a jaký výsledek vás čeká v cíli, je obrovský rozdíl oproti improvizaci a bloudění. Dejte sbohem metodám založeným na pokusu a omylu.

Rozhodovací strom je jako rozcestník, který ukazuje, k jakému výsledku dorazíte při zvoleném nastavení parametrů procesu

TRENDY

Kdo vidí směr, kterým se ubírá trend, ten snadno využije momentum, které se nabízí. A platí to i v datech.

Regresní přímka umožňuje sledovat trend a histogram distribuci výsledků zkoumaného jevu

MACHINE LEARNING

Machine learning neboli strojové učení je oblast umělé inteligence zabývající se technikami, které umožňují počítači učit se a dělat rozhodnutí na základě zkušeností, podobně jako se učí člověk. Místo toho, aby se počítači přesně řeklo, co má dělat (pomocí naprogramování přesně po sobě jdoucích pokynů), poskytnou se mu trénovací data (příklady zkoumaného jevu z minulosti) a počítač se z nich buď sám nebo s učitelem/trenérem naučí, jaké jsou v datech souvislosti a podle jakých vzorů dělat předpovědi o budoucích případech.

Strojové učení se dá využít například pro prediktivní údržbu mechanických strojů, kde model na základě monitoringu klíčových parametrů procesu (první obrázek níže) identifikuje riziko výpadku stroje a doporučí provedení údržby. Dalším příkladem využití strojového učení je optimalizace a vývoj procesu, kde se dá vytvořit preskriptivní postup (druhý obrázek níže) nastavení parametrů procesu tak, aby se vždy dosáhlo na žádoucí výsledek. Například jak je potřeba nastavit parametry obrábění, aby se zvýšila drsnost povrchu výrobku. Sami určitě vymyslíte, kde by se Vám podobné postupy mohly hodit.

Pokud chcete využít mých služeb k natrénování vlastního prediktivního modelu, kontaktujte mě přes formulář níže.

Graf důležitosti efektů faktorů ukazuje, které parametry mají největší váhu při tvorbě predikce modelu
Rozhodovací strom je jako rozcestník, který ukazuje, k jakému výsledku dorazíte při zvoleném nastavení parametrů procesu

COMPUTER VISION

Computer Vision neboli strojové vidění je obor, který učí počítače "vidět" a rozumět obrázkům nebo videím podobně jako lidé. Je to oblast umělé inteligence navazující na machine learning (strojové učení) a deep learning (hluboké učení). Výraz hluboké učení vychází z toho, že se pro trénink modelu využívají neuronové sítě s mnoha vrstvami "neuronů". První vrstvy se učí jednoduché geometrické tvary, hlubší vrstvy se naučí rozpoznávat komplexnější znaky v analyzovaném obrazu. Na příkladu klasifikace auta jako super-sport by se tedy první vrstvy naučily rozpoznat kola, další vrstvy by se zaměřily na přítomnost zadního spoileru a teprve hlubší vrstvy by porovnávaly tvar karosérie auta. Tento zjednodušený princip vyjadřuje obrázek níže. 

Konvoluční neuronová síť pro rozpoznávání obrazu se naučí výrazné prvky

Model strojového vidění může odhalit vady na výrobní lince, nálezy na rentgenových snímcích nebo může klasifikovat morfologickou krystalickou strukturu chemické sloučeniny. Uplatnění těchto modelů má potenciál v širokém spektru oborů.

Kontrola kvality hrdla lahve v rámci strojové detekce vad
Kontrola kvality hrdla lahve v rámci strojové detekce vad
Kontrola kvality hrdla lahve v rámci strojové detekce vad

EXPLAINABLE AI (XAI)

XAI neboli VYSVĚTLITELNÁ umělá inteligence je obor, jehož cílem je srozumitelně pro člověka vysvětlit rozhodnutí udělané umělou inteligencí a popsat důvody, které jí ke konkrétnímu rozhodnutí vedly.
Nespoléhejte se na AI jako černou skříňku, kam se vloží data, zatřese se s ní, z dat se stanou neznámo jak naučené vzory a nakonec z ní vypadne rozhodnutí, ke kterému nevíte, jak AI přišla. Typickým příkladem takových black box modelů je většina neuronových sítí.

Model jako černá skříňka, do které není vidět a tedy ani do rozhodování modelu

Vysvětlitelnost rozhodování modelů je zásadní pro budování důvěry člověka používajícího AI model ve výstupy modelu. Pokud chcete využít mých služeb k vysvětlení rozhodování Vašeho modelu, kontaktujte mě přes formulář níže.

Model s prvky explainable AI jako otevřená skříňka, do které je vidět a tedy i do rozhodování modelu

ROZBOR KONKRÉTNÍ PREDIKCE


Příspěvek jednotlivých parametrů modelu v rámci vysvětlitelnosti konkrétní predikce modelu

Na příkladu modelu prediktivní údržby si můžeme ukázat, jak se dá vysvětlit například nejčerstvější předpověď modelu predikující nutné odstavení stroje. Všechny parametry stroje, které ukazují červenou šipkou doprava mají pozitivní efekt na hladký provoz stroje. Největší pozitivní efekt v této konkrétní predikci (+0,55) má teplota chladícího média (Coolant Temperature) s konkrétní hodnotou teploty v době predikce 7,9 stupňů C. Základní "baseline" hodnota je stanovená na ose x jako 1,027 a znamená hladký provoz. Jakákoliv hodnota pod -1 na ose x již znamená naklonění predikce na nutné odstavení stroje. Vidíme, že síla řezání (Cutting) na hodnotě 3,67 kN a kroutící moment (Torque) s hodnotou 17,899 Nm silně negativně ovlivňují (s efekty -2,82 a -3,52) poslední predikci směrem k doporučení odstavení stroje. Znalost toho, jak jednotlivá nastavení stroje ovlivňují predikci modelu pomůže vybudovat důvěru v používaný model, anebo naznačí nutnost dotrénování modelu v určité oblasti. 

KONZULTACE & ŠKOLENÍ

"Statistika je katalyzátorem inženýrské vědy, nikoliv její náhradou." - George E. P. Box

Použiji zde výše citovanou myšlenku, protože přesně vystihuje užitečnost spolupráce mezi statistikem a vědci, inženýry nebo pracovníky operujícími na daném procesu. Pracovníci z praxe mají velké zkušenosti a vědí, jak se proces chová v obecné rovině. Když ale do hry vstupuje optimalizace více parametrů najednou, zkušenosti a intuice přestávají stačit. Jako poradce DOE Vám pomohu proces vystihnout, kvantifikovat nejefektivnějším možným sběrem dat a vytvořím popisný nebo prediktivní model, který může odhalit i netušené interakce mezi zkoumanými faktory. Díky modelu se podaří získat cenné know-how, proces optimalizovat a často dosáhnout i zdánlivě nedosažitelných výsledků.

Vrstevnicový graf podobně jako v mapě ukazuje směr nejrychlejšího stoupání ke stanovenému cíli

A jak bude naše spolupráce vypadat?

1) Domluvíme si úvodní konzultaci zahrnující definování problému, stanovení cíle, analýzu historických dat pokud jsou k dispozici.
2) Dohodneme se na podmínkách spolupráce.
3) Provedeme brainstorming se členy Vašeho týmu ohledně výběru zkoumaných faktorů, nastavení jejich úrovní a měření výstupní veličiny (odezvy).
4) Navrhnu jednotlivé kroky experimentu, analýzy dat nebo tréninku AI modelu na míru Vašemu produktu nebo procesu podle stanoveného cíle a rozpočtu.
5) Provedeme jednotlivé kroky experimentu.
6) Zanalyzuji výsledky experimentu, vytvořím srozumitelnou zprávu a navrhnu další postup.

Tímto způsobem Vás provedu nástrahami experimentování. Také mohu pro Vaší firmu připravit školení o navrhování experimentů, analýze dat nebo strojovém učení na míru znalostem Vašich pracovníků. Pokud Vás možnost spolupráce zaujala, neváhejte mě kontaktovat přes formulář uvedený na konci stránky.