Klouzavý průměr

Ve statistice je klouzavý průměr, nazývaný také klouzavý průměr, klouzavý průměr, klouzavý časový průměr nebo běžící průměr, typ filtru s konečnou impulsní odezvou, který se používá k analýze souboru datových bodů vytvořením řady průměrů různých podmnožin celého souboru dat.

Při dané řadě čísel a pevné velikosti podmnožiny se první prvek klouzavého průměru získá tak, že se vezme průměr počáteční pevné podmnožiny řady čísel. Poté se tato podmnožina upraví „posunutím dopředu“, tj. vyloučením prvního čísla řady a zařazením dalšího čísla následujícího po původní podmnožině do řady. Tím se vytvoří nová podmnožina čísel, která se zprůměruje. Tento postup se opakuje pro celou datovou řadu. Klouzavým průměrem je přímka grafu spojující všechny (pevné) průměry. Klouzavý průměr je množina čísel, z nichž každé je průměrem příslušné podmnožiny větší množiny datových bodů. Klouzavý průměr může také používat nestejné váhy pro každou datovou hodnotu v podmnožině, aby se zdůraznily určité hodnoty v podmnožině.

Klouzavý průměr se běžně používá u dat časových řad k vyhlazení krátkodobých výkyvů a zvýraznění dlouhodobých trendů nebo cyklů. Hranice mezi krátkodobým a dlouhodobým vývojem závisí na aplikaci a podle toho se nastaví parametry klouzavého průměru. Často se například používá při technické analýze finančních dat, jako jsou ceny akcií, výnosy nebo objemy obchodů. Používá se také v ekonomii ke zkoumání hrubého domácího produktu, zaměstnanosti nebo jiných makroekonomických časových řad. Z matematického hlediska je klouzavý průměr typem konvoluce, a lze jej tedy považovat za příklad dolnopropustného filtru používaného při zpracování signálu. Při použití s údaji, které nejsou časovými řadami, klouzavý průměr filtruje složky vyšších frekvencí bez konkrétní vazby na čas, i když se obvykle předpokládá určitý druh uspořádání. Zjednodušeně řečeno jej lze považovat za vyhlazování dat.

Ve finančních aplikacích je jednoduchý klouzavý průměr (SMA) nevážený průměr předchozích n referenčních bodů. Ve vědě a technice se však průměr obvykle bere ze stejného počtu údajů na obou stranách střední hodnoty. Tím je zajištěno, že odchylky průměru jsou v souladu s odchylkami v datech, a ne že jsou posunuty v čase.
Příkladem jednoduchého rovnoměrně váženého klouzavého průměru pro n-denní vzorek uzavírací ceny je průměr uzavíracích cen z předchozích n dnů. Pokud jsou tyto ceny pak vzorec je

Při výpočtu po sobě jdoucích hodnot přichází do součtu nová hodnota a stará hodnota vypadává, což znamená, že v tomto jednoduchém případě není nutné pokaždé provádět úplný součet,

Zvolené období závisí na typu pohybu zájmu, například krátkodobý, střednědobý nebo dlouhodobý. Z finančního hlediska lze úrovně klouzavých průměrů interpretovat jako podporu na rostoucím trhu nebo jako odpor na klesajícím trhu.

Pokud nejsou použitá data soustředěna kolem průměru, jednoduchý klouzavý průměr zaostává za posledním datovým bodem o polovinu šířky vzorku. SMA může být také neúměrně ovlivněn vypadnutím starých datových bodů nebo příchodem nových dat. Jednou z vlastností SMA je, že pokud data vykazují periodické kolísání, pak použití SMA této periody toto kolísání eliminuje (průměr vždy obsahuje jeden úplný cyklus). S dokonale pravidelným cyklem se však setkáme jen zřídka.

Doporučujeme:  Dinosaur Planet

Pro řadu aplikací je výhodné vyhnout se posunům způsobeným použitím pouze „minulých“ dat. Proto lze vypočítat centrální klouzavý průměr s použitím údajů, které jsou stejně vzdálené po obou stranách bodu v řadě, kde se počítá průměr. To vyžaduje použití lichého počtu datových bodů ve výběrovém okně.

Kumulativní klouzavý průměr[]

Při kumulativním klouzavém průměru přicházejí data v uspořádaném datovém toku a statistik by rád získal průměr všech dat až do aktuálního datového bodu. Například investor může chtít průměrnou cenu všech burzovních transakcí pro určitou akcii až do aktuálního okamžiku. Při každé nové transakci lze vypočítat průměrnou cenu v okamžiku transakce pro všechny transakce do tohoto okamžiku pomocí kumulativního průměru, obvykle rovnoměrně váženého průměru posloupnosti i hodnot x1, …, xi až do aktuálního okamžiku:

Hrubá metoda výpočtu by spočívala v uložení všech dat, výpočtu součtu a vydělení počtem vztažných bodů pokaždé, když se objeví nový vztažný bod. Kumulativní průměr je však možné jednoduše aktualizovat, jakmile je k dispozici nová hodnota xi+1, pomocí vzorce:

kde lze považovat za rovnou 0.

Aktuální kumulativní průměr pro nový referenční bod se tedy rovná předchozímu kumulativnímu průměru plus rozdíl mezi posledním referenčním bodem a předchozím průměrem dělený počtem dosud obdržených bodů. Až dorazí všechny vztažné body (i = N), bude se kumulativní průměr rovnat konečnému průměru.

Odvození vzorce pro kumulativní průměr je jednoduché. Pomocí

a podobně pro i + 1, je vidět, že

Řešením této rovnice pro CAi+1 získáme:

Vážený průměr je jakýkoli průměr, který má násobící faktory, které dávají různou váhu datům na různých pozicích ve výběrovém okně. Matematicky je klouzavý průměr konvolucí datových bodů s pevnou váhovou funkcí. Jednou z aplikací je odstranění pixelizace z digitálního grafického obrazu.

V technické analýze finančních dat má vážený klouzavý průměr (WMA) specifický význam vah, které se aritmeticky snižují. V n-denním WMA má nejnovější den váhu n, druhý nejnovější n – 1 atd. až do jedné.

Jmenovatel je trojúhelníkové číslo rovné V obecnějším případě bude jmenovatel vždy součtem jednotlivých vah.

Při výpočtu WMA napříč po sobě jdoucími hodnotami je rozdíl mezi čitateli WMAM+1 a WMAM npM+1 – pM – ⋅⋅⋅ – pM-n+1. Označíme-li součet pM + ⋅⋅⋅ + pM-n+1 jako TotalM, pak

Graf vpravo ukazuje, jak se váhy snižují od nejvyšší váhy pro poslední referenční body až k nule. Lze jej porovnat s váhami v exponenciálním klouzavém průměru, který následuje.

Exponenciální klouzavý průměr[]

Exponenciální klouzavý průměr (EMA), známý také jako exponenciálně vážený klouzavý průměr (EWMA), je typ filtru s nekonečnou impulsní odezvou, který používá váhové faktory, které exponenciálně klesají. Váhový faktor pro každý starší datový bod exponenciálně klesá a nikdy nedosáhne nuly. Graf vpravo ukazuje příklad poklesu vah.

Doporučujeme:  Americká depozitní akcie

EMA pro řadu Y lze vypočítat rekurzivně:

S1 není definován. S1 lze inicializovat různými způsoby, nejčastěji nastavením S1 na Y1, existují však i jiné techniky, například nastavení S1 na průměr prvních 4 nebo 5 pozorování. Význam vlivu inicializace S1 na výsledný klouzavý průměr závisí na hodnotě α; při menších hodnotách α je volba S1 relativně důležitější než při větších hodnotách α, protože vyšší hodnota α rychleji vyřazuje starší pozorování.

Tato formulace je podle Huntera (1986). Opakovaným použitím tohoto vzorce pro různé časy můžeme nakonec zapsat St jako vážený součet vztažných bodů Yt, a to takto:

pro libovolné vhodné k = 0, 1, 2, … Váha obecného vztažného bodu je .

Alternativní přístup Robertse (1959) používá Yt místo Yt-1:

Tento vzorec lze také vyjádřit v termínech technické analýzy takto: ukazuje, jak EMA postupuje směrem k poslednímu výchozímu bodu, ale pouze o poměrnou část rozdílu (pokaždé):

Rozšířením každého času získáme následující mocninnou řadu, která ukazuje, jak váhový faktor v každém vztažném bodě p1, p2 atd. exponenciálně klesá:

Jedná se o nekonečný součet s klesajícími členy.

N období v Ndenním EMA určuje pouze faktor α. N není bodem zastavení výpočtu tak, jak je tomu u SMA nebo WMA. Pro dostatečně velké N představuje prvních N datových bodů v EMA přibližně 86 % celkové váhy ve výpočtu:

Výše uvedenou diskusi je třeba trochu objasnit. Součet vah všech členů (tj. nekonečného počtu členů) v exponenciálním klouzavém průměru je 1. Součet vah členů je . Oba tyto součty lze odvodit pomocí vzorce pro součet geometrické řady. Váhu vynechanou za termy získáme odečtením od 1 a dostaneme (v podstatě se jedná o vzorec uvedený níže pro váhu vynechanou). Všimněte si, že neexistuje žádná „přijatelná“ hodnota, kterou byste měli zvolit, i když existují některé doporučené hodnoty na základě aplikace. Ve výše uvedené diskusi jsme ve vzorci pro váhu členů nahradili běžně používanou hodnotu. Tato hodnota pro vychází z nastavení průměrného stáří dat z SMA rovného průměrnému stáří dat z EWA a řešení pro . Opět se jedná pouze o doporučení – nikoli o požadavek. Pokud provedete tuto záměnu a využijete , pak získáte aproximaci 0,864. Intuitivně nám to říká, že váha po termínech „periodického“ exponenciálního klouzavého průměru konverguje k hodnotě 0,864.

Výše uvedený vzorec pro výpočet výkonu udává počáteční hodnotu pro konkrétní den, po které lze použít vzorec pro následující dny uvedený jako první. Otázka, jak daleko do minulosti se má počáteční hodnota vrátit, závisí v nejhorším případě na datech. Velké hodnoty cen ve starých datech budou mít vliv na celkový součet, i když jejich váha bude velmi malá. Mají-li ceny malé odchylky, pak lze uvažovat pouze váhu. Váha vynechaná zastavením po k termínech je

Chcete-li například získat 99,9 % hmotnosti, nastavte výše uvedený poměr na 0,1 % a vyřešte k:

by se měly používat termíny. Vzhledem k tomu, že s rostoucím N roste i počet přístupů, zjednodušuje se to na přibližně

Doporučujeme:  Skluz

pro tento příklad (99,9 % hmotnosti).

Modifikovaný klouzavý průměr (MMA), průběžný klouzavý průměr (RMA) nebo vyhlazený klouzavý průměr je definován jako:

Stručně řečeno, jedná se o exponenciální klouzavý průměr s .

Aplikace na měření výkonu počítače[]

Některé metriky počítačového výkonu, např. průměrná délka fronty procesů nebo průměrné vytížení procesoru, používají formu exponenciálního klouzavého průměru.

Zde je definován jako funkce času mezi dvěma odečty. Příkladem koeficientu, který dává větší váhu aktuálnímu odečtu a menší váhu starším odečtům, je tento koeficient

kde doba odečtu tn je vyjádřena v sekundách a je to časový úsek v minutách, za který se odečet zprůměruje (průměrná doba života každého odečtu v průměru). Vzhledem k výše uvedené definici , lze klouzavý průměr vyjádřit jako

Například 15minutový průměr L délky fronty procesů Q, měřený každých 5 sekund (časový rozdíl je 5 sekund), se vypočítá jako

Dalším vážením, které používají pojistní matematici, je Spencerův 15bodový klouzavý průměr (centrální klouzavý průměr). Symetrické váhové koeficienty jsou -3, -6, -5, 3, 21, 46, 67, 74, 67, 46, 21, 3, -5, -6, -3.

Mimo svět financí mají vážené běžecké prostředky mnoho podob a využití. Každá váhová funkce nebo „jádro“ má své vlastní charakteristiky. V technických a vědeckých oborech je frekvenční a fázová odezva filtru často prvořadá pro pochopení žádoucích a nežádoucích zkreslení, která bude konkrétní filtr na data aplikovat.

Průměrná hodnota není jen „vyhlazením“ dat. Průměr je forma dolnopropustného filtru. Pro vhodnou volbu je třeba pochopit účinky konkrétního použitého filtru. K tomuto bodu,
francouzská verze tohoto článku pojednává o spektrálních účincích 3 druhů průměrů (kumulativní, exponenciální, Gaussův).

Ze statistického hlediska je klouzavý průměr, pokud se používá k odhadu základního trendu v časové řadě, náchylný na vzácné události, jako jsou rychlé šoky nebo jiné anomálie. Robustnějším odhadem trendu je prostý klouzavý medián za n časových bodů:

kde se medián zjistí například seřazením hodnot uvnitř závorek a nalezením hodnoty uprostřed. Pro větší hodnoty n lze medián efektivně vypočítat aktualizací indexovatelného seznamu.

Statisticky je klouzavý průměr optimální pro obnovení základního trendu časové řady, pokud jsou fluktuace kolem trendu normálně rozděleny. Normální rozdělení však nepřikládá velkou pravděpodobnost velmi velkým odchylkám od trendu, což vysvětluje, proč takové odchylky budou mít neúměrně velký vliv na odhad trendu. Lze ukázat, že pokud se místo toho předpokládá, že fluktuace jsou rozděleny Laplaceovým rozdělením, pak je klouzavý medián statisticky optimální. Pro daný rozptyl přikládá Laplaceovo rozdělení větší pravděpodobnost vzácným událostem než normální, což vysvětluje, proč klouzavý medián snáší šoky lépe než klouzavý průměr.

Pokud je výše uvedený jednoduchý klouzavý medián centrální, je vyhlazení totožné s mediánovým filtrem, který se používá například při zpracování obrazových signálů.