Monday, 27 November 2017

Loess vs moving average


Istnieje szereg podejść do modelowania szeregów czasowych. Poniżej przedstawiamy kilka najczęstszych podejść. Trend, sezonowość, resztkowe dekompozycje Jedną z metod jest dekompozycja szeregu czasowego w trend, sezonowość i składnik resztkowy. Potrójne wyrównywanie wykładnicze jest przykładem tego podejścia. Inny przykład, nazywany sezonowym lessem, oparty jest na lokalnie ważonych najmniejszych kwadratach i jest dyskutowany przez Cleveland (1993). W tym podręczniku nie omawiamy sezonowych lessów. Metody oparte na częstotliwościach Kolejnym podejściem, powszechnie stosowanym w aplikacjach naukowych i inżynieryjnych, jest analiza serii w dziedzinie częstotliwości. Przykład tego podejścia do modelowania zestawu danych typu sinusoidalnego pokazano w studium przypadku ugięcia belki. Wykres spektralny jest podstawowym narzędziem do analizy częstotliwości szeregów czasowych. Modele autoregresyjne (AR) Wspólnym podejściem do modelowania jednowymiarowych szeregów czasowych jest model autoregresyjny (AR): Xt delta phi1 X phi2 X cdots phip X At, gdzie (Xt) jest szeregiem czasowym, (At) jest białym szumem, a delta left (1 - suma p phii right) mu. z (mu) oznaczającym średnią procesu. Model autoregresyjny jest po prostu regresją liniową bieżącej wartości szeregu względem jednej lub więcej wcześniejszych wartości serii. Wartość (p) nazywana jest rzędem modelu AR. Modele AR można analizować za pomocą jednej z różnych metod, w tym standardowych technik liniowych najmniejszych kwadratów. Mają również prostą interpretację. Modele średniej ruchomej (MA) Innym często stosowanym podejściem do modelowania modeli jednowymiarowych szeregów czasowych jest model średniej ruchomej (MA): Xt mu Atta theta1 A - theta2 A - cdots - thetaq A, gdzie (Xt) jest szeregiem czasowym, (mu ) jest średnią z serii, (A) są terminami białego szumu, a (theta1,, ldots,, thetaq) są parametrami modelu. Wartość (q) nazywa się rzędem modelu MA. Oznacza to, że model średniej ruchomej jest koncepcyjnie regresją liniową bieżącej wartości szeregu względem szumu białego lub losowych wstrząsów jednej lub więcej wcześniejszych wartości szeregu. Przyjmuje się, że losowe wstrząsy w każdym punkcie pochodzą z tego samego rozkładu, zwykle z rozkładu normalnego, z lokalizacją w punkcie zero i stałą skalą. Rozróżnienie w tym modelu polega na tym, że te losowe wstrząsy są propagowane do przyszłych wartości szeregu czasowego. Dopasowanie szacunków MA jest bardziej skomplikowane niż w przypadku modeli AR, ponieważ nie można zaobserwować warunków błędu. Oznacza to, że w miejsce liniowych najmniejszych kwadratów należy zastosować iteracyjne nieliniowe procedury dopasowania. Modele MA mają również mniej oczywistą interpretację niż modele AR. Czasami ACF i PACF zasugerują, że model MA byłby lepszym wyborem modelu i czasami zarówno warunki AR, jak i MA powinny być stosowane w tym samym modelu (patrz Rozdział 6.4.4.5). Należy jednak pamiętać, że terminy błędów po dopasowaniu modelu powinny być niezależne i zgodne ze standardowymi założeniami dla procesu jednowymiarowego. Box i Jenkins spopularyzowali podejście, które łączy podejście średniej ruchomej i podejścia autoregresyjnego w książce Time Series Analysis: Forecasting and Control (Box, Jenkins i Reinsel, 1994). Chociaż zarówno metody autoregresji, jak i średniej ruchomej były już znane (i były pierwotnie badane przez Yule), wkład Boxa i Jenkinsa polegał na opracowaniu systematycznej metodologii do identyfikacji i szacowania modeli, które mogłyby zawierać oba podejścia. To sprawia, że ​​modele Box-Jenkins są potężną klasą modeli. W następnych kilku sekcjach omówimy szczegółowo te modele. OPINIE jest jedną z wielu nowoczesnych metod modelowania opartych na klasycznych metodach, takich jak liniowa i nieliniowa regresja najmniejszych kwadratów. Nowoczesne metody regresji mają na celu rozwiązywanie sytuacji, w których klasyczne procedury nie działają dobrze lub nie mogą być skutecznie stosowane bez nieuzasadnionej pracy. LOESS łączy w sobie wiele prostoty regresji liniowych najmniejszych kwadratów z elastycznością regresji nieliniowej. Czyni to poprzez dopasowanie prostych modeli do zlokalizowanych podzbiorów danych w celu zbudowania funkcji opisującej deterministyczną część zmienności danych. punkt po punkcie. W rzeczywistości jedną z głównych atrakcji tej metody jest to, że analityk danych nie musi określać funkcji globalnej dowolnej formy, aby dopasować model do danych, tylko w celu dopasowania segmentów danych. Kompromisem na te funkcje jest zwiększenie obliczeń. Ponieważ jest ona tak intensywna obliczeniowo, LOESS byłaby praktycznie niemożliwa do użycia w erze, w której opracowywana była regresja najmniejszych kwadratów. Większość innych nowoczesnych metod modelowania procesów jest podobna do LOESS w tym zakresie. Metody te zostały świadomie zaprojektowane, aby wykorzystać naszą obecną zdolność obliczeniową do jak najpełniejszej przewagi, aby osiągnąć cele, które nie są łatwe do osiągnięcia dzięki tradycyjnemu podejściu. Definicja LOESS modelu LOESS, pierwotnie zaproponowana przez Cleveland (1979) i dalej rozwijana przez Cleveland i Devlin (1988). konkretnie oznacza metodę, która jest (nieco) bardziej opisowo nazywana regresją wielomianową lokalnie ważoną. W każdym punkcie zbioru danych wielomian niskiego stopnia pasuje do podzbioru danych, z wartościami zmiennych objaśniających w pobliżu punktu, którego odpowiedź jest szacowana. Wielomian jest dopasowywany przy użyciu ważonych najmniejszych kwadratów, dając większą wagę punktom w pobliżu punktu, którego odpowiedź jest szacowana, a mniejszej w punktach dalej. Wartość funkcji regresji dla punktu jest następnie uzyskiwana poprzez ocenę wielomianu lokalnego przy użyciu wartości zmiennych objaśniających dla tego punktu danych. Dopasowanie LOESS jest zakończone po obliczeniu wartości funkcji regresji dla każdego z punktów danych (n). Wiele szczegółów tej metody, takich jak stopień modelu wielomianowego i wagi, jest elastyczne. Zakres opcji dla każdej części metody i typowe wartości domyślne są krótko omówione poniżej. Zlokalizowane podzbiory danych Podzbiory danych używanych dla każdego ważonego najmniejszego kwadratu pasujące do parametru LOESS są określane przez najbliższy algorytm sąsiadów. Określone przez użytkownika dane wejściowe do procedury o nazwie parametr przepustowości lub wygładzania określają, ile danych jest używanych do dopasowania do każdego lokalnego wielomianu. Parametr wygładzania (q) to liczba pomiędzy ((d1) n) i (1), z (d) oznaczającą stopień lokalnego wielomianu. Wartość (q) to odsetek danych użytych w każdym dopasowaniu. Podzbiór danych używanych w każdym ważonym dopasowaniu najmniejszych kwadratów składa się z (nq) (zaokrąglonych do następnej największej liczby całkowitej) punktów, których wartości zmiennych objaśniających są najbliższe punktowi, w którym szacowana jest odpowiedź. (q) jest nazywany parametrem wygładzania, ponieważ kontroluje elastyczność funkcji regresji LOESS. Duże wartości (q) generują najgładsze funkcje, które najmniej poruszają się w odpowiedzi na fluktuacje danych. Im mniejsza (q), tym bliżej funkcja regresji będzie zgodna z danymi. Używanie zbyt małej wartości parametru wygładzania nie jest jednak pożądane, ponieważ funkcja regresji ostatecznie zacznie wychwytywać losowy błąd w danych. Przydatne wartości parametru wygładzania zwykle mieszczą się w zakresie od 0,25 do 0,5 dla większości aplikacji LOESS. Stopień lokalnych wielomianów Lokalne wielomiany pasujące do każdego podzbioru danych są prawie zawsze pierwszego lub drugiego stopnia, czyli lokalnie liniowego (w sensie liniowym) lub lokalnie kwadratowym. Użycie wielomianu o stopniu zero zamienia LOESS w ważoną średnią ruchomą. Taki prosty model lokalny może dobrze działać w niektórych sytuacjach, ale nie zawsze wystarczająco dobrze przybliża jego podstawową funkcję. Wielomiany wyższego stopnia działałyby teoretycznie, ale model wydajności, który nie jest tak naprawdę w duchu LOESS. LOESS opiera się na założeniu, że dowolna funkcja może być dobrze aproksymowana w małym sąsiedztwie przez wielomian niskiego rzędu i że proste modele mogą być łatwo dopasowane do danych. Wielomiany wysokiego stopnia miałyby skłonność do nadwyrężania danych w każdym podzbiorze i byłyby niestabilne numerycznie, co utrudniałoby dokładne obliczenia. Jak wspomniano powyżej, funkcja masy daje największą wagę punktom danych najbliżej punktu oszacowania, a najmniejszą wagę punktom danych, które znajdują się najdalej. Wykorzystanie wag opiera się na idei, że punkty znajdujące się blisko siebie w przestrzeni zmiennej objaśniającej są bardziej prawdopodobnie powiązane ze sobą w prosty sposób niż punkty, które są dalej od siebie oddalone. Zgodnie z tą logiką, punkty, które prawdopodobnie będą podążać za modelem lokalnym, mają największy wpływ na lokalne oszacowanie parametrów modelu. Punkty, które są mniej prawdopodobne, aby faktycznie odpowiadały modelowi lokalnemu, mają mniejszy wpływ na lokalne oszacowania parametrów modelu. Tradycyjną funkcją wagową używaną w funkcji LOESS jest funkcja masy kostki w kształcie trójkąta, w (x) w lewo (1 - x3) 3 mboxmike, pierwsza instalacja R (jeśli jeszcze nie), uruchom R i zainstaluj pakiet TeachingDemos (dokładnie od tego, w jaki sposób w twoim systemie), załaduj pakiet z biblioteką (TeachingDemos), a następnie wpisz loess. demo, aby wyświetlić stronę pomocy, aby zobaczyć, jak go uruchomić, możesz przewinąć do dołu, gdzie znajduje się przykład i skopiować i wkleić ten kod do polecenia R39s linii, aby zobaczyć przykłady, a następnie uruchom z własnymi danymi, aby dalej eksplorować. ndash Greg Snow Mar 23 12 o 17:15 Oto prosta, ale szczegółowa odpowiedź. Model liniowy pasuje do relacji poprzez wszystkie punkty danych. Ten model może być pierwszym rzędem (innym znaczeniem liniowym) lub wielomianem, aby uwzględnić krzywiznę, lub z wypustami, aby uwzględnić różne regiony mające inny model rządzenia. Dopasowanie LOESS to lokalnie przenoszona regresja ważona oparta na oryginalnych punktach danych. Co oznacza dopasowanie A LOESS, wpisuje oryginalne wartości X i Y, a także zestaw wyjściowych wartości X, dla których należy obliczyć nowe wartości Y (zazwyczaj te same wartości X są używane dla obu, ale często mniej wartości X są używane dla dopasowanych par XY ze względu na wymagane wyższe obliczenia). Dla każdej wyjściowej wartości X część danych wejściowych jest wykorzystywana do obliczenia dopasowania. Część danych, zwykle od 25 do 100, ale zazwyczaj 33 lub 50, jest lokalna, co oznacza, że ​​jest to część oryginalnych danych najbliżej każdej konkretnej wartości wyjściowej X. Jest to ruchome dopasowanie, ponieważ każda wyjściowa wartość X wymaga innego podzestawu oryginalnych danych o różnych masach (patrz następny akapit). Ten podzbiór wejściowych punktów danych służy do wykonywania ważonej regresji, z punktami najbliższymi wartości wyjściowej X o większej wadze. Ta regresja jest zwykle możliwa w przypadku pierwszego rzędu lub wyższej, ale wymaga większej mocy obliczeniowej. Wartość Y tej ważonej regresji obliczonej na wyjściu X jest używana jako wartość Y modelu dla tej wartości X. Regresja jest przeliczana przy każdej wartości wyjściowej X, aby wytworzyć pełny zestaw wyjściowych wartości Y. odpowiedź 21 lutego 15 o 21:08

No comments:

Post a Comment