Wednesday, 23 August 2017

Pindah rata pacf


Karakterisasi deret waktu melibatkan estimasi tidak hanya mean dan standar deviasi tetapi juga korelasi antara pengamatan yang terpisah pada waktunya. Pada fase identifikasi dari prosedur Box Jenkins autokorelasi empiris (ACF) serta fungsi autokorelasi parsial (PACF) adalah alat penting. Fungsi autokorelasi mengukur kekuatan hubungan antara dan. Misalnya jika mendekati satu, nilai yang tinggi akan diikuti dengan nilai tinggi besok. ACF adalah alat penting dalam mengidentifikasi urutan model time series bergerak rata-rata. Autokorelasi parsial mengukur kekuatan hubungan antara pengamatan dalam deret waktu yang mengendalikan efek intervensi periode waktu. Secara khusus, autokorelasi parsial berguna dalam mengidentifikasi urutan model autoregresif. Plot ACF dan PACF disebut correlogram. Statistik Ljung-Box (Q-statistik) pada lag k adalah statistik uji untuk hipotesis nol bahwa tidak ada autokorelasi sampai dengan urutan k. Definisinya adalah: terdistribusi secara asimtotik sebagai derajat kebebasan sama dengan jumlah autokorelasi. Autokorelasi dari rangkaian lag diperkirakan oleh: di mana mean sampel dari deret waktu. Autokorelasi parsial dari rangkaian diperkirakan oleh: Add-In ditulis dalam VBA. Semua link akan terbuka di jendela baru Xycoon, Time Series Analysis - Model ARIMA - Definisi Dasar dan Teorema tentang model ARIMA (HTML) mathworld. Deskripsi autokorelasi (HTML) Tautan ke situs lain dari halaman ini hanya untuk informasi dan Kurt Annen tidak bertanggung jawab atau bertanggung jawab atas akses ke, atau materi, situs mana pun yang terhubung dari atau ke situs ini. Untuk mendownload klik pada nama file The correlogram Add-In ditulis oleh Kurt Annen. Program ini bersifat freeware. Tapi saya sangat menghargai jika Anda bisa memberi saya penghargaan atas pekerjaan saya dengan memberi saya informasi tentang kemungkinan posisi terbuka sebagai ekonom. Fokus saya sebagai ekonom adalah pada ekonometri dan makroekonomi dinamis. Jika Anda menyukai program ini, tolong kirimi saya email. Correlogram excel add-in Langkah-langkah dalam memilih model peramalan Model peramalan Anda harus mencakup fitur yang menangkap semua sifat kualitatif penting dari data: pola variasi tingkat dan tren, efek inflasi dan musiman, korelasi antar variabel, dan sebagainya. Selain itu, Asumsi yang mendasari model pilihan Anda harus sesuai dengan intuisi Anda tentang bagaimana rangkaian ini cenderung berperilaku di masa depan. Saat memasang model peramalan, Anda memiliki beberapa pilihan berikut: Pilihan ini dijelaskan secara singkat di bawah ini. Lihat Bagan Peramalan Peramalan untuk tampilan bergambar dari model-spesifikasi proses, dan lihat kembali ke panel Spesifikasi Model Statgrafik untuk melihat bagaimana fitur model dipilih dalam perangkat lunak. Deflasi Jika seri menunjukkan pertumbuhan inflasi, maka deflasi akan membantu memperhitungkan pola pertumbuhan dan mengurangi heteroskedastisitas pada residu. Anda dapat (i) mengempiskan data masa lalu dan menyesuaikan kembali perkiraan jangka panjang pada tingkat asumsi konstan, atau (ii) mengempiskan data masa lalu dengan indeks harga seperti CPI, dan kemudian secara otomatis menentukan kembali perkiraan jangka panjang yang menggunakan Perkiraan indeks harga. Opsi (i) adalah yang termudah. Di Excel, Anda bisa membuat kolom formula untuk membagi nilai asli dengan faktor yang sesuai. Misalnya, jika datanya bulanan dan Anda ingin mengempis dengan kecepatan 5 per 12 bulan, Anda akan membagi dengan faktor (1,05) (k12) di mana k adalah indeks baris (nomor pengamatan). RegressIt dan Statigrafi memiliki alat built-in yang melakukan ini secara otomatis untuk Anda. Jika Anda pergi ke rute ini, biasanya lebih baik menetapkan tingkat inflasi yang diasumsikan sama dengan perkiraan terbaik tarif saat ini, terutama jika Anda akan meramalkan lebih dari satu periode di depan. Jika Anda memilih opsi (ii), pertama Anda harus menyimpan perkiraan dan batasan kepercayaan yang kempos ke spreadsheet data Anda, kemudian menghasilkan dan menyimpan perkiraan indeks harga, dan akhirnya memperbanyak kolom yang sesuai. (Kembali ke atas halaman.) Transformasi logaritma Jika rangkaian menunjukkan pertumbuhan majemuk dan atau pola musiman multiplikatif, transformasi logaritma dapat membantu selain atau pengganti deflasi. Logging data tidak akan meratakan pola pertumbuhan inflasi, namun akan meluruskannya sehingga dapat dipasang oleh model linier (misalnya model berjalan acak atau ARIMA dengan pertumbuhan konstan, atau model pemulusan eksponensial linier). Selain itu, penebangan akan mengubah pola musiman multiplikatif menjadi pola aditif, sehingga jika Anda melakukan penyesuaian musiman setelah melakukan penebangan, Anda harus menggunakan jenis aditif. Logging berkaitan dengan inflasi secara implisit jika Anda ingin inflasi dimodelkan secara eksplisit - yaitu. Jika Anda ingin tingkat inflasi menjadi parameter yang terlihat dari model atau jika Anda ingin melihat plot data yang kempes - maka Anda harus mengempis daripada log. Penggunaan penting lain untuk transformasi log adalah hubungan linier antara variabel dalam mode regresi l. Misalnya, jika variabel dependen adalah fungsi multiplikatif daripada aditif dari variabel independen, atau jika hubungan antara variabel dependen dan independen linier dalam hal perubahan persentase daripada perubahan absolut, maka penerapan transformasi log ke satu atau lebih variabel Mungkin tepat, seperti pada contoh penjualan bir. (Penyesuaian musiman Jika rangkaian memiliki pola musiman yang kuat yang diyakini konstan dari tahun ke tahun, penyesuaian musiman mungkin merupakan cara yang tepat untuk memperkirakan dan memperkirakan pola. Keuntungan penyesuaian musiman adalah model pola musiman secara eksplisit, memberi Anda pilihan untuk mempelajari indeks musiman dan data musiman yang disesuaikan. Kerugiannya adalah bahwa hal itu memerlukan estimasi sejumlah besar parameter tambahan (terutama untuk data bulanan), dan tidak memberikan dasar teoritis untuk perhitungan interval kepercayaan quotcorrectquot confidence. Validasi out-of-sample sangat penting untuk mengurangi risiko over-pas data masa lalu melalui penyesuaian musiman. Jika datanya sangat musiman namun Anda tidak memilih penyesuaian musiman, alternatifnya adalah untuk (i) menggunakan model ARIMA musiman. Yang secara implisit memperkirakan pola musiman menggunakan kelambanan musiman dan perbedaan, atau (ii) menggunakan model pemulusan eksponensial musiman Winters, yang memperkirakan indeks musiman bervariasi waktu. (Return to top of page.) QuotIndependentquot variables Jika ada deret waktu lain yang Anda yakini memiliki kekuatan penjelasan sehubungan dengan rangkaian minat Anda (misalnya indikator ekonomi atau variabel kebijakan terkemuka seperti harga, iklan, promosi, dll.) Anda Mungkin ingin mempertimbangkan regresi sebagai tipe model Anda. Apakah Anda memilih regresi atau tidak, Anda masih perlu mempertimbangkan kemungkinan yang disebutkan di atas untuk mengubah variabel Anda (deflasi, log, penyesuaian musiman - dan mungkin juga differencing) sehingga dapat memanfaatkan dimensi waktu dan membuat hubungan dengan mereka. Bahkan jika Anda tidak memilih regresi pada saat ini, Anda mungkin ingin mempertimbangkan untuk menambahkan regresor ke model time-series (misalnya model ARIMA) jika residu ternyata memiliki korelasi silang signficant dengan variabel lainnya. (Kembali ke atas halaman.) Jalan Smoothing, rata-rata, atau acak Jika Anda telah memilih menyesuaikan data secara musiman - atau jika datanya tidak musiman untuk dimulai - maka Anda mungkin ingin menggunakan model rata-rata atau merapikan Sesuai dengan pola nonseasonal yang tetap ada dalam data pada saat ini. Rata-rata pemindaian sederhana atau model pemulusan eksponensial sederhana hanya menghitung data rata-rata lokal pada akhir rangkaian, dengan asumsi bahwa ini adalah perkiraan terbaik dari nilai rata-rata saat ini dimana data berfluktuasi. (Model-model ini berasumsi bahwa rata-rata seri bervariasi secara perlahan dan acak tanpa tren yang terus-menerus.) Pemulusan eksponensial sederhana biasanya lebih disukai daripada rata-rata bergerak sederhana, karena rata-rata tertimbang eksponensialnya melakukan pekerjaan yang lebih masuk akal untuk mengurangi data yang lebih tua, karena Parameter smoothing (alpha) bersifat kontinu dan dapat segera dioptimalkan, dan karena memiliki dasar teoritis yang mendasari untuk menghitung interval kepercayaan. Jika merapikan atau rata-rata tampaknya tidak membantu - yaitu. Jika prediktor terbaik dari nilai berikutnya dari rangkaian waktu hanyalah nilai sebelumnya - maka model jalan acak ditunjukkan. Ini adalah kasusnya, misalnya, jika jumlah istilah optimal dalam rata-rata bergerak sederhana ternyata 1, atau jika nilai optimal alfa dalam perataan eksponensial sederhana ternyata adalah 0,9999. Pemulusan eksponensial linier Brown dapat digunakan untuk menyesuaikan rangkaian dengan tren linier yang bervariasi secara perlahan, namun berhati-hatilah untuk mengekstrapolasi tren semacam itu jauh ke masa depan. (Perputaran kepercayaan yang meluas dengan cepat untuk model ini memberi kesaksian akan ketidakpastian tentang masa depan yang jauh.) Holts smoothing linier juga memperkirakan tren yang bervariasi, namun menggunakan parameter terpisah untuk merapikan tingkat dan kecenderungan, yang biasanya memberikan kecocokan yang lebih baik pada data. Dari model Brown8217s. Q uadratic eksponensial smoothing mencoba untuk memperkirakan tren kuadrat bervariasi waktu, dan hampir tidak akan pernah digunakan. (Hal ini sesuai dengan model ARIMA dengan tiga urutan perbedaan nonseasonal.) Pemulusan eksponensial linier dengan tren yang teredam (yaitu tren yang merata di cakrawala jauh) sering direkomendasikan dalam situasi di mana masa depan sangat tidak pasti. Berbagai model pemulusan eksponensial adalah kasus khusus model ARIMA (dijelaskan di bawah) dan dapat dilengkapi dengan perangkat lunak ARIMA. Secara khusus, model smoothing eksponensial sederhana adalah model ARIMA (0,1,1), model pemulusan linier Holt8217 adalah model ARIMA (0,2,2), dan model tren teredam adalah ARIMA (1,1,2 ) model. Ringkasan yang baik dari persamaan berbagai model pemulusan eksponensial dapat ditemukan di halaman ini di situs web SAS. (Menu SAS untuk menentukan model rangkaian waktu juga ditunjukkan di sana. Mereka serupa dengan yang ada di Stategafika.) Model garis tren linier, kuadrat, atau eksponensial adalah opsi lain untuk mengekstrapolasi rangkaian deseasonalized, namun jarang mengungguli berjalan acak, merapikan, atau Model ARIMA pada data bisnis. (Musim kemarau ekspedisi eksponensial musiman adalah perpanjangan dari pemulusan eksponensial yang secara simultan memperkirakan tingkat variasi, tren, dan faktor musiman yang berbeda dengan menggunakan persamaan rekursif. (Jadi, jika Anda menggunakan model ini, Anda tidak akan menyesuaikan data secara musiman.) Faktor musiman Winters dapat berupa perkalian atau aditif: biasanya Anda harus memilih opsi perkalian kecuali Anda telah mencatat data. Meskipun model Winters pandai dan cukup intuitif, namun praktis menerapkannya: memiliki tiga parameter pemulusan - alfa, beta, dan gamma - untuk meratakan tingkat, tren, dan faktor musiman secara terpisah, yang harus diperkirakan serentak. Penentuan nilai awal untuk indeks musiman dapat dilakukan dengan menerapkan metode rata-rata rasio ke rata-rata penyesuaian musiman ke sebagian atau seluruh rangkaian dan atau dengan backforecasting. Algoritma estimasi yang digunakan Statgraphics untuk parameter ini terkadang gagal untuk menyatukan dan menghasilkan nilai yang memberi perkiraan dan interval kepercayaan yang aneh, jadi saya akan merekomendasikan kehati-hatian saat menggunakan model ini. (Kembali ke atas halaman.) ARIMA Jika Anda tidak memilih penyesuaian musiman (atau jika datanya tidak musiman), Anda mungkin ingin menggunakan kerangka model ARIMA. Model ARIMA adalah kelas model yang sangat umum yang mencakup jalan acak, tren acak, pemulusan eksponensial, dan model autoregresif sebagai kasus khusus. Kebijaksanaan konvensional adalah bahwa seri adalah kandidat yang baik untuk model ARIMA jika (i) dapat dipetakan dengan kombinasi antara differencing dan transformasi matematis lainnya seperti penebangan kayu, dan (ii) Anda memiliki sejumlah data yang cukup untuk bekerja dengan : Setidaknya 4 musim penuh dalam kasus data musiman. (Jika rangkaian tidak dapat dipetakan secara stasionerisasi dengan cara membedakan - misalnya jika sangat tidak beraturan atau tampaknya mengubah perilaku secara kualitatif dari waktu ke waktu - atau jika Anda memiliki data kurang dari 4 musim, mungkin Anda lebih baik dengan model Yang menggunakan penyesuaian musiman dan beberapa jenis rata-rata atau penghalusan sederhana.) Model ARIMA memiliki konvensi penamaan khusus yang diperkenalkan oleh Box and Jenkins. Model ARIMA nonseasonal diklasifikasikan sebagai model ARIMA (p, d, q), di mana d adalah jumlah perbedaan nonseasonal, p adalah jumlah istilah autoregresif (lag dari seri yang berbeda), dan q adalah jumlah moving - Istilah rata-rata (kelambatan dari kesalahan perkiraan) dalam persamaan prediksi. Model ARIMA musiman diklasifikasikan sebagai ARIMA (p, d, q) x (P, D, Q). Dimana D, P, dan Q adalah, masing-masing, jumlah perbedaan musiman, istilah autoregresif musiman (lags dari seri yang berbeda pada kelipatan periode musiman), dan rata-rata musiman moving average (lag dari kesalahan perkiraan pada kelipatan musiman periode). Langkah pertama dalam pemasangan model ARIMA adalah menentukan urutan differensiasi yang sesuai yang diperlukan untuk membuat stasioner seri dan menghapus fitur kotor musiman. Ini setara dengan menentukan model jalan acak-acak atau acak-acak mana yang memberikan titik awal terbaik. Jangan mencoba menggunakan lebih dari 2 total pesanan differencing (kombinasi non musiman dan musiman), dan jangan gunakan lebih dari 1 perbedaan musiman. Langkah kedua adalah menentukan apakah memasukkan istilah konstan dalam model: biasanya Anda menyertakan istilah konstan jika urutan total differensi adalah 1 atau kurang, jika tidak, Anda tidak. Dalam model dengan satu urutan differencing, istilah konstan mewakili tren rata-rata pada prakiraan. Dalam model dengan dua urutan differencing, tren dalam prakiraan ditentukan oleh tren lokal yang diamati pada akhir deret waktu, dan istilah konstan mewakili tren tren, yaitu kelengkungan jangka panjang, Perkiraan jangka panjang Biasanya berbahaya untuk melakukan ekstrapolasi tren-tren, jadi Anda menekan istilah contant dalam kasus ini. Langkah ketiga adalah memilih jumlah parameter rata-rata autoregresif dan moving average (p, d, q, P, D, Q) yang diperlukan untuk menghilangkan autokorelasi yang tertinggal dalam residual dari model naif (yaitu korelasi yang tersisa setelah Hanya differencing). Angka-angka ini menentukan jumlah lag dari deret yang berbeda dan atau lag dari kesalahan perkiraan yang termasuk dalam persamaan peramalan. Jika tidak ada autokorelasi yang signifikan pada residu pada saat ini, maka STOP, yang telah Anda lakukan: model terbaik adalah model naif Jika ada autokorelasi yang signifikan pada kelambatan 1 atau 2, Anda harus mencoba menyetel q1 jika salah satu dari hal berikut berlaku: I) ada perbedaan non musiman dalam model, (ii) autokorelasi lag 1 negatif. Andor (iii) plot otokorelasi residu tampak lebih bersih (lonjakan lebih sedikit dan lebih terisolasi) daripada plot otokorelasi parsial parsial. Jika tidak ada perbedaan musiman pada model dan jika autokorelasi lag 1 positif dan atau plot autokorelasi parsial sebagian terlihat lebih bersih, maka cobalah p1. (Kadang-kadang aturan untuk memilih antara konflik p1 dan q1 satu sama lain, dalam hal ini mungkin tidak banyak bedanya dengan yang Anda gunakan. Cobalah keduanya dan bandingkan). Jika ada autokorelasi pada lag 2 yang tidak dihilangkan dengan menyetel p1 Atau q1, Anda kemudian dapat mencoba p2 atau q2, atau kadang-kadang p1 dan q1. Lebih jarang Anda mungkin mengalami situasi di mana p2 atau 3 dan q1, atau sebaliknya, menghasilkan hasil terbaik. Sangat disarankan agar Anda tidak menggunakan pgt1 dan qgt1 dalam model yang sama. Secara umum, ketika memasang model ARIMA, Anda harus menghindari kompleksitas model yang meningkat agar hanya memperoleh sedikit perbaikan lebih lanjut pada statistik kesalahan atau tampilan plot ACF dan PACF. Juga, dalam model dengan kedua pgt1 dan qgt1, ada kemungkinan redundansi dan ketidak-mampuan yang baik antara sisi AR dan MA dari model, seperti yang dijelaskan dalam catatan pada struktur matematis model ARIMA. Biasanya lebih baik melangkah maju secara bertahap daripada melangkah mundur saat mengutak-atik spesifikasi model: mulailah dengan model yang lebih sederhana dan hanya menambahkan lebih banyak istilah jika ada kebutuhan yang jelas. Aturan yang sama berlaku untuk jumlah istilah autoregresif musiman (P) dan jumlah istilah rata-rata pergerakan musiman (Q) berkenaan dengan autokorelasi pada periode musiman (misalnya lag 12 untuk data bulanan). Coba Q1 jika sudah ada perbedaan musiman pada model dan jika autokorelasi musiman negatif dan atau plot autokorelasi residu terlihat lebih bersih di sekitar lag musiman jika tidak, coba P1. (Jika masuk akal bagi seri untuk menunjukkan musim yang kuat, maka Anda harus menggunakan perbedaan musiman, jika tidak, pola musiman akan pudar saat membuat perkiraan jangka panjang.) Kadang-kadang Anda mungkin ingin mencoba P2 dan Q0 atau wakil veteran, Atau PQ1. Namun, sangat disarankan agar PQ tidak pernah lebih besar dari 2. Pola musiman jarang memiliki keteraturan sempurna selama jumlah musim yang cukup besar sehingga memungkinkan untuk mengidentifikasi dan memperkirakan dengan pasti banyak parameter. Selain itu, algoritma backforecasting yang digunakan dalam estimasi parameter cenderung menghasilkan hasil yang tidak dapat diandalkan (atau bahkan gila) bila jumlah data musim tidak jauh lebih besar daripada PDQ. Saya akan merekomendasikan tidak kurang dari PDQ2 musim penuh, dan lebih baik. Sekali lagi, saat memasang model ARIMA, Anda harus berhati-hati untuk menghindari data yang terlalu pas, terlepas dari kenyataan bahwa ini sangat menyenangkan saat Anda memahaminya. Kasus khusus yang penting: Seperti disebutkan di atas, model ARIMA (0,1,1) tanpa konstan identik dengan model pemulusan eksponensial sederhana, dan mengasumsikan tingkat mengambang (yaitu tidak ada perubahan rata-rata) namun dengan nol tren jangka panjang. Model ARIMA (0,1,1) dengan konstanta adalah model pemulusan eksponensial sederhana dengan istilah linier nonzero linear yang disertakan. Model ARIMA (0,2,1) atau (0,2,2) tanpa konstanta adalah model pemulusan eksponensial linier yang memungkinkan tren waktu bervariasi. Model ARIMA (1,1,2) tanpa konstan adalah model pemulusan eksponensial linier dengan tren yang teredam, yaitu tren yang pada akhirnya merata dalam perkiraan jangka panjang. Model ARIMA musiman yang paling umum adalah model ARIMA (0,1,1) x (0,1,1) tanpa model konstan dan ARIMA (1,0,1) x (0,1,1) dengan konstanta. Mantan model ini pada dasarnya menerapkan pemulusan eksponensial ke komponen nonseasonal dan musiman dari pola dalam data sambil membiarkan tren bervariasi waktu, dan model yang terakhir agak mirip namun mengasumsikan tren linier konstan dan karena itu sedikit lebih lama. Prediksi prediktabilitas. Anda harus selalu menyertakan kedua model ini di antara jajaran tersangka saat melengkapi data dengan pola musiman yang konsisten. Salah satunya (mungkin dengan sedikit variasi seperti kenaikan p atau q oleh 1 dan jika setting P1 dan juga Q1) cukup sering yang terbaik. (Kembali ke atas halaman.) Mengidentifikasi jumlah istilah AR atau MA dalam model ARIMA plot ACF dan PACF: Setelah serangkaian waktu telah diposisikan oleh differencing, langkah selanjutnya dalam menyesuaikan model ARIMA adalah untuk menentukan apakah AR atau MA Syarat diperlukan untuk memperbaiki autokorelasi yang tersisa dalam rangkaian yang berbeda. Tentu saja, dengan perangkat lunak seperti Statgraphics, Anda bisa mencoba beberapa kombinasi istilah yang berbeda dan melihat apa yang terbaik. Tapi ada cara yang lebih sistematis untuk melakukan ini. Dengan melihat plot fungsi autokorelasi (ACF) dan parsial autokorelasi (PACF) dari seri yang berbeda, Anda dapat dengan ragu mengidentifikasi jumlah persyaratan AR andor MA yang dibutuhkan. Anda sudah terbiasa dengan plot ACF: ini hanyalah diagram batang dari koefisien korelasi antara deret waktu dan lag dari dirinya sendiri. Plot PACF adalah sebidang koefisien korelasi parsial antara seri dan lags dari dirinya sendiri. Secara umum, korelasi quotpartialquot antara dua variabel adalah jumlah korelasi di antara keduanya yang tidak dijelaskan oleh korelasi timbal baliknya dengan seperangkat variabel lain yang ditentukan. Sebagai contoh, jika kita mengurutkan variabel Y pada variabel lain X1, X2, dan X3, korelasi parsial antara Y dan X3 adalah jumlah korelasi antara Y dan X3 yang tidak dijelaskan oleh korelasi umum mereka dengan X1 dan X2. Korelasi parsial ini dapat dihitung sebagai akar kuadrat dari pengurangan varians yang dicapai dengan menambahkan X3 ke regresi Y pada X1 dan X2. Korelasi otomatis parsial adalah jumlah korelasi antara variabel dan lag dari dirinya sendiri yang tidak dijelaskan oleh korelasi pada semua lower-order - lags. Autokorelasi suatu deret waktu Y pada lag 1 adalah koefisien korelasi antara Y t dan Y t - 1. Yang diduga juga korelasi antara Y t -1 dan Y t -2. Tapi jika Y t berkorelasi dengan Y t -1. Dan Y t -1 sama berkorelasi dengan Y t -2. Maka kita juga harus mengharapkan untuk menemukan korelasi antara Y t dan Y t-2. Sebenarnya, jumlah korelasi yang harus kita harapkan pada lag 2 adalah kuadrat korelasi lag-1. Dengan demikian, korelasi pada lag 1 quotpropagatesquot ke lag 2 dan mungkin ke lags tingkat tinggi. Autokorelasi parsial pada lag 2 oleh karena itu adalah perbedaan antara korelasi aktual pada lag 2 dan korelasi yang diharapkan karena propagasi korelasi pada lag 1. Berikut adalah fungsi autokorelasi (ACF) dari rangkaian UNITS, sebelum dilakukan differensiasi: Autokorelasi signifikan untuk sejumlah besar kelambatan - tapi mungkin autokorelasi pada lag 2 dan di atas hanya karena propagasi autokorelasi pada lag 1. Hal ini dikonfirmasi oleh plot PACF: Perhatikan bahwa plot PACF memiliki signifikan Lonjakan hanya pada lag 1, yang berarti bahwa semua otokorelasi orde tinggi secara efektif dijelaskan oleh autokorelasi lag-1. Autokorelasi parsial sama sekali kelambatan dapat dihitung dengan menyesuaikan suksesi model autoregresif dengan meningkatnya jumlah kelambatan. Secara khusus, autokorelasi parsial pada lag k sama dengan koefisien AR (k) yang diperkirakan dalam model autoregresif dengan istilah k - i. Model regresi berganda dimana Y mengalami regresi pada LAG (Y, 1), LAG (Y, 2), dan seterusnya sampai LAG (Y, k). Jadi, dengan hanya melihat PACF, Anda dapat menentukan berapa banyak istilah AR yang perlu Anda gunakan untuk menjelaskan pola autokorelasi dalam rangkaian waktu: jika autokorelasi parsial signifikan pada lag k dan tidak signifikan pada tingkat yang lebih tinggi yang tertinggal - yaitu. Jika PACF quotcuts offquot pada lag k - maka ini menunjukkan bahwa Anda harus mencoba model autoregresif pesanan yang sesuai. P PACF dari seri UNITS memberikan contoh ekstrem dari fenomena cut-off: ia memiliki lonjakan yang sangat besar pada lag 1 Dan tidak ada lonjakan penting lainnya, yang menunjukkan bahwa dengan tidak adanya perbedaan model AR (1) harus digunakan. Namun, istilah AR (1) dalam model ini akan berubah menjadi setara dengan perbedaan pertama, karena koefisien AR (1) yang diperkirakan (yang merupakan puncak lonjakan PACF pada lag 1) hampir sama dengan 1 Sekarang, persamaan peramalan untuk model AR (1) untuk rangkaian Y tanpa urutan differensi adalah: Jika koefisien AR (1) 981 1 dalam persamaan ini sama dengan 1, maka ekuivalen untuk memprediksi bahwa perbedaan pertama Y konstan - yaitu Itu setara dengan persamaan model jalan acak dengan pertumbuhan: PACF seri UNITS memberi tahu kita bahwa, jika kita tidak membedakannya, maka kita harus menyesuaikan model AR (1) yang akan berubah menjadi setara dengan pengambilan Perbedaan pertama Dengan kata lain, ini memberitahu kita bahwa UNITS benar-benar membutuhkan perintah untuk membedakannya dengan penempatan. Tanda tangan AR dan MA: Jika PACF menampilkan potongan tajam saat peluruhan ACF melambat lebih lambat (yaitu memiliki lonjakan signifikan pada kelambatan yang lebih tinggi), kami mengatakan bahwa rangkaian stasioner menampilkan tanda kutip tanda kutip, yang berarti bahwa pola autokorelasi dapat dijelaskan dengan lebih mudah. Dengan menambahkan istilah AR daripada menambahkan istilah MA. Anda mungkin akan menemukan bahwa tanda tangan AR biasanya dikaitkan dengan autokorelasi positif pada lag 1 - i. e. Itu cenderung muncul secara seri yang sedikit berbeda. Alasan untuk ini adalah bahwa istilah AR dapat bertindak seperti perbedaan harga belantara dalam persamaan peramalan. Sebagai contoh, dalam model AR (1), istilah AR bertindak seperti perbedaan pertama jika koefisien autoregresif sama dengan 1, ia tidak melakukan apa-apa jika koefisien autoregresif nol, dan ia bertindak seperti perbedaan parsial jika koefisiennya antara 0 dan 1. Jadi, jika rangkaian ini sedikit kurang seragam - misalnya Jika pola autokorelasi positif nonstasioner belum sepenuhnya dieliminasi, maka akan dikutip beberapa perbedaan parsial dengan menampilkan tanda tangan AR. Oleh karena itu, kami memiliki aturan praktis berikut untuk menentukan kapan harus menambahkan persyaratan AR: Aturan 6: Jika PACF dari seri yang berbeda menunjukkan cutoff yang tajam dan jika autokorelasi lag-1 positif - i. Jika seri muncul sedikit quotunderdifferencedquot - maka pertimbangkan untuk menambahkan istilah AR ke model. Keterlambatan di mana pemotongan PACF adalah jumlah AR yang ditunjukkan. Pada prinsipnya, setiap pola autokorelasi dapat dilepaskan dari rangkaian stasioner dengan menambahkan istilah autoregresif yang cukup (tertinggal dari rangkaian stasioner) ke persamaan peramalan, dan PACF memberi tahu Anda berapa banyak istilah semacam itu yang mungkin diperlukan. Namun, ini tidak selalu merupakan cara termudah untuk menjelaskan pola autokorelasi yang ada: terkadang lebih efisien untuk menambahkan istilah MA (kelambatan dari kesalahan perkiraan). Fungsi autokorelasi (ACF) memainkan peran yang sama untuk istilah MA yang dimainkan PACF untuk istilah AR - yaitu, ACF memberi tahu Anda berapa banyak persyaratan MA yang diperlukan untuk menghapus autokorelasi yang tersisa dari rangkaian yang berbeda. Jika autokorelasi signifikan pada lag k namun tidak pada kelambatan yang lebih tinggi - yaitu. Jika permintaan ACF offquot pada lag k - ini menunjukkan bahwa tepat istilah MA harus digunakan dalam persamaan peramalan. Dalam kasus terakhir, kita mengatakan bahwa seri stasioner menampilkan tanda tangan kuota, yang berarti bahwa pola autokorelasi dapat dijelaskan dengan lebih mudah dengan menambahkan persyaratan MA daripada dengan menambahkan istilah AR. Tanda tangan MA biasanya dikaitkan dengan autokorelasi negatif pada lag 1 - i. e. Ini cenderung muncul secara seri yang sedikit berbeda. Alasan untuk ini adalah bahwa istilah MA dapat membatalkan secara kuartalan suatu urutan differensi dalam persamaan peramalan. Untuk melihat ini, ingatlah bahwa model ARIMA (0,1,1) tanpa konstan sama dengan model Simple Exponential Smoothing. Persamaan peramalan untuk model ini adalah dimana koefisien MA (1) 952 1 sesuai dengan kuantitas 1 - 945 dalam model SES. Jika 952 1 sama dengan 1, ini sesuai dengan model SES dengan 945 0, yang hanya merupakan model CONSTANT karena ramalan tidak pernah diperbarui. Ini berarti bahwa ketika 952 1 sama dengan 1, ini benar-benar membatalkan operasi differencing yang biasanya memungkinkan perkiraan SES untuk memasang kembali jangkar pada pengamatan terakhir. Di sisi lain, jika koefisien pergerakan rata-rata sama dengan 0, model ini mengurangi model jalan acak - yaitu. Itu meninggalkan operasi differencing sendirian. Jadi, jika 952 1 adalah sesuatu yang lebih besar dari 0, seolah-olah kita secara parsial membatalkan suatu urutan differencing. Jika seri ini sudah sedikit berbeda - yaitu. Jika autokorelasi negatif telah diperkenalkan - maka akan dikutip untuk mendapatkan suatu perbedaan yang sebagian dibatalkan dengan menampilkan tanda tangan MA. (Banyak pelebaran lengan yang terjadi di sini Penjelasan yang lebih ketat mengenai efek ini dapat ditemukan di lembar Model ARIMA Model Matematika.) Oleh karena itu, aturan tambahan berikut ini: Aturan 7: Jika ACF dari seri yang berbeda menampilkan Cutoff tajam dan jika autokorelasi lag-1 negatif - saya Jika seri muncul sedikit quotoverdifferencedquot - maka pertimbangkan untuk menambahkan istilah MA ke model. Keterlambatan di mana pemotongan ACF adalah jumlah MA yang ditunjukkan. Sebuah model untuk seri UNITS - ARIMA (2,1,0): Sebelumnya, kami menetapkan bahwa rangkaian UNITS memerlukan paling tidak satu urutan perbedaan nonseasonal yang akan diposisikan. Setelah mengambil satu perbedaan nonseasonal - yaitu. Pas dengan model ARIMA (0,1,0) dengan konstan - plot ACF dan PACF terlihat seperti ini: Perhatikan bahwa (a) korelasi pada lag 1 signifikan dan positif, dan (b) PACF menunjukkan kuotot kuotasi lebih tajam daripada ACF. Secara khusus, PACF hanya memiliki dua lonjakan yang signifikan, sementara ACF memiliki empat lonjakan yang signifikan. Jadi, menurut Aturan 7 di atas, seri yang berbeda menunjukkan tanda tangan AR (2). Jika demikian, kami menetapkan urutan istilah AR menjadi 2 - i. e. Sesuai dengan model ARIMA (2,1,0) - kita mendapatkan plot ACF dan PACF berikut untuk residual: Autokorelasi pada kelambatan penting - yaitu lags 1 dan 2 - telah dieliminasi, dan tidak ada pola yang dapat dilihat. Dalam kelambatan yang lebih tinggi. Rangkaian time series dari residual menunjukkan kecenderungan yang sedikit mengkhawatirkan untuk mengembara jauh dari mean: Namun, laporan ringkasan analisis menunjukkan bahwa model tersebut tetap berkinerja cukup baik pada periode validasi, kedua koefisien AR secara signifikan berbeda dari nol, dan standar Penyimpangan residu telah berkurang dari 1,54371 menjadi 1,4215 (hampir 10) dengan penambahan istilah AR. Selanjutnya, tidak ada tanda-tanda kuadrat kuota karena jumlah koefisien AR (0.2522540.195572) tidak mendekati 1. (Akar unit dibahas lebih rinci di bawah ini.) Secara keseluruhan, ini tampaknya merupakan model yang baik. . Prediksi (yang tidak diterjemahkan) untuk model tersebut menunjukkan tren kenaikan linier yang diproyeksikan ke masa depan: Tren dalam perkiraan jangka panjang disebabkan oleh fakta bahwa model tersebut mencakup satu perbedaan nonseasonal dan istilah konstan: model ini pada dasarnya adalah perjalanan acak dengan Pertumbuhan diimbangi dengan penambahan dua istilah autoregresif - yaitu Dua lag dari seri yang berbeda. Kemiringan perkiraan jangka panjang (yaitu kenaikan rata-rata dari satu periode ke periode lainnya) sama dengan istilah rata-rata dalam ringkasan model (0.467566). Persamaan peramalan adalah: di mana 956 adalah istilah konstan dalam ringkasan model (0,258178), 981 1 adalah koefisien AR (1) (0,25224) dan 981 2 adalah koefisien AR (2) (0.195572). Mean versus constant: Secara umum, istilah quotmeanquot dalam output dari model ARIMA mengacu pada mean dari seri yang berbeda (yaitu tren rata-rata jika urutan differencing sama dengan 1), sedangkan kuotentrekuensi adalah istilah konstan yang muncul Di sisi kanan persamaan peramalan. Istilah rata-rata dan konstan dihubungkan dengan persamaan: CONSTANT MEAN (1 dikurangi jumlah koefisien AR). Dalam kasus ini, kita memiliki 0,258178 0,467566 (1 - 0,25224 - 0,1995572) Model alternatif untuk seri UNITS - ARIMA (0,2,1): Ingat bahwa ketika kita mulai menganalisis rangkaian UNITS, kami tidak sepenuhnya yakin dengan Urutan yang benar dari differencing untuk digunakan Satu urutan perbedaan nonseasonal menghasilkan deviasi standar terendah (dan pola autokorelasi positif ringan), sementara dua urutan perbedaan nonseasonal menghasilkan rangkaian seri waktu yang lebih stasioner (tapi dengan autokorelasi negatif yang agak kuat). Berikut adalah kedua ACF dan PACF dari seri dengan dua perbedaan nonseasonal: Lonjakan negatif tunggal pada lag 1 di ACF adalah tanda tangan MA (1), sesuai dengan Peraturan 8 di atas. Jadi, jika kita menggunakan 2 perbedaan nonseasonal, kita juga ingin memasukkan istilah MA (1), menghasilkan model ARIMA (0,2,1). Menurut Aturan 5, kita juga ingin menekan istilah konstan. Inilah hasil dari sebuah model ARIMA (0,2,1) tanpa konstan: Perhatikan bahwa estimasi white noise standard deviation (RMSE) hanya sedikit lebih tinggi untuk model ini daripada yang sebelumnya (1.46301 di sini versus 1.45215 sebelumnya). Persamaan peramalan untuk model ini adalah: dimana theta-1 adalah koefisien MA (1). Ingat bahwa ini serupa dengan model Linear Exponential Smoothing, dengan koefisien MA (1) sesuai dengan kuantitas 2 (1-alfa) pada model LES. Koefisien MA (1) sebesar 0,76 pada model ini menunjukkan bahwa model LES dengan alpha di sekitar 0,72 akan sesuai dengan sama baiknya. Sebenarnya, bila model LES dipasang pada data yang sama, nilai alfa optimal ternyata sekitar 0,61, yang tidak terlalu jauh. Berikut adalah laporan perbandingan model yang menunjukkan hasil pemasangan model ARIMA (2,1,0) dengan konstan, model ARIMA (0,2,1) tanpa konstan, dan model LES: Ketiga model tersebut tampil hampir sama dengan Periode estimasi, dan model ARIMA (2,1,0) dengan konstan tampak sedikit lebih baik daripada dua lainnya pada periode validasi. Atas dasar hasil statistik ini saja, akan sulit untuk memilih di antara ketiga model tersebut. Namun, jika kita merencanakan perkiraan jangka panjang yang dibuat oleh model ARIMA (0,2,1) tanpa konstan (yang pada dasarnya sama dengan model LES), kita melihat perbedaan yang signifikan dari model sebelumnya: Perkiraan tersebut cenderung sedikit meningkat dari pada model sebelumnya - karena tren lokal di dekat akhir seri sedikit kurang dari tren rata-rata sepanjang keseluruhan rangkaian - namun interval kepercayaan melebar jauh lebih cepat. Model dengan dua urutan differencing mengasumsikan bahwa tren dalam rangkaian adalah waktu yang bervariasi, oleh karena itu mempertimbangkan masa depan yang jauh jauh lebih tidak pasti daripada model dengan hanya satu urutan differencing. Model mana yang harus kita pilih Itu tergantung dari asumsi yang kita buat dengan nyaman sehubungan dengan keteguhan tren data. Model dengan hanya satu urutan differencing mengasumsikan tren rata-rata konstan - pada dasarnya adalah model berjalan acak yang disesuaikan dengan pertumbuhan - dan oleh karena itu membuat proyeksi tren yang relatif konservatif. Hal ini juga cukup optimis tentang keakuratan yang bisa diperkirakan lebih dari satu periode ke depan. Model dengan dua perintah differencing mengasumsikan tren lokal yang bervariasi waktu - pada dasarnya adalah model pemulusan eksponensial linier - dan proyeksi trennya agak lebih berubah-ubah. Sebagai aturan umum dalam situasi seperti ini, saya akan merekomendasikan untuk memilih model dengan urutan differensiasi yang lebih rendah, hal lain kira-kira sama. Dalam prakteknya, model random-walk atau simple-exponential-smoothing seringkali tampak bekerja lebih baik daripada model pemulusan eksponensial linier. Model campuran: Dalam kebanyakan kasus, model terbaik menghasilkan model yang menggunakan hanya istilah AR atau hanya persyaratan MA, walaupun dalam beberapa kasus model quotmixedquot dengan persyaratan AR dan MA mungkin paling sesuai dengan data. Namun, perawatan harus dilakukan saat menyesuaikan model campuran. Ada kemungkinan istilah AR dan istilah MA untuk saling membatalkan efek satu sama lain. Meskipun keduanya mungkin tampak signifikan dalam model (sebagaimana dinilai oleh statistik t dari koefisien mereka). Jadi, misalnya, anggaplah bahwa model quotcorrectquot untuk deret waktu adalah model ARIMA (0,1,1), namun Anda sesuai dengan model ARIMA (1,1,2) - yaitu. Anda memasukkan satu istilah AR tambahan dan satu istilah MA tambahan. Kemudian istilah tambahan mungkin akan muncul dalam model yang signifikan, namun secara internal mereka mungkin hanya saling bertabrakan. Perkiraan parameter yang dihasilkan mungkin ambigu, dan proses estimasi parameter mungkin memerlukan banyak (misalnya lebih dari 10) iterasi untuk bertemu. Oleh karena itu: Aturan 8: Ada kemungkinan istilah AR dan istilah MA untuk membatalkan efek satu sama lain, jadi jika model AR-MA campuran tampaknya sesuai dengan data, cobalah juga model dengan satu istilah AR yang lebih sedikit dan satu istilah MA yang lebih sedikit - Khususnya jika perkiraan parameter pada model asli memerlukan lebih dari 10 iterasi untuk bertemu. Untuk alasan ini, model ARIMA tidak dapat diidentifikasi dengan pendekatan quantwise stepwisequot yang mencakup istilah AR dan MA. Dengan kata lain, Anda tidak dapat memulai dengan memasukkan beberapa istilah dalam masing-masing jenis dan kemudian membuang yang koefisien estimasinya tidak signifikan. Sebagai gantinya, Anda biasanya mengikuti pendekatan stepwisequot singkat, menambahkan istilah satu jenis atau yang lainnya seperti yang ditunjukkan oleh tampilan plot ACF dan PACF. Akar unit: Jika rangkaian terlalu kurang atau terlalu berbeda - yaitu. Jika seluruh urutan differencing perlu ditambahkan atau dibatalkan, ini sering ditandai oleh kuota akar kuadrat pada koefisien AR atau MA yang diperkirakan dari model. Model AR (1) dikatakan memiliki satuan akar jika koefisien AR (1) hampir sama persis dengan 1. (Dengan quotexactly sama dengan ku, saya benar-benar bermaksud tidak berbeda secara signifikan dari koefisien kesalahan standarnya sendiri. ) Bila ini terjadi, berarti istilah AR (1) tepat meniru perbedaan pertama, dalam hal ini Anda harus menghapus istilah AR (1) dan menambahkan urutan differencing sebagai gantinya. (Ini adalah apa yang akan terjadi jika Anda memasang model AR (1) ke rangkaian UNITS yang tidak disamakan, seperti yang telah disebutkan sebelumnya.) Dalam model AR orde tinggi, akar unit ada di bagian AR model jika jumlah Koefisien AR sama persis dengan 1. Dalam hal ini Anda harus mengurangi urutan istilah AR dengan 1 dan menambahkan urutan differencing. Seri waktu dengan akar unit pada koefisien AR adalah nonstasioner - i. Perlu urutan yang lebih tinggi dari differencing. Aturan 9: Jika ada akar unit di bagian AR model - yaitu. Jika jumlah koefisien AR hampir tepat 1 - Anda harus mengurangi jumlah istilah AR dengan satu dan meningkatkan urutan differencing oleh satu. Demikian pula, model MA (1) dikatakan memiliki akar unit jika koefisien MA (1) diperkirakan sama dengan 1. Bila ini terjadi, berarti istilah MA (1) benar-benar membatalkan perbedaan pertama, dalam Yang mana, Anda harus menghapus MA (1) istilah dan juga mengurangi urutan differencing oleh satu. Dalam model MA tingkat tinggi, akar unit ada jika jumlah koefisien MA sama persis dengan 1. Aturan 10: Jika ada akar unit di bagian MA model - yaitu. Jika jumlah koefisien MA hampir tepat 1 - Anda harus mengurangi jumlah persyaratan MA dengan satu dan mengurangi urutan perbedaan satu. Misalnya, jika Anda sesuai dengan model pemulusan eksponensial linier (model ARIMA (0,2,2)) bila model pemulusan eksponensial sederhana (model ARIMA (0,1,1)) sudah cukup, Anda mungkin merasa Jumlah dari dua koefisien MA sangat hampir sama dengan 1. Dengan mengurangi urutan MA dan urutan differencing masing-masing, Anda mendapatkan model SES yang lebih sesuai. Model peramalan dengan akar unit dalam koefisien MA yang diperkirakan dikatakan tidak dapat diubah. Yang berarti bahwa residu model tidak dapat dianggap sebagai perkiraan dari noise acak kuadratquot yang menghasilkan deret waktu. Gejala lain dari akar unit adalah bahwa prakiraan model dapat meniru upquot atau berperilaku aneh. Jika plot deret waktu prakiraan model jangka panjang terlihat aneh, Anda harus memeriksa koefisien perkiraan model Anda untuk mengetahui adanya akar unit. Aturan 11: Jika prakiraan jangka panjang tampak tidak menentu atau tidak stabil, mungkin ada akar unit dalam koefisien AR atau MA. Tak satu pun dari masalah ini muncul dengan kedua model yang dipasang di sini, karena kami berhati-hati untuk mulai dengan perintah differencing dan koefisien AR dan MA yang sesuai dengan mempelajari model ACF dan PACF. Pembahasan lebih rinci tentang akar unit dan efek pembatalan antara istilah AR dan MA dapat ditemukan dalam struktur Matematika handel ARIMA Model.

No comments:

Post a Comment