Monday 14 August 2017

Autoregressive moving average model excel


ARMA Unplugged Ini adalah entri pertama dalam rangkaian tutorial Unplugged kami, di mana kami menyelidiki detail dari setiap model deret waktu yang sudah Anda kenal, menyoroti asumsi yang mendasari dan mengarahkan pulang intuisi di belakangnya. Dalam masalah ini, kita menangani model ARMA sebagai landasan dalam pemodelan time series. Tidak seperti masalah analisis sebelumnya, kita akan mulai dengan definisi proses ARMA, menyatakan input, output, parameter, batasan stabilitas, asumsi, dan akhirnya menarik beberapa panduan untuk proses pemodelan. Latar Belakang Menurut definisi, auto-regressive moving average (ARMA) adalah proses stokastik stasioner yang terdiri dari jumlah Excel autoregresif dan komponen rata-rata bergerak. Sebagai alternatif, dalam formulasi sederhana: Asumsi Mari kita lihat lebih dekat pada formulasi. Proses ARMA hanyalah jumlah tertimbang dari pengamatan dan guncangan keluaran terakhir, dengan beberapa asumsi utama: Asumsi apa yang dimaksud dengan satu proses stokastik adalah pendamping proses deterministik yang menggambarkan evolusi suatu variabel acak dari waktu ke waktu. Dalam kasus kami, variabel acaknya adalah Proses ARMA hanya menangkap korelasi serial (yaitu auto-correlation) antara pengamatan. Dengan kata lain, proses ARMA meringkas nilai-nilai pengamatan masa lalu, bukan nilai kuadrat atau logaritma mereka, dan lain-lain. Ketergantungan orde yang lebih tinggi mengamanatkan proses yang berbeda (misalnya ARCHGARCH, model non-linear, dll.). Ada banyak contoh proses stokastik di mana nilai masa lalu mempengaruhi arus saat ini. Misalnya, di kantor penjualan yang menerima RFQ secara terus menerus, beberapa direalisasikan sebagai penjualan-dimenangkan, beberapa dijual hilang, dan beberapa tumpah ke bulan depan. Akibatnya, pada bulan tertentu, beberapa kasus yang berhasil diraih berasal dari RFQ atau penjualan berulang dari bulan-bulan sebelumnya. Apa guncangan, inovasi atau istilah kesalahan Ini adalah pertanyaan yang sulit, dan jawabannya tidak kalah membingungkan. Tetap saja, mari kita mencobanya: Dengan kata sederhana, istilah kesalahan dalam model yang diberikan adalah keranjang tangkapan semua untuk semua variasi yang tidak dijelaskan oleh model. Masih hilang Mari kita gunakan sebuah contoh. Untuk proses harga saham, mungkin ada ratusan faktor yang mendorong tingkat kenaikan harga, termasuk: Pengumuman Dividen dan Pembagian Laporan pendapatan kuartalan Kegiatan penggabungan dan akuisisi (MampA) Peristiwa hukum, mis. Ancaman gugatan class action. Lain-lain Model, disain, adalah penyederhanaan kenyataan yang kompleks, jadi apapun yang kita tinggalkan di luar model secara otomatis digabungkan dalam istilah kesalahan. Proses ARMA mengasumsikan bahwa efek kolektif dari semua faktor tersebut bertindak kurang lebih seperti noise Gaussian. Mengapa kita peduli dengan guncangan masa lalu Tidak seperti model regresi, terjadinya stimulus (misalnya shock) mungkin berpengaruh pada tingkat saat ini, dan kemungkinan tingkat di masa depan. Misalnya, acara perusahaan (misalnya aktivitas MampA) memengaruhi harga saham perusahaan bawahan, namun perubahan tersebut mungkin memerlukan beberapa waktu untuk memiliki dampak penuh, karena pelaku pasar menyerap informasi yang ada dan bereaksi sesuai dengan itu. Hal ini menimbulkan pertanyaan: tidakkah nilai masa lalu dari output sudah memiliki guncangan informasi masa lalu YA, sejarah kejutan sudah dicatat pada tingkat keluaran terakhir. Model ARMA dapat diwakili hanya sebagai model auto-regressive (AR) murni, namun persyaratan penyimpanan sistem semacam itu tidak terbatas. Inilah satu-satunya alasan untuk memasukkan komponen MA: untuk menghemat penyimpanan dan menyederhanakan perumusannya. Sekali lagi, proses ARMA harus stasioner untuk varian marjinal (tidak bersyarat) ada. Catatan: Dalam pembahasan saya di atas, saya tidak membuat perbedaan antara hanya tidak adanya akar unit dalam persamaan karakteristik dan keterpaduan proses. Mereka terkait, tapi tidak adanya akar unit bukanlah jaminan keterpaduan. Meski begitu, akar unit harus berada di dalam lingkaran unit agar akurat. Kesimpulan Mari kita rekap apa yang telah kita lakukan sejauh ini. Pertama, kami memeriksa proses ARMA stasioner, beserta persyaratan formulasi, masukan, asumsi, dan penyimpanannya. Selanjutnya, kami menunjukkan bahwa proses ARMA menggabungkan nilai keluarannya (korelasi otomatis) dan guncangan yang dialami sebelumnya pada keluaran saat ini. Akhirnya, kami menunjukkan bahwa proses ARMA stasioner menghasilkan rangkaian waktu dengan mean dan varian jangka panjang yang stabil. Dalam analisis data kami, sebelum mengajukan model ARMA, kami harus memverifikasi asumsi stasioneritas dan persyaratan memori yang terbatas. Jika rangkaian data menunjukkan tren deterministik, kita perlu menghapus (de-trend) terlebih dahulu, lalu gunakan residu untuk ARMA. Jika kumpulan data menunjukkan tren stokastik (misalnya berjalan acak) atau musiman, kita perlu menjamu ARIMASARIMA. Akhirnya, correlogram (yaitu ACFPACF) dapat digunakan untuk mengukur kebutuhan memori model yang harus kita harapkan baik ACF atau PACF untuk membusuk dengan cepat setelah beberapa kelambatan. Jika tidak, ini bisa menjadi pertanda non-stasioneritas atau pola jangka panjang (misalnya ARFIMA).ARIMA Peramalan dengan Excel dan R Halo Hari Ini Saya akan memandu Anda melalui pengantar model ARIMA dan komponennya, juga Sebagai penjelasan singkat tentang metode Box-Jenkins tentang bagaimana model ARIMA ditentukan. Terakhir, saya membuat sebuah implementasi Excel dengan menggunakan R, yang mana akan menunjukkan kepada Anda bagaimana cara mengatur dan menggunakannya. Model Autoregressive Moving Average (ARMA) Model Autoregressive Moving Average digunakan untuk pemodelan dan peramalan stasioner, proses deret stok stokastik. Ini adalah kombinasi dari dua teknik statistik yang dikembangkan sebelumnya, model Autoregressive (AR) dan Moving Average (MA) dan pada awalnya digambarkan oleh Peter Whittle pada tahun 1951. George E. P. Box dan Gwilym Jenkins mempopulerkan model ini pada tahun 1971 dengan menentukan langkah-langkah terpisah untuk identifikasi model, estimasi, dan verifikasi. Proses ini akan dijelaskan kemudian untuk referensi. Kami akan mulai dengan mengenalkan model ARMA dengan berbagai komponennya, model AR, dan MA dan kemudian menyajikan generalisasi model ARMA yang populer, ARIMA (Autoregressive Integrated Moving Average) dan peramalan dan spesifikasi model. Terakhir, saya akan menjelaskan sebuah implementasi Excel yang saya buat dan bagaimana menggunakannya untuk membuat ramalan time series Anda. Model Autoregresif Model Autoregressive digunakan untuk menggambarkan proses acak dan proses variasi waktu dan menentukan variabel output bergantung secara linear pada nilai sebelumnya. Model ini digambarkan sebagai: Xt c sum varphii, Xt-i varepsilont Dimana varphi1, ldots, varphivarphi adalah parameter dari model, C adalah konstan, dan varepsilont adalah istilah white noise. Intinya, apa model yang dideskripsikan adalah untuk setiap nilai X (t). Hal ini dapat dijelaskan oleh fungsi dari nilai sebelumnya. Untuk model dengan satu parameter, varphi 1. X (t) dijelaskan dengan nilai masa lalu X (t-1) dan error varepsilont acak. Untuk model dengan lebih dari satu parameter, misalnya varphi 2. X (t) diberikan oleh X (t-1). X (t-2) dan kesalahan varepsilont acak. Model Moving Average Model Moving Average (MA) sering digunakan untuk pemodelan univariat time series dan didefinisikan sebagai: Xt mu varepsilont theta1, varepsilon ldots thetaq, varepsilon mu adalah mean dari deret waktu. Theta1, ldots, thetaq adalah parameter dari model. Varepsilont, varepsilon, ldot adalah istilah error white noise. Q adalah urutan dari model Moving Average. Model Moving Average adalah regresi linier dari nilai arus seri dibandingkan dengan istilah varepsilont pada periode sebelumnya, t. Varepsilon Sebagai contoh, model MA dari q 1. X (t) dijelaskan oleh error varepsilont saat ini pada periode yang sama dan nilai error terakhir, varepsilon. Untuk model orde 2 (q 2), X (t) dijelaskan oleh dua nilai kesalahan terakhir, varepsilon dan varepsilon. Istilah AR (p) dan MA (q) digunakan dalam model ARMA, yang sekarang akan diperkenalkan. Autoregressive Moving Average Model Autoregressive Moving Average menggunakan dua polinomial, AR (p) dan MA (q) dan menggambarkan proses stokastik stasioner. Proses stasioner tidak berubah saat digeser dalam waktu atau ruang, oleh karena itu, proses stasioner memiliki mean dan varians konstan. Model ARMA sering disebut dalam bentuk polinomialnya, ARMA (p, q). Notasi model ditulis: Xt c varepsilont sum varphi1 X sum thetai varepsilon Memilih, memperkirakan dan memverifikasi model dijelaskan oleh proses Box-Jenkins. Metode Box-Jenkins untuk Identifikasi Model Di bawah ini adalah lebih dari garis besar metode Box-Jenkins, karena proses sebenarnya untuk menemukan nilai-nilai ini bisa sangat banyak tanpa paket statistik. Lembar Excel yang disertakan pada halaman ini secara otomatis menentukan model pas terbaik. Langkah pertama metode Box-Jenkins adalah identifikasi model. Langkah ini meliputi identifikasi musiman, differencing jika perlu dan menentukan urutan p dan q dengan merencanakan fungsi autokorelasi dan autokorelasi parsial. Setelah model diidentifikasi, langkah selanjutnya adalah memperkirakan parameter. Estimasi parameter menggunakan paket statistik dan algoritma perhitungan untuk menemukan parameter pemasangan terbaik. Setelah parameter dipilih, langkah terakhir adalah memeriksa model. Pemeriksaan model dilakukan dengan pengujian untuk melihat apakah model sesuai dengan rangkaian waktu univariat stasioner. Kita juga harus memastikan residu independen satu sama lain dan menunjukkan mean dan varians konstan dari waktu ke waktu, yang dapat dilakukan dengan melakukan uji Ljung-Box atau lagi merencanakan autokorelasi dan autokorelasi parsial residual. Perhatikan langkah pertama yang melibatkan pengecekan seasonality. Jika data yang Anda gunakan berisi tren musiman, Anda harus membuat data stasioner. Langkah differencing ini menggeneralisasikan model ARMA menjadi model ARIMA, atau Autoregressive Integrated Moving Average, di mana 8216Integrated8217 sesuai dengan langkah differencing. Model Moving Average Autoregressive Model ARIMA memiliki tiga parameter, p, d, q. Untuk menentukan model ARMA untuk memasukkan istilah differencing, kita mulai dengan menata ulang model ARMA standar untuk memisahkan lateks X (t) lateks dan lateks varepsilont dari penjumlahan. (1 - jumlah alphai Li) Xt (1 sum thetai Li) varepsilont Dimana L adalah operator lag dan alphai. Thetai Varepsilont adalah parameter rata-rata autoregressive dan moving average, dan error terms masing-masing. Kami sekarang membuat asumsi polinomial pertama dari fungsi tersebut, (1 - sum alphai Li) memiliki akar kesatuan multiplisitas d. Kita kemudian dapat menuliskannya kembali sebagai berikut: Model ARIMA mengekspresikan fakta-fakta polinomial dengan pp-d dan memberi kita: (1 - jumlah phii Li) (1 - L) d Xt (1 sum thetai Li) varepsilont Terakhir, kita menggeneralisasi Model selanjutnya dengan menambahkan istilah drift, yang mendefinisikan model ARIMA sebagai ARIMA (p, d, q) dengan drift frac. (1 - jumlah phii Li) (1 - L) d Xt delta (1 sum thetai Li) varepsilont Dengan model yang sekarang didefinisikan, kita dapat melihat model ARIMA sebagai dua bagian terpisah, satu stasioner non-stasioner dan alat tulis lebar lainnya. (Joint probability distribution tidak berubah saat bergeser dalam waktu atau ruang). Model non-stasioner: Model stasioner yang luas: (1 - jumlah phii Li) Yt (1 sum thetai Li) varepsilont Prakiraan sekarang dapat dilakukan pada Yt dengan menggunakan metode peramalan autoregresif umum. Sekarang setelah kita membahas model ARMA dan ARIMA, sekarang kita beralih ke bagaimana kita bisa menggunakannya dalam aplikasi praktis untuk memberikan peramalan. Saya telah membuat sebuah implementasi dengan Excel menggunakan R untuk membuat perkiraan ARIMA dan juga pilihan untuk menjalankan simulasi Monte Carlo pada model untuk menentukan kemungkinan perkiraan. Implementasi Excel dan Cara Menggunakan Sebelum menggunakan lembaran, Anda harus mendownload R dan RExcel dari situs web Statconn. Jika Anda sudah menginstal R, Anda bisa mendownload RExcel. Jika Anda tidak menginstal R, Anda dapat mendownload RAndFriends yang berisi versi terbaru R dan RExcel. Harap dicatat, RExcel hanya bekerja pada 32bit Excel untuk lisensi non-komersialnya. Jika Anda menginstalasi Excel 64bit, Anda harus mendapatkan lisensi komersial dari Statconn. Dianjurkan untuk mendownload RAndFriends karena ini membuat instalasi tercepat dan termudah, jika Anda sudah memiliki R dan ingin menginstalnya secara manual, ikuti langkah-langkah berikut ini. Secara manual menginstal RExcel Untuk menginstal RExcel dan paket lainnya untuk membuat R bekerja di Excel, pertama buka R sebagai Administrator dengan mengklik kanan pada. exe. Di konsol R, instal RExcel dengan mengetikkan pernyataan berikut: Perintah di atas akan menginstal RExcel di komputer Anda. Langkah selanjutnya adalah memasang rcom, yang merupakan paket lain dari Statconn untuk paket RExcel. Untuk menginstallnya, ketik perintah berikut, yang juga akan secara otomatis menginstal rscproxy seperti pada versi R 2.8.0. Dengan paket yang terinstal ini, Anda dapat beralih ke pengaturan koneksi antara R dan Excel. Meski tidak perlu di install, paket yang bisa diunduh adalah Rcmdr, yang dikembangkan oleh John Fox. Rcmdr membuat menu R yang bisa menjadi menu di Excel. Fitur ini hadir secara default dengan instalasi RAndFriends dan membuat beberapa perintah R tersedia di Excel. Ketik perintah berikut ke R untuk menginstal Rcmdr. Kita bisa membuat link ke R dan Excel. Catatan dalam versi terbaru dari RExcel koneksi ini dibuat dengan klik ganda sederhana dari file. bat yang sesuai ActivateRExcel2010, jadi Anda hanya perlu mengikuti langkah-langkah ini jika Anda menginstal R dan REXcel secara manual atau jika karena alasan tertentu tidak terjadi koneksi selama Instalasi RAndFriends. Buat Koneksi Antara R dan Excel Buka buku baru di Excel dan arahkan ke layar pilihan. Klik Options dan kemudian Add-Ins. Anda harus melihat daftar semua add-in aktif dan tidak aktif yang Anda miliki saat ini. Klik tombol Go di bagian bawah. Pada kotak dialog Add-Ins, Anda akan melihat semua add-in referensi yang telah Anda buat. Klik Browse. Arahkan ke folder RExcel, biasanya terletak di C: Program FilesRExcelxls atau yang serupa. Temukan add-in RExcel. xla dan klik itu. Langkah selanjutnya adalah membuat referensi agar makro menggunakan R agar bekerja dengan baik. Di dokumen Excel Anda, masukkan Alt F11. Ini akan membuka editor Excels VBA. Pergi ke Tools - gt References, dan temukan referensi RExcel, RExcelVBAlib. RExcel sekarang harus siap digunakan Dengan menggunakan Excel Sheet Sekarang R dan RExcel telah dikonfigurasi dengan benar, waktunya untuk melakukan beberapa peramalan Buka lembar peramalan dan klik Load Server. Ini untuk memulai server RCom dan juga memuat fungsi yang diperlukan untuk melakukan peramalan. Sebuah kotak dialog akan terbuka. Pilih file itall. R yang disertakan dengan sheet. File ini berisi fungsi yang digunakan alat peramalan. Sebagian besar fungsi yang terkandung dikembangkan oleh Profesor Stoffer di University of Pittsburgh. Mereka memperluas kemampuan R dan memberi kami beberapa grafik diagnostik yang membantu bersama dengan keluaran peramalan kami. Ada juga fungsi untuk secara otomatis menentukan parameter pas terbaik dari model ARIMA. Setelah server dimuat, masukkan data Anda di kolom Data. Pilih kisaran data, klik kanan dan pilih Name Range. Beri nama kisaran sebagai Data. Selanjutnya, atur frekuensi data Anda di Cell C6. Frekuensi mengacu pada periode waktu data Anda. Jika mingguan, frekuensinya adalah 7. Bulanan akan 12 sedangkan kuartalan akan menjadi 4, dan seterusnya. Masukkan periode ke depan untuk meramalkan. Perhatikan bahwa model ARIMA menjadi tidak akurat setelah beberapa prediksi frekuensi berturut-turut. Aturan praktis yang bagus adalah tidak melebihi 30 langkah seperti masa lalu yang bisa agak tidak dapat diandalkan. Hal ini tergantung pada ukuran kumpulan data Anda juga. Jika Anda memiliki data terbatas yang tersedia, disarankan untuk memilih langkah yang lebih kecil di depan nomor. Setelah memasukkan data Anda, menamainya, dan menyetel frekuensi dan langkah yang diinginkan di depan untuk meramalkan, klik Jalankan. Mungkin perlu beberapa saat untuk peramalan untuk diproses. Setelah selesai, Anda akan mendapatkan nilai perkiraan ke nomor yang Anda tentukan, kesalahan standar dari hasil, dan dua grafik. Bagian kiri adalah nilai prediksi yang diplot dengan data, sementara yang tepat berisi diagnostik praktis yang mencakup residu terstandarisasi, autokorelasi residu, plot gumpalan residu dan grafik statistik Ljung-Box untuk menentukan apakah model dipasang dengan baik. Saya tidak akan membahas terlalu banyak tentang bagaimana Anda mencari model yang pas, tapi pada grafik ACF Anda tidak menginginkan ada (atau banyak) lonjakan lag yang melintas di atas garis biru bertitik. Pada plot gg, semakin banyak lingkaran yang melewati garis, model yang lebih dinormalisasi dan lebih pas. Untuk kumpulan data yang lebih besar, ini mungkin akan melintasi banyak lingkaran. Terakhir, uji Ljung-Box adalah artikel tersendiri, lingkaran yang berada di atas garis biru bertitik, semakin bagus modelnya. Jika hasil diagnosa tidak terlihat bagus, Anda dapat mencoba menambahkan lebih banyak data atau mulai dari titik yang berbeda mendekati kisaran yang ingin Anda ramalkan. Anda dapat dengan mudah menghapus hasil yang dihasilkan dengan mengklik tombol Clear Forecasted Values. Dan thats it Saat ini, kolom tanggal tidak melakukan apapun selain untuk referensi Anda, namun tidak diperlukan untuk alat ini. Jika saya menemukan waktu, sakitlah kembali dan tambahkan itu sehingga grafik yang ditampilkan menunjukkan waktu yang tepat. Anda juga mungkin akan menerima kesalahan saat menjalankan perkiraan. Hal ini biasanya karena fungsi yang menemukan parameter terbaik tidak dapat menentukan urutan yang benar. Anda bisa mengikuti langkah-langkah di atas untuk mencoba dan mengatur data Anda agar lebih baik fungsinya berfungsi. Saya harap Anda bisa menggunakan alat itu. Saya telah menghemat banyak waktu di tempat kerja, karena sekarang yang harus saya lakukan adalah memasukkan data, memuat server dan menjalankannya. Saya juga berharap ini menunjukkan betapa hebatnya R, terutama bila digunakan dengan front-end seperti Excel. Kode, lembar kerja Excel dan file. bas juga ada di GitHub di sini. Pengantar ke ARIMA: model nonseasonal persamaan peramalan ARIMA (p, d, q): Model ARIMA secara teori adalah kelas model paling umum untuk meramalkan deret waktu yang Dapat dibuat menjadi 8220stationary8221 dengan membedakan (jika perlu), mungkin bersamaan dengan transformasi nonlinier seperti pembalakan atau pengurasan (jika perlu). Variabel acak yang merupakan deret waktu bersifat stasioner jika sifat statistiknya konstan sepanjang waktu. Seri stasioner tidak memiliki tren, variasinya berkisar rata-rata memiliki amplitudo konstan, dan bergoyang secara konsisten. Yaitu pola waktu acak jangka pendeknya selalu terlihat sama dalam arti statistik. Kondisi terakhir ini berarti autokorelasinya (korelasi dengan penyimpangannya sendiri dari mean) tetap konstan dari waktu ke waktu, atau ekuivalen, bahwa spektrum kekuatannya tetap konstan seiring berjalannya waktu. Variabel acak dari bentuk ini dapat dilihat (seperti biasa) sebagai kombinasi antara sinyal dan noise, dan sinyal (jika ada) dapat menjadi pola pengembalian cepat atau lambat, atau osilasi sinusoidal, atau alternasi cepat pada tanda , Dan itu juga bisa memiliki komponen musiman. Model ARIMA dapat dilihat sebagai model 8220filter8221 yang mencoba memisahkan sinyal dari noise, dan sinyal tersebut kemudian diekstrapolasikan ke masa depan untuk mendapatkan perkiraan. Persamaan peramalan ARIMA untuk rangkaian waktu stasioner adalah persamaan linier (yaitu regresi-tipe) dimana prediktor terdiri dari kelambatan variabel dependen dan atau lag dari kesalahan perkiraan. Yaitu: Prediksi nilai Y adalah konstanta dan atau jumlah tertimbang dari satu atau lebih nilai Y dan satu angka tertimbang dari satu atau lebih nilai kesalahan terkini. Jika prediktor hanya terdiri dari nilai Y yang tertinggal, itu adalah model autoregresif murni (8220 self-regressed8221), yang hanyalah kasus khusus dari model regresi dan yang dapat dilengkapi dengan perangkat lunak regresi standar. Sebagai contoh, model autoregresif orde pertama (8220AR (1) 8221) untuk Y adalah model regresi sederhana dimana variabel independennya hanya Y yang tertinggal satu periode (LAG (Y, 1) dalam Statgrafik atau YLAG1 dalam RegresIt). Jika beberapa prediktor tertinggal dari kesalahan, model ARIMA TIDAK merupakan model regresi linier, karena tidak ada cara untuk menentukan error8221 8220last periodier178 sebagai variabel independen: kesalahan harus dihitung berdasarkan periode-ke-periode Saat model dipasang pada data. Dari sudut pandang teknis, masalah dengan menggunakan kesalahan tertinggal sebagai prediktor adalah bahwa prediksi model8217 bukanlah fungsi linear dari koefisien. Meskipun mereka adalah fungsi linier dari data masa lalu. Jadi, koefisien pada model ARIMA yang mencakup kesalahan tertinggal harus diestimasi dengan metode optimasi nonlinier (8220 climb-climbing8221) daripada hanya dengan memecahkan sistem persamaan. Akronim ARIMA adalah singkatan Auto-Regressive Integrated Moving Average. Lags dari rangkaian stasioner dalam persamaan peramalan disebut istilah quotautoregressivequot, kelambatan kesalahan perkiraan disebut istilah kuotasi rata-rata quotmoving average, dan deret waktu yang perlu dibedakan untuk dijadikan stasioner disebut versi seri integimental dari seri stasioner. Model random-walk dan random-trend, model autoregresif, dan model pemulusan eksponensial adalah kasus khusus model ARIMA. Model ARIMA nonseasonal diklasifikasikan sebagai model quotARIMA (p, d, q) quot, di mana: p adalah jumlah istilah autoregresif, d adalah jumlah perbedaan nonseasonal yang diperlukan untuk stasioneritas, dan q adalah jumlah kesalahan perkiraan yang tertinggal dalam Persamaan prediksi Persamaan peramalan dibangun sebagai berikut. Pertama, izinkan y menunjukkan perbedaan D dari Y. yang berarti: Perhatikan bahwa perbedaan kedua Y (kasus d2) bukanlah selisih 2 periode yang lalu. Sebaliknya, ini adalah perbedaan pertama-perbedaan-dari-pertama. Yang merupakan analog diskrit turunan kedua, yaitu akselerasi lokal dari seri daripada tren lokalnya. Dalam hal y. Persamaan peramalan umum adalah: Disini parameter rata-rata bergerak (9528217s) didefinisikan sehingga tanda-tanda mereka negatif dalam persamaan, mengikuti konvensi yang diperkenalkan oleh Box dan Jenkins. Beberapa penulis dan perangkat lunak (termasuk bahasa pemrograman R) mendefinisikannya sehingga mereka memiliki tanda plus. Bila nomor aktual dicolokkan ke dalam persamaan, tidak ada ambiguitas, tapi penting untuk mengetahui konvensi mana yang digunakan perangkat lunak Anda saat Anda membaca hasilnya. Seringkali parameter dilambangkan dengan AR (1), AR (2), 8230, dan MA (1), MA (2), 8230 dll. Untuk mengidentifikasi model ARIMA yang sesuai untuk Y. Anda memulai dengan menentukan urutan differencing (D) perlu membuat stasioner seri dan menghilangkan fitur musiman musiman, mungkin bersamaan dengan transformasi yang menstabilkan varians seperti penebangan atau pengapuran. Jika Anda berhenti pada titik ini dan meramalkan bahwa rangkaian yang berbeda adalah konstan, Anda hanya memiliki model acak berjalan atau acak acak. Namun, rangkaian stationarized masih memiliki kesalahan autokorelasi, menunjukkan bahwa beberapa jumlah istilah AR (p 8805 1) dan beberapa istilah MA (q 8805 1) juga diperlukan dalam persamaan peramalan. Proses penentuan nilai p, d, dan q yang terbaik untuk rangkaian waktu tertentu akan dibahas di bagian catatan selanjutnya (yang tautannya berada di bagian atas halaman ini), namun pratinjau beberapa jenis Model ARIMA nonseasonal yang biasa dijumpai diberikan di bawah ini. ARIMA (1,0,0) model autoregresif orde pertama: jika seri stasioner dan autokorelasi, mungkin dapat diprediksi sebagai kelipatan dari nilai sebelumnya, ditambah konstanta. Persamaan peramalan dalam kasus ini adalah 8230 yang Y regresi pada dirinya sendiri tertinggal oleh satu periode. Ini adalah model konstanta 8220ARIMA (1,0,0) constant8221. Jika mean Y adalah nol, maka istilah konstan tidak akan disertakan. Jika koefisien kemiringan 981 1 positif dan kurang dari 1 besarnya (harus kurang dari 1 dalam besaran jika Y adalah stasioner), model tersebut menggambarkan perilaku rata-rata pada nilai periodisasi berikutnya yang diperkirakan akan menjadi 981 1 kali sebagai Jauh dari mean sebagai nilai periode ini. Jika 981 1 negatif, ia memprediksi perilaku rata-rata dengan alternasi tanda, yaitu juga memprediksi bahwa Y akan berada di bawah rata-rata periode berikutnya jika berada di atas rata-rata periode ini. Dalam model autoregresif orde kedua (ARIMA (2,0,0)), akan ada istilah Y t-2 di sebelah kanan juga, dan seterusnya. Bergantung pada tanda dan besaran koefisien, model ARIMA (2,0,0) bisa menggambarkan sistem yang pembalikan rata-rata terjadi dengan mode sinusoidal oscillating, seperti gerak massa pada pegas yang mengalami guncangan acak. . ARIMA (0,1,0) berjalan acak: Jika seri Y tidak stasioner, model yang paling sederhana untuk model ini adalah model jalan acak, yang dapat dianggap sebagai kasus pembatas model AR (1) dimana autoregresif Koefisien sama dengan 1, yaitu deret dengan reversi mean yang jauh lebih lambat. Persamaan prediksi untuk model ini dapat ditulis sebagai: di mana istilah konstan adalah perubahan periode-ke-periode rata-rata (yaitu drift jangka panjang) di Y. Model ini dapat dipasang sebagai model regresi yang tidak mencegat dimana Perbedaan pertama Y adalah variabel dependen. Karena hanya mencakup perbedaan nonseasonal dan istilah konstan, model ini diklasifikasikan sebagai model quotARIMA (0,1,0) dengan konstan. Model random-walk-without - drift akan menjadi ARIMA (0,1, 0) model tanpa ARIMA konstan (1,1,0) model autoregresif orde satu yang terdesentralisasi: Jika kesalahan model jalan acak diobot dengan autokorelasi, mungkin masalahnya dapat diperbaiki dengan menambahkan satu lag variabel dependen ke persamaan prediksi - - yaitu Dengan mengundurkan diri dari perbedaan pertama Y pada dirinya sendiri yang tertinggal satu periode. Ini akan menghasilkan persamaan prediksi berikut: yang dapat diatur ulang menjadi Ini adalah model autoregresif orde pertama dengan satu urutan perbedaan nonseasonal dan istilah konstan - yaitu. Model ARIMA (1,1,0). ARIMA (0,1,1) tanpa perataan eksponensial sederhana: Strategi lain untuk memperbaiki kesalahan autokorelasi dalam model jalan acak disarankan oleh model pemulusan eksponensial sederhana. Ingatlah bahwa untuk beberapa seri waktu nonstasioner (misalnya yang menunjukkan fluktuasi yang bising di sekitar rata-rata yang bervariasi secara perlahan), model jalan acak tidak berjalan sebaik rata-rata pergerakan nilai masa lalu. Dengan kata lain, daripada mengambil pengamatan terbaru sebagai perkiraan pengamatan berikutnya, lebih baik menggunakan rata-rata beberapa pengamatan terakhir untuk menyaring kebisingan dan memperkirakan secara lebih akurat mean lokal. Model pemulusan eksponensial sederhana menggunakan rata-rata pergerakan rata-rata tertimbang eksponensial untuk mencapai efek ini. Persamaan prediksi untuk model smoothing eksponensial sederhana dapat ditulis dalam sejumlah bentuk ekuivalen matematis. Salah satunya adalah bentuk koreksi yang disebut 8220error correction8221, dimana ramalan sebelumnya disesuaikan dengan kesalahan yang dibuatnya: Karena e t-1 Y t-1 - 374 t-1 menurut definisinya, ini dapat ditulis ulang sebagai : Yang merupakan persamaan peramalan ARIMA (0,1,1) - tanpa perkiraan konstan dengan 952 1 1 - 945. Ini berarti bahwa Anda dapat menyesuaikan smoothing eksponensial sederhana dengan menentukannya sebagai model ARIMA (0,1,1) tanpa Konstan, dan perkiraan koefisien MA (1) sesuai dengan 1-minus-alpha dalam formula SES. Ingatlah bahwa dalam model SES, rata-rata usia data dalam prakiraan 1 periode adalah 1 945. yang berarti bahwa mereka cenderung tertinggal dari tren atau titik balik sekitar 1 945 periode. Dengan demikian, rata-rata usia data dalam prakiraan 1-periode-depan model ARIMA (0,1,1) - tanpa konstan adalah 1 (1 - 952 1). Jadi, misalnya, jika 952 1 0,8, usia rata-rata adalah 5. Karena 952 1 mendekati 1, model ARIMA (0,1,1) - tanpa model konstan menjadi rata-rata bergerak jangka-panjang, dan sebagai 952 1 Pendekatan 0 menjadi model random-walk-without-drift. Apa cara terbaik untuk memperbaiki autokorelasi: menambahkan istilah AR atau menambahkan istilah MA Dalam dua model sebelumnya yang dibahas di atas, masalah kesalahan autokorelasi dalam model jalan acak diperbaiki dengan dua cara yang berbeda: dengan menambahkan nilai lag dari seri yang berbeda Ke persamaan atau menambahkan nilai tertinggal dari kesalahan perkiraan. Pendekatan mana yang terbaik Aturan praktis untuk situasi ini, yang akan dibahas lebih rinci nanti, adalah bahwa autokorelasi positif biasanya paling baik ditangani dengan menambahkan istilah AR ke model dan autokorelasi negatif biasanya paling baik ditangani dengan menambahkan MA istilah. Dalam deret waktu bisnis dan ekonomi, autokorelasi negatif sering muncul sebagai artefak differencing. (Secara umum, differencing mengurangi autokorelasi positif dan bahkan dapat menyebabkan perubahan dari autokorelasi positif ke negatif.) Jadi, model ARIMA (0,1,1), di mana perbedaannya disertai dengan istilah MA, lebih sering digunakan daripada Model ARIMA (1,1,0). ARIMA (0,1,1) dengan perataan eksponensial sederhana konstan dengan pertumbuhan: Dengan menerapkan model SES sebagai model ARIMA, Anda benar-benar mendapatkan fleksibilitas. Pertama, perkiraan koefisien MA (1) dibiarkan negatif. Ini sesuai dengan faktor pemulusan yang lebih besar dari 1 dalam model SES, yang biasanya tidak diizinkan oleh prosedur pemasangan model SES. Kedua, Anda memiliki pilihan untuk memasukkan istilah konstan dalam model ARIMA jika Anda mau, untuk memperkirakan tren nol rata-rata. Model ARIMA (0,1,1) dengan konstanta memiliki persamaan prediksi: Prakiraan satu periode dari model ini secara kualitatif serupa dengan model SES, kecuali bahwa lintasan perkiraan jangka panjang biasanya adalah Garis miring (kemiringannya sama dengan mu) bukan garis horizontal. ARIMA (0,2,1) atau (0,2,2) tanpa pemulusan eksponensial linier konstan: Model pemulusan eksponensial linier adalah model ARIMA yang menggunakan dua perbedaan nonseason dalam hubungannya dengan persyaratan MA. Perbedaan kedua dari seri Y bukan hanya perbedaan antara Y dan dirinya tertinggal dua periode, namun ini adalah perbedaan pertama dari perbedaan pertama - i. Perubahan perubahan Y pada periode t. Jadi, perbedaan kedua Y pada periode t sama dengan (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Perbedaan kedua dari fungsi diskrit sama dengan turunan kedua dari fungsi kontinyu: ia mengukur kuotasi kuadrat atau quotcurvaturequot dalam fungsi pada suatu titik waktu tertentu. Model ARIMA (0,2,2) tanpa konstan memprediksi bahwa perbedaan kedua dari rangkaian sama dengan fungsi linier dari dua kesalahan perkiraan terakhir: yang dapat disusun ulang sebagai: di mana 952 1 dan 952 2 adalah MA (1) dan MA (2) koefisien. Ini adalah model pemulusan eksponensial linear umum. Dasarnya sama dengan model Holt8217s, dan model Brown8217s adalah kasus khusus. Ini menggunakan rata-rata pergerakan tertimbang eksponensial untuk memperkirakan tingkat lokal dan tren lokal dalam rangkaian. Perkiraan jangka panjang dari model ini menyatu dengan garis lurus yang kemiringannya bergantung pada tren rata-rata yang diamati menjelang akhir rangkaian. ARIMA (1,1,2) tanpa perataan eksponensial eksponensial yang terfragmentasi. Model ini diilustrasikan pada slide yang menyertainya pada model ARIMA. Ini mengekstrapolasikan tren lokal di akhir seri namun meratakannya pada cakrawala perkiraan yang lebih panjang untuk memperkenalkan catatan konservatisme, sebuah praktik yang memiliki dukungan empiris. Lihat artikel di quotWhy the Damped Trend karyaquot oleh Gardner dan McKenzie dan artikel quotGolden Rulequot oleh Armstrong dkk. Untuk rinciannya. Umumnya disarankan untuk tetap berpegang pada model di mana setidaknya satu dari p dan q tidak lebih besar dari 1, yaitu jangan mencoba menyesuaikan model seperti ARIMA (2,1,2), karena hal ini cenderung menyebabkan overfitting. Dan isu-isu kuotom-faktorquot yang dibahas secara lebih rinci dalam catatan tentang struktur matematis model ARIMA. Implementasi Spreadsheet: Model ARIMA seperti yang dijelaskan di atas mudah diterapkan pada spreadsheet. Persamaan prediksi adalah persamaan linier yang mengacu pada nilai-nilai masa lalu dari rangkaian waktu asli dan nilai kesalahan masa lalu. Dengan demikian, Anda dapat membuat spreadsheet peramalan ARIMA dengan menyimpan data di kolom A, rumus peramalan pada kolom B, dan kesalahan (data minus prakiraan) di kolom C. Rumus peramalan pada sel biasa di kolom B hanya akan menjadi Sebuah ekspresi linier yang mengacu pada nilai-nilai pada deretan kolom A dan C sebelumnya, dikalikan dengan koefisien AR atau MA yang sesuai yang disimpan di sel di tempat lain pada spreadsheet.

No comments:

Post a Comment