Sunday, January 23, 2022

Tutorial R : Analisis Regresi Logistik Biner Menggunakan R

Secara umum, analisis regresi linier digunakan untuk memodelkan dan menganalisis hubungan antara variabel prediktor terhadap variabel respon. Variabel prediktor/bebas/independen adalah variabel yang dapat menyebabkan perubahan atau yang memberikan pengaruh terhadap variabel respon. Sedangkan variabel respon/terikat/dependen adalah variabel yang dipengaruhi oleh variabel prediktor. Skala data pada variabel respon yang digunakan dalam analisis regresi linier adalah skala interval maupun rasio.

Tantangan akan muncul jika skala data pada variabel respon adalah kategorik (nominal atau ordinal). Secara khusus artikel ini akan membahas model regresi dengan variabel respon berbentuk kategori biner (0/1). Salah satu model yang dapat digunakana dalah model regresi logistik biner. Model ini memungkinkan membentuk model regresi dengan variabel respon berbentuk biner.

Beberapa contoh kategori respon biner antara lain : Hidup/Mati, Sukses/Gagal, Setuju/Tidak Setuju dan lain sebagainya.

Secara umum, model regresi logistik biner didefinisikan sebagai :


Selain pembentukan model, salah satu hal terpenting dalam regresi logistik biner adalah terkait dengan interpretasi model yang terbentuk. Berikut akan dijelaskan tahapan dalam melakukan analisis regresi logistik biner menggunakan R. Penjelasan terkait interpretasi maupun asumsi akan dijelaskan pada kesempatan lainnya.

Permasalahan

Suatu lembaga riset sedang melakukan penelitian terkait dengan suatu wabah penyakit yang menyerang jenis burung A pada suatu wilayah. Penelitian ini mengamati keadaan burung A tersebut dari awal terjangkit sampai dengan 10 hari ke depan apakah kewan tersebut akan bertahan (1) atau akan mati (0). Beberapa faktor yang diamati antara lain rata-rata jarak tempuh terbang harian dan rata-rata berat badan yang diukur setiap hari. Penelitian ini menggunakan sampel sebanyak 30 ekor burung jenis A yang terindikasi terserang wabah. Data tabel hasil penelitian ditampilkan sebagai berikut, serta dapat diunduh DISINI.


Lakukan analisis regresi logistik biner untuk mengetahui peluang burung A akan bertahan atau mati dengan 2 faktor yang diamati. Variabel respon (Y) dalam penelitian ini adalah 1 = bertahan dan 0 = mati. Sedangkan variabel prediktor 1 (X1) adalah jarak tempuh dan prediktor 2 (X2) adalah berat badan.

(catatan: data yang digunakan adalah data buatan untuk mempermudah pemahaman)

Struktur Data

Permasalahan pada input data yang sering ditemui adalah bentuk dan struktur data yang digunakan. Secara umum terdapat 2 bentuk dan struktur data yang dapat digunakan yaitu data individu dan berkelompok. Penyusunan data secara individu dijelaskan sebagai berikut atau sesuai dengan contoh data yang akan digunakan pada artikel ini.


Sedangkan penyusunan data secara kelompok dijelaskan pada gambar berikut berdasarkan data keadaan sembuh berdasarkan dosis obat:


Bentuk data yang digunakan pada artikel ini adalah bentuk individu. Sedangkan untuk data berkelompok, terdapat beberapa tambahan perintah dalam melakukan input data.

Input Data

Input data dapat dilakukan dengan cara import data yang telah disediakan sebelumnya. Cara import data dapat dilihat pada artikel berikut:

Tutorial R : Cara Alternatif untuk Import Data pada R dan RStudio

Setelah data terinput pada R, tahap selanjutnya adalah melakukan pemanggilan perintah dan definisi variabel.

Perintah

Perintah yang digunakan secara kesuluruhan adalah sebagai berikut:

setwd("D:/")
data = read.delim2("data reg logistik biner.txt")
y = data$Y
x1 = data$X1
x2 = data$X2
fit = glm(y ~ x1 + x2, family = binomial(link = logit))
summary(fit)

Penjelasan dari perintah tersebut dijelaskan sebagai berikut:

Baris 1 : Digunakan untuk mengatur folder sesuai tahap input data. 
Baris 2 : Digunakan untuk import data dengan ekstensi *.txt.
Baris 3 : Pendefinisian variabel y berdasarkan kolom Y dari data.
Baris 4 : Pendefinisian variabel x1 berdasarkan kolom X1 dari data.
Baris 5 : Pendefinisian variabel x2 berdasarkan kolom X2 dari data.
Baris 6 : Perintah utama model dari variabel respon y dan prediktor x1 x2.
Baris 7 : Menampilkan hasil pemodelan pada baris 6.

Berdasarkan perintah yang telah dijalankan, hasil yang diperoleh adalah sebagai berikut:

Model

Model yang terbentuk dari hasil analisis yang telah dilakukan adalah sebagai berikut:

Signifikansi Parameter

Berdasarkan hasil yang diperoleh, menggunakan H0 adalah tidak terdapat pengaruh signifikan antara variabel prediktor terhadap respon, maka terlihat bahwa seluruh nilai P-Value lebih besar dari alpha (5%) dengan P-Value x1 (0,458) dan P-Value x2 (0,621). Hal ini menyebabkan H0 gagal ditolak untuk x1 maupun x2. Berdasarkan hasil tersebut dapat disimpulkan bahwa berdasarkan taraf signifikansi alpha 5%, tidak terdapat pengaruh parsial antara variabel x1 terhadap y maupun variabel x2 terhadap y.

Akurasi Prediksi

Walaupun kedua variabel tidak signifikan dalam model, tingkat keakuratan model dalam memprediksi dapat dilihat menggunakan perintah sebagai berikut:

table(true =  y, pred = round(fitted(fit)))

Serta hasil sebagai berikut:





Hasil tersebut menunjukan bahwa sebanyak 19 sampel yang bertahan tepat diprediksi akan bertahan dan 2 sampel yang mati tepat diprediksi akan mati. Sedangkan terdapat 9 sampel yang mati namun diprediksi akan hidup yang menandakan hasil ini adalah sebuah kesalahan.

Beberapa hasil maupun kesimpulan yang diperoleh akan selalu selaras dengan hasil dari uji signifikansi parameter, dimana pada artikel ini seluruh variabel prediktor tidak signifikan dalam memperngaruhi variabel respon.

Beberapa pengujian lainnya dapat dilakukan pada model regresi logistik biner. Beberapa sumber yang dapat dijadikan rujuan antara lain :

Agresti, A. 2015. Foundations of Linear and Generalized Linear Models. New Jersey: Wiley

Dunn, Peter K., Smyth, Gordon K. 2018. Generalized Linear Models With Examples in R. New York: Springer


Saturday, January 22, 2022

Tutorial R : Cara Alternatif untuk Import Data

Pada artikel sebelumnya telah dijelaskan cara import data menggunakan fasilitas dari RStudio yang dapat dilihat pada tautan berikut:

Input Data pada RStudio

Selain cara diatas, terdapat alternatif lain dalam melakukan import data maupun memanajemen suatu folder agar menunjang keefektifan bekerja. Cara tersebut adalah dengan melakukan Set Working Directory. Cara ini akan memungkinkan pengguna untuk bekerja berdasarkan beberapa data maupun sumber dari folder tertentu tanpa harus berkali-kali mengganti folder yang berisi data maupun sumber.

Terdapat 2 cara yang dapat dilakukan untuk menjalankan perintah Set Working Directory.

1. Melalui GUI RStudio

Cara pertama adalah melalui GUI RStudio dengan cara klik SessionSet Working Directory > Choose Directory. Kemudian pilih folder yang akan digunakan selama berkerja. Selain itu juga dapat menggunakan tombol shortcut CTRL + SHIFT + H


Setelah terpilih folder yang digunakan, maka import data pun akan semakin mudah. Import Data dapat dilakukan dengan memasukan perintah kemudian menuliskan judul data seperti contoh berikut:

Silahkan disesuaikan sumber data yang digunakan, apakah data berasal dari notepad dengan ekstensi *.txt atau dari ms. excel dengan ekstensi *.xlsx.

2. Melalui Perintah

Cara kedua adalah melalui perintah R yang dapat dimasukan pada RScript atau RConsole. Perintah yang digunakan adalah sebagai berikut:

setwd("lokasi folder yang diinginkan")

Sebagai contoh, lokasi yang terpilih adalah pada Drive D maka:

setwd("D:/")

Contoh lain, lokasi yang terpilih adalah pada Drive D dan di dalam folder TUGAS maka:

setwd("D:/TUGAS")

Setelah terpilih folder yang digunakan, maka import data pun akan semakin mudah. Import Data dapat dilakukan dengan memasukan perintah kemudian menuliskan judul data seperti contoh berikut:

Silahkan disesuaikan sumber data yang digunakan, apakah data berasal dari notepad dengan ekstensi *.txt atau dari ms. excel dengan ekstensi *.xlsx.

Demikian artikel terkait dengan Cara Alternatif untuk Import Data pada R dan RStudio.

Monday, August 2, 2021

Tutorial : Mengirimkan Sertifikat Otomatis dengan Mail Marge Autocrat (dilengkapi simulasi)

Di masa yang serba daring seperti saat ini, beberapa kegiatan yang memberikan sertifikat tentunya membutuhkan cara pengiriman sertifikat yang efisien dan praktis. Kegiatan-kegiatan tersebut antara lain Seminar Online, Pelatihan Online, Workshop Online dan sebagainya. Bahkan mungkin saja beberapa jenjang pendidikan memberikan Surat Keterangan Kelulusan (SKL) secara daring. Salah satu cara yang dapat digunakan adalah menggunakan Autocrat. Apa itu Autocrat? Autocrat merupakan salah satu plugin yang tersedia pada Google Speadsheet.

Sebelum memulai untuk mengirimkan sertifikat secara otomatis, berikut beberapa hal yang harus disiapkan:

  1. Akun Google
  2. Daftar email penerima sertifikat
  3. Desain sertifikat dengan nama penerima dikosongkan
Jika ketiga poin di atas telah disiapkan, maka sertifikat telah siap untuk dikirimkan. Berikut beberapa tahapan yang harus dilakukan sampai sertifikat terkirim pada peserta.

1. Siapkan Desain Sertifikat

Langkah pertama yang harus dilakukan adalah menyiapkan desain sertifikat yang akan digunakan. Desain sertifikat yang digunakan pada artikel ini adalah sebagai berikut:


Template desain tersebut diperoleh dari https://www.canva.com/ serta dapat diunduh Disini

2. Login Akun Google

Setelah desain sertifikat diunduh, tahap selanjutnya adalah login pada akun Google dengan cara klik pada tautan berikut Klik Disini. Setelah login berhasil, selanjutnya terdapat beberapa hal yang harus dilakukan yaitu sebagai berikut:

- Masuk pada Google Drive

Setelah masuk pada akun Google, silahkan akses ke Google Drive.


Setelah masuk pada Google Drive, silahkan buat folder khusus untuk sertifikat yang akan dikirimkan ke peserta, folder tersebut mencakup Folder MASTER dan Folder SERTIFIKAT.


Masuk pada Folder MASTER, silahkan klik New - Google Slides


Kemudian pada halaman Google Slide, drag (geser) desain sertifikat yang diunduh pada slide pertama lalu berikan nama file Master Sertifikat. Atur besar (panjang dan lebar) sertifikat sesuai dengan ukuran slide. Alternatif lain adalah mengatur sertifikat menggunakan Ms. Power Point lalu drag (geser) sertifikat yang telah diatur ke Google Drive kemudian buka file tersebut lalu klik File - Save as Google Slides. Selain itu juga editing dapat dilakukan menggunakan Ms. Word dengan tahapan yang serupa menggunakan  Ms. Power Point namun klik File - Save as Google Docs.


Pada lokasi Nomor Sertifikat dan Nama Peserta, sisipkan text box lalu isi dengan ketentuan berikut:

Lokasi Nomor Sertifikat : <<Nomor>>

Lokasi Nama Penerima : <<Nama>>


Setelah Google Slides tersimpan otomatis, maka dilanjutkan pada tahap selanjutnya.

Mohon diingat, tanda << ... >> merupakan lokasi penyisipan data, jika dalam sertifikat maupun dokumen lainnya memiliki beberapa informasi yang harus disisipkan seperti contoh lokasi, waktu, jenis kegiatan dan lainnya, silahkan dilengkapi seperti contoh tersebut. Nama lokasi (<< ... >>) penyisipan informasi harus sesuai dengan data yang dimasukan pada Google Sheets ditahap selanjutnya.

- Masuk pada Google Sheets

Pada tahap selanjutnya, silahkan kembali ke Folder MASTER lalu klik New - Google Sheets


3. Persiapkan Data Penerima Email

Setelah Google Sheets terbuka secara otomatis pada tahap sebelumnya, maka selanjutnya adalah isikan beberapa data penerima sertifikat sesuai ketentuan pada gambar berikut:


Kolom Nomor : berisi nomor sertifikat penerima.

Kolom Nama : berisi nomor nama penerima sertifikat

Kolom Email : berisi alamat email penerima sertifikat

Alamat email penerima sertifikat merupakan salah satu unsur penting. Jika alamat email ini salah maupun kurang tepat maka sertifikat tidak akan sampai ke penerima. Pastikan seluruh data telah sesuai dan benar.

4. Install Plugin Autocrat

Tahap yang paling penting adalah penggunaan dari Plugin Autocrat itu sendiri. Silahkan install Plugin Autocrat pada Google Sheets dengan cara klik Add-ons pilih Get add-ons.


Maka selanjutnya akan diarahkan secara otomatis pada kotak dialog Google Workspace Marketpace. Pada kotak dialog tersebut, silahkan cari add-ons dengan kata kunci Autocrat.


Klik Autocrat lalu pilih dan klik INSTALL.


Setelah proses install selesai maka Autocrat akan otomatis tertautkan pada Google Sheets akun tersebut.

5. Menggunakan Autocrat 

Setelah Autocrat berhasil diinstall, tahap selanjutnya adalah menjalankannya. Pada halaman Google Sheets, silahkan klik Add-ons - Autocrat - Open.


Selanjutnya akan diarah pada kotak dialog Autocrat. Pada kotak dialog tersebut klik New Job


Isikan nama Job lalu klik Next


Pada bagian selanjutnya, pengguna diharuskan untuk memilih desain sertifikat yang akan digunakan. Karena desain sertifikat telah disiapkan di akun Google Drive pada poin 2 maka selanjutnya klik From Drive  kemudian cari dan pilih desain yang telah disiapkan tadi. Mohon diingat, desain yang digunakan adalah desain yang telah dipindahkan ke Google Slides beserta dengan lokasi Nomor dan Nama lalu klik Next.


Selanjutnya adalah tahap menentukan lokasi-lokasi dalam template yang akan disisipkan beberapa data maupun informasi. Karena dalam sertifikat yang dibuat pada artikel ini hanya memuat Nomor Sertifikat dan Nama Penerima maka hanya terdapat 2 lokasi. Atur sesuai dengan ketentuan berikut:


Selajutnya isikan nama file yang akan dikirimkan beserta jenis file. Pada umumnya, jenis file yang digunakan adalah *.pdf.Pada keterangan bagian File Name, kita dapat membedakan nama untuk file satu dengan yang lain. Sebagai contoh pada kolom File Name akan diisikan :

Sertifikat Pelatihan a.n. <<Nama>>

Maka hasil file yang muncul dan yang akan dikirimkan untuk 10 daftar penerima adalah :

Sertifikat Pelatihan a.n. Mr. A.pdf
Sertifikat Pelatihan a.n. Mr. B.pdf
Sertifikat Pelatihan a.n. Mrs. C.pdf
Sertifikat Pelatihan a.n. Mr. D.pdf
Sertifikat Pelatihan a.n. Mr. E.pdf
Sertifikat Pelatihan a.n. Mrs. F.pdf
Sertifikat Pelatihan a.n. Mr. G.pdf
Sertifikat Pelatihan a.n. Mr. H.pdf
Sertifikat Pelatihan a.n. Mrs. I.pdf
Sertifikat Pelatihan a.n. Mr. J.pdf

Setelah File Name dan Type ditentukan selanjutnya klik Next.


Tahap selanjutnya adalah menentukan folder yang digunakan untuk menyimpan file hasil generate sertifikat. Silahkan pilih folder yang telah dibuat pada tahap 2 lalu pilih Folder SERTIFIKAT lalu klik Next.


Tahap 6 dan 7 pada langkah di Autocrat dapat di Skip. Pada tahap 8 di Autocrat, kita diharuskan untuk mengatur template yang akan dikirimkan ke email penerima. Pada artikel ini digunakan template email sebagai berikut tertera pada gambar. Perhatikan, seluruh kode yang tertera <<...>> merupakan lokasi menyisipkan informasi secara otomatis dari data di Google Sheets. Oleh karena itu, modifikasi template email dapat memaksimalkan kode ini untuk memperjelas dan memperindah email yang akan dikirim.



Tahap terakhir yaitu pengaturan Trigger. Terdapat 2 pengaturan yang disediakan yaitu :

  • Run on Form Trigger : pengaturan ini memungkinkan proses mail merge dan generate sertifikat berjalan jika ada perintah yang masuk dari Google Form. Sebagai ilustrasi adalah "Peserta akan mendapatkan sertifikat otomatis secara instan jika telah mengisi google form  yang disediakan".
  • Run on Time Trigger : pengaturan ini memungkinkan proses mail merge dan generate sertifikat berjalan pada pilihan rentang waktu yang ditentukan.
  • Manual : selain menggunakan trigger, proses dapat berjalan secara manual dengan klik tombol play. Pilihan tersebut yang akan digunakan pada artikel ini.



Setelah semua selesai di atur, selanjutnya klik Save. Setelah disimpan, untuk menjalankan prosesnya dapat dengan klik tombol play.


Saran : untuk percobaan pertama kali, disarankan menggunakan email pribadi yang lain atau kawan untuk mengecek apakah email sudah sesuai dan file sudah ter gerenarate dengan benar. Caranya adalah mengosongkan dahulu isi Google Sheet lalu mengisikan Email percobaan yang akan dijadikan latihan.

Berikut merupakan hasil email dan file sertifikat yang dikirimkan melalui Autocrat.



Terimakasih dan semoga bermanfaat.

Tuesday, July 27, 2021

Tutorial R : Pemodelan ARIMAX (ARIMA with Exogenous Variable) Menggunakan R

Model ARIMA merupakan salah satu model yang sering digunakan untuk melakukan pemodelan data deret waktu. Model ARIMA sendiri memiliki banyak sekali pengembangan. Pengembangan-pengembangan tersebut disesuaikan dengan kebutuhan maupun karakteristik data deret waktu yang diperoleh di lapangan. Salah satu pengembangan model ARIMA yang akan dibahas pada artikel ini adalah model ARIMAX atau Autoregressive Integrated Moving Average with Exogenous Variable. Sebagai awal pembahasan ARIMAX, pembahansan akan fokus pada model deret waktu yang stasioner. Jika diketahui bentuk umum dari model ARMA(p,q) dengan rataan nol sebagai berikut:

Persamaan ARMA(p,q) dengan rataan nol dapat kita tulis ulang ke dalam bentuk backshift maka akan menjadi seperti berikut:


Yt merupakan data deret waktu yang akan dimodelkan dan at merupakan deret noise model ARMA(p,q) dengan parameter \theta  dan \phi . Model ARMA(p,q) tersebut akan menjadi model ARMAX(p,q) dengan bentuk sebagai berikut:


Penambahan komponen Exogenous Xt mengharuskan adanya estimasi parameter \beta  pada model ARMAX(p,q). Salah satu alat bantu yang dapat digunakan untuk melakukan estimasi model ARIMAX adalah R. Terdapat beberapa perintah dalam R yang dapat dimaksimalkan untuk melakukan pemodelan data deret waktu dengan ARIMAX.

Beberapa pustaka yang terkait dalam artikel ini antara lain:

[otext.com] Rob J Hyndman and George Athanasopoulos. Forecasting: Principles and Practice (2nd ed), Monash University, Australia.
Cryer, Jonathan D. & Chan, Kung-Sik. (2008). Time Series Analysisi with Applications in R. Lowa City, Lowa: Springer.
Wei, W. W. S. (2006). Time Series Analysis Univariate and Multivariate Method. Second Edition. New York: Pearson Education.
dan lain-lain.

Pada dasarnya, estimasi parameter model ARIMAX pada R tidak terlalu berbeda dengan estimasi parameter ARIMA. Terdapat penambahan perintah yang digunakan untuk estimasi ARIMA. Artikel terkait pemodelan ARIMA dapat dilihat pada artikel berikut:

Tutorial R : Pemodelan ARIMA Menggunakan R

Perintah pada R yang digunakan dalam pemodelan ARIMAX adalah sebagai berikut dengan package "forecast". [Catatan] Perintah yang digunakan adalah Arima (package forecast) bukan arima.

Arima(y, order = c(p, d, q), xreg = x)

Penjelasan:

Variabel y merupakan data deret waktu yang akan dimodelkan. Sedangkan variabel x adalah data deret waktu yang memberikan pengaruh terhadap variabel yPerintah order = c(p, d, q) merupakan dugaan orde ARIMA berdasarkan tahap identifikasi. Perintah xreg = x merupakan perintah penambahan variabel Exogenus yang akan digunakan dalam model ARIMAX. Pada artikel ini akan digunakan dataset contoh yang dapat diperoleh dari Package "fpp2" yang diterbitkan oleh Rob J Hyndman dan George Athanasopoulos dalam buku Forecasting: Principles and Practice (2nd edition). Dataset yang digunakan adalah "uschange".

1. Cara Mendapatkan Dataset

Dataset yang digunakan yaitu "uschange" merupakan salah satu Dataset yang disediakan oleh Rob J Hyndman dan George Athanasopoulos dalam buku Forecasting: Principles and Practice (2nd edition). Data tersebut menjelaskan tentang data triwulanan pengeluaran konsumsi pribadi dan pendapatan disposabel pribadi dari tahun 1970 hingga 2016 Triwulan ke-3. Berikut merupakan perintah yang digunakan untuk memanggil Dataset tersebut.

install.packages("fpp2")
library(fpp2)
uschange


Beberapa variabel pada Dataset tersebut antara lain "Consumption", "Income", "Production", "Saving", dan "Unemployment". Studi Kasus yang ingin diamati adalah ingin memprediksi perubahan pengeluaran ("Consumption") berdasarkan perubahan pendapatan ("Income"). Faktor lain dari variabel  "Production", "Saving", dan "Unemployment" bahkan faktor tunda terjadinya pengaruh variabel "Income" tidak dimasukan dalam model. Jika beberapa faktor tersebut dimasukan dalam model, maka model yang dapat terbentuk akan berkembang bahkan dapat menggunakan pendekatan Fungsi Transfer.

2. Identifikasi

Tahap identifikasi selalu penting digunakan untuk mengetahui dugaan model yang akan diestimasi dalam proses pemodelan. Bagian pertama adalah dengan menentukan Time Series Plot dari data deret waktu dengan perintah sebagai berikut:

autoplot(uschange[,1:2], facets=TRUE)+ ylab("")


Selanjutnya adalah menentukan ACF dan PACF plot dari data deret waktu untuk "Consumption" dengan perintah sebagai berikut:

par(mfrow=c(2,1))
acf(uschange[,"Consumption"])
pacf(uschange[,"Consumption"])

Berdasarkan plot ACF dan PACF diketahui bahwa lag pada Q1, Q2, Q3, cut-off pada ACF maupun PACF. Hal ini mendasari model dugaan yang mungkin adalah kombinasi dari ketiga lag yang cut-off

3. Estimasi

Tahap estimasi merupakan salah satu tahap yang paling penting. Pada artikel sebelumnya telah dibahas mengenai tahap estimasi dan uji signifikansi parameter model ARIMA. Artikel lebih lengkapnya dapat dilihat pada tautan berikut :

Tutorial R : Pemodelan ARIMA Menggunakan R

Berdasarkan hasil estimasi dan uji signifikansi parameter, diperoleh 5 dugaan model yang parameternya signifikan terhadap model dengan perintah R sebagai berikut:

datay = uschange[,"Consumption"]
library(lmtest)
estimasi6 = arima(datay, order=c(2,0,2)); estimasi1; coeftest(estimasi6)
estimasi7 = arima(datay, order=c(2,0,1)); estimasi1; coeftest(estimasi7)
estimasi8 = arima(datay, order=c(2,0,0)); estimasi1; coeftest(estimasi8)
estimasi9 = arima(datay, order=c(1,0,2)); estimasi1; coeftest(estimasi9)
estimasi10 = arima(datay, order=c(0,0,2)); estimasi1; coeftest(estimasi10)

Hasil estimasi 6, 7, 8, 9, dan 10 menunjukan hasil yang signifikan dengan Hipotesis Nol adalah untuk setiap koefisien adalah parameter tidak signifikan dalam model. Nilai p-value untuk kelima dugaan model lebih kecil dari nilai \alpha .

4. Diagnosa Model

Berdasarkan 5 kandidat dugaan model, akan dipilih model dengan keakuratan yang paling tinggi berdasarkan nilai MAPE yang minimum. Perintah yang dapat digunakan untuk memilih model tersebut adalah:

library(forecast)
accuracy(estimasi6)
accuracy(estimasi7)
accuracy(estimasi8)
accuracy(estimasi9)
accuracy(estimasi10)

Berdasarkan pemilihan nilai MAPE diperoleh nilai MAPE terkecil yaitu model dugaan 6 atau ARMA(2,2). Tahap selanjutnya adalah melakukan uji kebaikan model dengan Ljung-Box Test (Penjelasan lebih lengkap dapat dilihat pada artikel Tutorial R : Pemodelan ARIMA Menggunakan R) dengan perintah sebagai berikut:

residual6 = estimasi6$residuals
Box.test(residual6, lag=4)

Hasil tersebut menunjukan bahwa model telah layak digunakan berdasarkan Ljung-Box Test dengan banyak lag adalah 4.

5. Estimasi Model ARIMAX

Setelah model terbaik diperoleh yaitu ARMA(2,2), tahap selanjutnya adalah melakukan estimasi parameter dengan penambahan Exogenous Variabel dengan perintah sebagai berikut:

library(forecast)
library(lmtest)
datay = uschange[,"Consumption"]
datax = uschange[,"Income"]
estimasiarmax = Arima(datay, order=c(2,0,2), xreg=datax)
estimasiarmax; coeftest(estimasiarmax)


Berdasarkan hasil yang diperoleh, seluruh koefisien dari parameter yang diestimasi memberikan nilai p-value yang kurang dari \alpha . Hal ini menandakan bahwa seluruh parameter telah signifikansi dalam model.

6. Diagnosa Model ARIMAX

Diagnosa model yang dilakukan sama dengan diagnosa model ARIMA pada umumnya dengan perintah sebagai berikut:

res_armax = estimasiarmax$residuals
Box.test(res_armax, lag=8)

Hasil tersebut menunjukan bahwa model telah layak digunakan berdasarkan Ljung-Box Test dengan banyak lag adalah 8.

7. Forecasting

Rincian model ARMAX dan lainnya dapat dilihat pada sumber pustaka yang dilampirkan pada artikel ini. Tahap terkahir dalam pemodelan adalah Forecasting. Perintah yang digunakan adalah sebagai berikut dengan panjang prediksi adalah 8 periode ke depan.

xreg1 = rep(mean(datax),8)
forecast(estimasiarmax, xreg=xreg1, h=8)