Tutorial R : Manajemen Data Sederhana pada RStudio



R merupakan salah satu software sekaligus bahasa pemrograman yang memungkinkan pengguna untuk melakukan manajemen data mulai dari sederhana sampai luar biasa. Beberapa artikel yang membahas mengenai R di website ini adalah sebagai berikut :
Tutorial : Metode Forecasting Exponential Smoothing menggunakan R
Tutorial : Rancangan Percobaan - Rancangan Acak Lengkap (RAL) dengan R
Tutorial R : Argumen Dasar dalam Pemrograman R
Tutorial R : Rcmdr pada RStudio
Tutorial R : RStudio sebagai IDE yang Memudahkan
Tutorial : Uji Stasioneritas menggunakan R
Tutorial R : Menulis, Membaca dan Menampilkan Data pada R
Tutorial & Video : Rcmdr untuk Statistika Dasar
Tutorial & Video : Download dan Install "R"
Pada artikel ini, diasumsikan pembaca telah membaca artikel di atas atau telah memahami apa itu R dan fungsi-fungsi sederhana dari R itu sendiri.

Terkadang, teknik-teknik manajemen data pada R jarang digunakan oleh user karena pada R sendiri telah terdapat beberapa package yang sangat memudahkan. Dalam kasus sederhana mungkin beberapa metode manajemen data akan sangat bermanfaat. Berikut contoh penggunaan manajemen data pada R dengan bantuan IDE RStudio.


Permasalahan :

Sebuah perusahaan asuransi ingin memantau data klaim pada suatu minggu. Berikut disajikan data mengenai Klaim Asuransi Kecelakaan Mobil yang terjadi selama satu minggu. Data tersebut meliputi hari, banyak klaim, nilai rupiah klaim, serta nama petugas penanggung jawab setiap hari.
Berdasarkan data tersebut, kepala perusahaan menginginkan beberapa laporan antara lain :
a. Berapa rata-rata  klaim terjadi pada minggu tersebut
b. Kapan nilai klaim tertinggi terjadi?
c. Hari apa saja yang nilai klaimnya lebih dari 25 juta?
d. Siapa petugas yang menangani klaim paling banyak?
e. Siapa petugas yang bertanggung jawab di hari rabu?
f. Berapa nilai klaim tertinggi dan terendah?
g. Berapa frekuensi klaim tertinggi dan terendah?

Pembahasan :

Sebelum menjawab permintaan kepala perusahaan, tahap pertama dari penyelesaian kasus ini adalah mengusahakan agar RStudio dapat membaca data tersebut. Berikut beberapa tahapan import data menggunakan RStudio.

1. Input Data Permasalahan

Input data permasalahan atau kita sebut data klaim pada notepad atau segala jenis software yang mampu menghasilkan dokumen dengan format *.txt lalu simpan dokumen tersebut pada tempat yang mudah diingat. Atau jika ingin cara instan, unduh data_klaim pada link berikut kemudian pilih data dengan nomor urut 36 dengan judul Contoh Data Klaim Perusahaan Asuransi.
Link Data : Download Contoh Data

2. Import Data


Tahap selanjutnya adalah melakukan import data dengan cara klik :
File - Import Dataset - From Text (base)


3. Pilih lokasi data yang disimpan.


Lalu pilih lokasi penyimpanan data yang telah disiapnkan pada tahap 1.


4. Import


Setelah muncul kotak dialog Import Data kemudian klik Import


5. Selesai

Tahap import data telah selesai. Untuk memastikan data telah terekam, masukan code berikut pada RStudio Console kemudian enter.
data_klaim
Setelah itu akan muncul hasil sebagai berikut:
Tampilan diatas menandakan bahwa data telah terekam. Setelah data terekam, tahap selanjutnya adalah menjawab permintaan dari kepala perusahaan. Berikut penjabaran masing-masing permintaan.

Jawaban

a. Berapa Rata-rata Klaim yang Terjadi

Pertanyaan poin a dapat dijawab dengan menggunakan fungsi rata-rata pada R. Masukan code berikut pada RStudio Console kemudian enter.
jawab_a=mean(data_klaim$klaim)
print(jawab_a)
Setelah itu akan muncul hasil sebagai berikut:
Rata-rata klaim yang terjadi pada mingg tersebut adalah sebesar 23,85714 klaim.

b. Kapan Nilai Klaim Tertinggi Terjadi?

Pertanyaan poin b dapat dijawab dengan menggunakan fungsi which.max pada R. Masukan code berikut pada RStudio Console kemudian enter.
jawab_b=data_klaim[(which.max(data_klaim$klaim)),1]
print(jawab_b)
Setelah itu akan muncul hasil sebagai berikut:
Nilai klaim tertinggi terjadi pada hari minggu. Pada dasarnya, jawaban poin b adalah menggabungkan fungsi which.max dengan modifikasi matriks dengan informasi kolom 1.

c. Hari Apa Saja yang Nilai Klaimnya Lebih dari 25 Juta?

Pertanyaan poin c dapat dijawab dengan menggunakan fungsi subset pada R. Masukan code berikut pada RStudio Console kemudian enter.
jawab_c=subset(data_klaim, nilai > 25)
print(jawab_c)
Setelah itu akan muncul hasil sebagai berikut:
Hari selasa, kamis, jumat dan minggu memiliki nilai klaim di atas 25 juta. Prinsip fungsi subset adalah mengambil sebagain informasi dalam hal ini adalah informasi variabel nilai pada data_klaim.

d. Siapa Petugas yang Menangani Klaim Paling Banyak?

Pertanyaan poin d dapat dijawab dengan menggunakan fungsi which.max pada R. Masukan code berikut pada RStudio Console kemudian enter.
jawab_d=data_klaim[(which.max(data_klaim$klaim)),4]
print(jawab_d)
Setelah itu akan muncul hasil sebagai berikut:
Petugas yang menangani klaim paling banyaka dalah Budi. Pada dasarnya, jawaban poin d adalah menggabungkan fungsi which.max dengan modifikasi matriks dengan informasi kolom 4. Jawaban poin d mirip dengan jawaban poin b.

e. Siapa Petugas yang Bertanggung Jawab di Hari Rabu?

Pertanyaan poin e dapat dijawab dengan menggunakan fungsi which pada R. Masukan code berikut pada RStudio Console kemudian enter.
jawab_e=data_klaim[(which(data_klaim$hari == "Rabu")),4]
print(jawab_e)
Setelah itu akan muncul hasil sebagai berikut:
Petugas yang bertanggung jawab di hari rabu adalah Tini. Pada dasarnya, jawaban poin e adalah menggabungkan fungsi which dengan kriteria "Rabu" dan modifikasi matriks dengan informasi kolom 4. Jawaban poin d mirip dengan jawaban poin b dan d.

f. Berapa Nilai Klaim Tertinggi dan Terendah?

Pertanyaan poin f dapat dijawab dengan menggunakan fungsi max, data.frame, dan fungsi pembentuk vektor. Masukan code berikut pada RStudio Console kemudian enter.
nnilai=c((max(data_klaim$nilai)),(min(data_klaim$nilai)))
nilaicek=c("Tertinggi","Terendah")
jawab_f=data.frame(nilaicek,nnilai)
print(jawab_f)
Setelah itu akan muncul hasil sebagai berikut:
Nilai klaim tertinggi sebesar 50,51 juta dan terendah sebesar 13,03 juta. Pada jawaban poin f terdapat beberapa tahap dalam penyelesaiannya. Tahap pertama adalah menentukan nilai maksimum dan minimum kemudian memasukannya pada vektor nnilai. Tahap kedua membentuk sebuah vektor dengan elemen "Tertinggi" dan "Terendah". Tahap ketiga adalah menggabungkan vektor tahap pertama dan kedua.

g. Berapa Frekuensi Klaim Tertinggi dan Terendah?

Pertanyaan poin g dapat dijawab dengan menggunakan fungsi max, data.frame, dan fungsi pembentuk vektor. Masukan code berikut pada RStudio Console kemudian enter.
nklaim=c((max(data_klaim$klaim)),(min(data_klaim$klaim)))
klaimcek=c("Tertinggi","Terendah")
jawab_g=data.frame(klaimcek,nklaim)
print(jawab_g)
Setelah itu akan muncul hasil sebagai berikut:
Frekuensi klaim tertinggi sebesar 35 klaim dan terendah sebesar 12 klaim. Pada jawaban poin g terdapat beberapa tahap dalam penyelesaiannya. Tahap pertama adalah menentukan nilai maksimum dan minimum kemudian memasukannya pada vektor nklaimTahap kedua membentuk sebuah vektor dengan elemen "Tertinggi" dan "Terendah"Tahap ketiga adalah menggabungkan vektor tahap pertama dan kedua.

---

Demikian penjelasan mengenai Tutorial R : Manajemen Data Sederhana pada R dan RStudio. Jika terdapat pertanyaan maupun penjelasan ulang, kritik, saran dan lainnya, dapat langsung mengisi kolom komentar. Semua pertanyaan yang masuk akan selalu diusahakan untuk dijawab.

0 Response to "Tutorial R : Manajemen Data Sederhana pada RStudio"

Post a Comment