Market Basket Analysis in R with Groceries Dataset

Market Basket Analysis in R with Groceries DatasetTri Imam WicaksonoBlockedUnblockFollowFollowingMar 7Market basket analysis adalah sebuah modelling yang digunakan untuk mencari tahu sebuah pattern antara satu barang atau lebih dalam satu basket.

Biasanya para pihak swalayan menaruh tata letak barang berdasarkan pola dari customer yang berbelanja,sehingga memungkinkan customer membeli barang yang lainnya.

Algoritma Association rule biasanya digunakan untuk melakukan analisis terhadap keterkaitan antar barang pada suatu transaksi berdasarkan basket masing-masing customer.

source:select-statistics.

co.

ukExample:Pada contoh ini saya memakai dataset Groceries yang berada dalam package arules.

install.

packages("arules")library(arules)data("Groceries")Karena association rules menggunakan transactional data, sebaiknya kita lihat dulu class dari dataset yang telah digunakan.

Kemudian bisa melihat sekilas data set yang digunakan dengan function inspect().

> class(Groceries)[1] "transactions"attr(,"package")[1] "arules"> inspect(head(Groceries, 3)) items [1] {citrus fruit,semi-finished bread,margarine,ready soups}[2] {tropical fruit,yogurt,coffee} [3] {whole milk}Let’s run the code to get some rulesKita jalankan dengan apriori algorithm di Arules library,dengan minimal support 1% dan confidence 50%.

Urutkan dengan confidence yang terbesar> rules <- apriori(Groceries, parameter = list(supp=0.

001, conf=0.

5))> rules <- sort(rules, by='confidence', decreasing = TRUE)> summary(rules)set of 5668 rulesrule length distribution (lhs + rhs):sizes 2 3 4 5 6 11 1461 3211 939 46Min.

1st Qu.

Median Mean 3rd Qu.

Max.

2.

00 3.

00 4.

00 3.

92 4.

00 6.

00summary of quality measures: support confidence lift count Min.

:0.

001017 Min.

:0.

5000 Min.

: 1.

957 Min.

: 10.

0 1st Qu.

:0.

001118 1st Qu.

:0.

5455 1st Qu.

: 2.

464 1st Qu.

: 11.

0 Median :0.

001322 Median :0.

6000 Median : 2.

899 Median : 13.

0 Mean :0.

001668 Mean :0.

6250 Mean : 3.

262 Mean : 16.

4 3rd Qu.

:0.

001729 3rd Qu.

:0.

6842 3rd Qu.

: 3.

691 3rd Qu.

: 17.

0 Max.

:0.

022267 Max.

:1.

0000 Max.

:18.

996 Max.

:219.

0mining info: data ntransactions support confidence Groceries 9835 0.

001 0.

5Summary diatas menunjukan bahwa kita berhasil membuat sebanyak 5668 rules dari dataset yang kita miliki, dimana 4 items paling banyak pada rules tersebut.

Dikarenakan terdapat banyak rules , maka disini saya hanya mengambil 5 teratas saja atau sesuai dengan kasus yang anda inginkan.

resultMaksud data diatas merupakan sebuah pola yang dibentuk berdasarkan data transaksi yang kita miliki.

Berikut sekilas penjelasannya100% customers yang beli “rice, sugar” membeli “whole milk ”.

100% customers yang beli “canned fish, hygiene articles” membeli “whole milk ”.

dan seterusnyaNilai 100% itu didapatkan dari confidence yang dihasilkansource:UofTKesimpulan :Market basket analysis sangatlah penting digunakan untuk melakukan peningkatan penjualan, contohnya setelah mengetahui pola dari transaksi tersebut, kita bisa membuat sebuah produk bundling ataupun penawaran terbaik lainnya melalui hasil tersebut.

.

. More details

Leave a Reply