Statistical Computing adalah bagian dari ilmu komputer yang memfokuskan diri untuk mengimplementasi  metode statistika secara komputasi pada komputer. Bidang ini menjadi semacam penghubung antara ilmu statistika dan ilmu komputer.  Beberapa contoh yang sering digunakan adalah algoritma genetika untuk optimasi, principal component analysis untuk klasifikasi, discrete event simulation untuk riset operasional dan lain sebagainya.

Perangkat lunak untuk Statistical Computing ini  secara umum terbagi menjadi dua kelompok yaitu: kelompok perangkat lunak komersil dan kelompok open source/freeware. Kedua kelompok ini biasanya mendukung penggunaan secara menu-driven ataupun line-command. Beberapa contoh perangkat lunak statistik komersil yang popular di Indonesia adalah SPSS, MINITAB, STATA, SAS, dan Splus. Sedangkan contoh dari kelompok open source/freeware antara lain R, Vista, SalStat, PSPP, dan lain‐lain

Dari semua alternatif yang ada, hanya R yang dapat dikategorikan bahasa pemrograman yang memenuhi spesifikasi untuk rekayasa perangkat lunak juga. Bahasa R ini telah masuk ke dalam  TIOBE index (Februari 2012) pada posisi 20.

Apakah bahasa R itu?

Bahasa R adalah suatu fasilitas perangkat lunak terpadu untuk manipulasi data, simulasi, kalkulasi dan peragaan grafik. R memiliki kemampuan menganalisis data dengan sangat efektif dan dilengkapi dengan operator pengolahan array dan matriks. Tidak kalah menariknya R memiliki kemampuan penampilan grafik yang sangat canggih untuk peragaan datanya. Berikut adalah contoh code dalam bahasa R:

Bahasa R merupakan versi open-source dari bahasa pemrograman S (Azola dan Harrel, 2006). Bahasa R dapat diperoleh secara gratis dan jika berminat tinggal diunduh di http://cran.r-project.org. Versi komersial yang berbasis bahasa S adalah S plus. Bahasa R memiliki kemampuan yang tidak kalah dangan paket program pengolahan data komersial bahkan dalam beberapa hal kemampuannya lebih baik. Bahasa R mendapat sambutan yang baik dari kalangan statistikawan di seluruh dunia dan komunitas R sangat aktif dalam memberikan kontribusi paket aplikasi untuk R. Keunikan bahasa R adalah langsung terhubung dengan paket aplikasi yang dibangun oleh statistikawan di seluruh dunia ini dan jika membutuhkan dapat langsung diinstal dengan mencari paket yang sesuai.

Sejarah R

R project pertama kali dikembangkan oleh Robert Gentleman dan Ross Ihaka (nama R untuk sofware ini berasal dari huruf pertama nama kedua orang tersebut) yang bekerja di departemen statistik Universitas Auckland tahun 1995. Sejak saat itu software ini mendapat sambutan yang luar biasa dari kalangan statistikawan, industrial engineering, peneliti, programmer dan sebagainya. Pada saat ini, source code kernel R dikembangkanterutama oleh R Core Team yang beranggotakan 17 orang statistisi dari berbagai penjuru dunia.

Paket statistik R bersifat multiplatforms, dengan file instalasi binary/file tar tersedia untuk sistem operasi Windows, Mac OS, Mac OS X, Linux, Free BSD, NetBSD, irix, Solaris, AIX, dan HPUX. Fungsi dan kemampuan dari R sebagian besar dapat diperoleh melalui Add‐on packages/library. Suatu library adalah kumpulan perintah atau fungsi yang dapat digunakan untuk melakukan analisis tertentu. Sebagai contoh library yang sangat powerful adalah R-commander dan Rattle.

Meskipun R mengutamakan penggunaan bahasa pemrograman, bagi pengguna awam dengan metode statistik dan bahasa pemrograman, dapat memanfaatkan paket R-commander yang telah disediakan di library. Dengan mengaktifkan paket R-Commander, pengguna dapat melakukan pengolahan data secara statistik dengan mudah, semudah menggunakan SPSS, Minitab ataupun software statistik berlisensi lainnya. Hal ini sangat dimungkinkan karena melalui R-Commander, pengguna bisa langsung melakukan pengolahan data dengan memilih menu-menu yang disediakan pada jendela R-Commander. Berikut adalah screenshoot dari R Commander (http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/):

Menurut Rexer’s Annual Data Miner Survey 2010, R telah menjadi alat data mining yang digunakan oleh mayoritas pengguna (43%). Salah satu penyebabnya adalah adanya Rattle, suatu library yang khusus digunakan untuk Data Mining melalui GUI (Graphic User Interface). Rattle (the R Analytical Tool To Learn Easily) dapat menyajikan ringkasan data secara statistik dan secara visual dari berbagai sumber data (Excel, SQL, XML dll), selanjutnya dapat mentransformasi data ke dalam bentuk yang siap untuk dimodelkan. Untuk permodelannya dapat digunakan berbagai metode baik supervised maupun unsupervised dan sekaligus mampu membuat laporan secara grafis untuk unjuk kerja model yang dibangun. Berikut adalah screenshoot dari Rattle (http://rattle.togaware.com/):

Fitur lain yang tak kalah penting adalah kemampuan bahasa R untuk dihubungkan dengan bahasa lain. Dengan fasilitas ini kekurangan utama bahasa R yaitu kurangnya fasilitas untuk rekayasa perangkat lunak dapat diatasi dengan mudah. Berikut adalah library untuk menghubungkan dengan beberapa bahasa pemrograman utama:

  • R.Net (http://rdotnet.codeplex.com/). R.NET memampukan .NET Framework untuk berkolaborasi dengan bahasa statistical computing R.
  • RPy (http://rpy.sourceforge.net/). RPy adalah interface Python dengan bahasa R yang tangguh.
  • Rinside (http://dirk.eddelbuettel.com/code/rinside.html). RInside menyediakan kelas C++ yang membuat bahasa R dapat ditambahkan ke dalam C++ dengan mudah.
  • RJava (http://www.rforge.net/rJava/). RJava adalah interface R ke Java yang sederhana.

 

(Penulis: Alexander Agung Santoso Gunawan)