Kamis, 30 Mei 2013


SEJARAH PERKEMBANGAN STATISTIKA DAN APLIKASINYA

AWAL PERKEMBANGAN STATISTIKA SECARA UMUM
            Perkembangan statistika diawali sebagai suatu ilmu yang membahas cara-cara mengumpulkan angka sebagai hasil pengamatan menjadi bentuk yang lebih mudah dipahami.  Menurut Murray R. Spiegel, PhD. (1961) statistika berasal dari kata “status” yang berarti negara.  Sehingga pada awalnya statistika berkaitan dengan ilmu untuk angka-angka (keterangan) atas perintah raja suatu negara, yang ingin mengetahui kekayaan negaranya seperti jumlah penduduk, hewan piaraan, hasil pertanian, dan modal.  Contoh tertua mengenai hal ini dapat diambil dari zaman Kaisar Agustus yang membuat pernyataan bahwa seluruh dunia harus dikenai pajak, sehingga setiap orang harus melapor kepada statistikawan terdekat (pengumpul pajak).  Peristiwa lain di dalam sejarah yang dapat dikemukakan ialah sewaktu William si Penakluk memerintahkan mengadakan pencacahan jiwa dan kekayaan di seluruh wilayah Inggris untuk pengumpulan pajak dan tugas militer.  Semua pengamatan dicatat di dalam sebuah buku yang dikenal dengan Domesday Book
1)  Mahasiswa Program S3 Statistika IPB
2)  Dosen pada Jurusan Statistika FMIPA-IPB
 
Dari keperluan semacam ini timbullah teknik pencatatan angka-angka pengamatan dalam bentuk daftar dan grafik. Bagian statistika yang membicarakan cara mengumpulkan dan menyederhanakan angka-angka pengamatan ini dikenal sebagai statistika deskriptif.Statistika deskriptif dapat berkembang tanpa memerlukan dasar matematika yang kuat, selain kecermatan dalam teknik berhitung.

Sejak tahun 1700-an analisis data yang dilakukan secara deskriptif berdasarkan tabel-tabel frekuensi, rataan, dan ragam untuk sampel (contoh) ukuran besar.  Kemudian pada tahun 1800-an merupakan awal penggunaan grafik-grafik untuk penyajian data, seperti histogram, sejalan dengan penemuan sebaran (kurva) Normal. Florence Nightengale (1820-1920) adalah seorang perawat yang terkenal dengan inovasi di bidang ilmu perawatan merupakan pelopor dalam penyajian data secara grafik. Selama perang Crimean, Nightengale mengumpulkan data dan membuat sistem pencatatan. Dari data tersebut dapat ditentukan tingkat mortalitas yang dapat menunjukkan hasil perbaikan kondisi kesehatan yang cenderung menurunkan tingkat kematian. Selanjutnya data-data tersebut disajikan dalam bentuk grafik yang merupakan suatu inovasi statistika di masa tersebut. 
Dalam statistika deskriptif tidak ada perbedaan antara yang diperoleh dari sampel dengan populasinya, dan apa yang dihitung dari sampel digunakan untuk menandai populasi.  Pada taraf selanjutnya orang tidak puas hanya mengumpulkan angka-angka pengamatan saja. Mereka juga tidak puas bahwa yang diperoleh dari sampel digunakan untuk mencirikan populasi. Timbullah usaha-usaha untuk memperbaiki kesimpulan dalam melakukan ramalan-ramalan populasi berdasarkan       angka-angka     statistik     yang dikumpulkan dari sampel tersebut.  Bagian ilmu yang membahas cara-cara mengambil kesimpulan berdasarkan angka-angka pengamatan ini dinamakan statistika induktif.  Perkembangan statistik induktif tidak lepas dari pengetahuan mengenai peluang, maka ada baiknya kita lihat terlebih dahulu sejarah perkembangan ilmu peluang yang mendasari statistika induktif.


SEJARAH PERKEMBANGAN ILMU PELUANG
Pengetahuan mengenai peluang ini diawali oleh adanya pertanyaan seorang bangsawan  Perancis yang juga penjudi bernama Chevalier de Mere kepada Pascal (1623-1662). Penjudi tersebut ingin mengetahui bagaimana pola pembagian uang taruhan pada suatu perjudian apabila permainannya terpaksa dihentikan sebelum selesai.  Pertanyaan ini kemudian menjadi bahan pertukaran pikiran antara Pascal dan Fermat (1601-1665) melalui surat.  Dari surat-menyurat antara kedua pemikir inilah kemudian timbul dasar-dasar cabang matematika yang dinamakan hitung peluang (the theory of probability) pada tahun 1654.
Pada tahun 1657 seorang ilmuwan Jerman Christian Huygens (guru Leibniz) menerbitkan buku De Ratiocinilis in Ludo Aleae yang berisi tentang risalat  perjudian dan sejak saat itu teori peluang mulai terkenal.  Perkembangan pesat terjadi pada abad 18 yang dipelopori oleh Jacob Bernoulli (1654-1705) dan Abraham de Moivre (1667-1754).
Kurva Normal dan persamaannya ditemukan oleh Abraham de Moivre pada tahun 1733.  Dia pertama-tama menyatakan sifat-sifat dari kurva Normal yang kemudian dikembangkan oleh   dua orang astronom matematika yaitu Pierre de Laplace (1749-1827)  berasal dari Perancis dan Gauss (1777-1855) yang berasal dari Jerman secara terpisah sehingga diperoleh fungsi normal dan aplikasinya. Terbitan kurva Normal oleh de Moivre ditemukan Karl Pearson pada tahun 1924 di suatu perpustakan yang digunakan untuk pengembangan statistika induktif untuk ukuran sampel besar.  Adolph Quetelet (1796-1874) mempopulerkan sebaran Normal ini pada bermacam-macam data biologi dan sosial.
Thomas Bayes memberikan landasan teori statistika Bayesian (Bayesian Statistics) yang pada mulanya menuliskan gagasan tersebut dalam jurnal Philosophical Transaction pada tahun 1764. Dewasa ini Bayesian sering dipakai oleh para teoritikus genetika kuantitatif secara ekslusif dan juga pada ilmu-ilmu keteknikan, kesehatan, dan lain-lain.
S. D. Poisson dikenal sebagai penemu Sebaran Poisson (Poisson Distribution) telah memberikan landasan teori untuk rare event yang dituangkan dalam tulisannya Recherches sur la probabilite pada tahun 1837. Teori Poisson banyak digunakan dalam dunia industri, manajemen, transportasi, biologi dan lain-lain         Pada tahun 1812 Pierre de Laplace memperkenalkan ide baru dan teknik matematika dalam bukunya Theorie Analytique des Probabilities.  Laplace mulai menerapkan peluang pada banyak permasalahan saintifik dan  praktis, tidak hanya pada permainan judi
Jadi walaupun hitung peluang diawali di atas meja judi, ilmu ini telah menjadi pengetahuan yang sangat bermanfaat bagi perikemanusiaan.  Di dalam statistika, teori peluang yang melandasi inferensia statistika (statistika induktif) yang menjadi cikal bakal statistika modern.


SEJARAH PERKEMBANGAN STATISTIKA INDUKTIF
Awal perkembangan statistika induktif  terjadi pada peralihan abad ke 19 ke abad 20 dengan Karl Pearson (1857-1936) sebagai pelopornya. Masa ini merupakan titik awal perkembangan statistika modern.  Pada abad 19 Karl Pearson menerapkan statistika pada biologi untuk masalah hereditas dan proses evolusi biologi yang diterbitkan dalam jurnal Biometrika.  Dari tahun 1893 sampai 1912 Karl Pearson telah menulis 18 paper yang berjudul kontribusi matematika ke teori evolusi.  Paper-paper ini mempunyai kontribusi ke analisis regresi dan koefisien korelasi.  Pearson menciptakan istilah standard deviation (simpangan baku) pada tahun 1893.  Dalam statistika deskriptif  Pearson juga memperkenalkan ukuran penyimpangan terhadap distribusi data yang simetrik yang disebut koefisien kemiringan dan kurtosis. Pada tahun 1900 Karl Pearson menemukan uji Khi-kuadrat untuk tabel kontingensi 2 arah.  Dalam  menarik kesimpulan tentang korelasi dan uji khi-kuadrat, Pearson menggunakan sampel besar (n>1000). Analisis data yang digunakan Pearson mengasumsikan data menyebar Normal. Sehingga pada Biometrika volume 1 yang terbit tahun 1901 sebagian besar penelitiannya menggunakan ukuran contoh besar.
Sebelum tahun 1912 sedikit sekali penemuan di bidang pengujian hipotesis sampai akhirnya W. S. Gosset (1876-1937) memperkenalkan uji t-student untuk sampel kecil.  Gosset adalah seorang mahasiswa (student) dari Karl Pearson pada awalnya adalah seorang ahli kimia yang bekerja di perusahaan bir Guinness di Dublin.  Gosset menemukan  uji-t untuk menangani sampel-sampel kecil untuk quality control di perusahaan bir tersebut.  Dia menerbitkan papernya dengan nama Student pada jurnal Biometika 1908 untuk menghindari larangan dari perusahaan bagi karyawannya yang menulis di dalam sebuah jurnal. Bentuk sebaran secara matematis yang digunakan Gosset tersebut sebenarnya telah ditemukan oleh astronom Jerman Jakob Luroth pada tahun 1875.  Gosset menggunakan data hasil pengukuran terhadap tinggi dan jari tengah tangan kiri 3000 narapidana yang dipublikasikan pada volume pertama Biometrika. Dengan metode Monte Carlo dipilih 750 sampel yang berukuran 4 dan diperoleh distribusi data yang mendekati distribusi teoritiknya. Sebaran t-student banyak dipakai sebagai acuan dalam menduga parameter rataan ukuran contoh kecil (n<30).
Metode estimasi parameter populasi yang digunakan sebelum tahun 1912 adalah metode kuadrat terkecil  yang dikemukakan oleh Gauss dan metode deviasi mutlak terkecil yang dikemukakan Laplace.  Kedua metode ini digunakan untuk mengestimasi parameter dalam model linier.  Kemudian Karl Pearson memperkenalkan metode momen untuk estimasi parameter pada tabel frekuensi.
Statistika induktif mulai berkembang pesat setelah R. A. Fisher (1890 –1962) menulis paper yang sangat terkenal pada tahun 1922  yaitu On the Mathematical Foundations of Theoritical Statistics (Mallows, 1998).  Fisher memperkenalkan istilah specification untuk mengidentifikasi 3 problem yang muncul pada reduksi data, yaitu :
1.  Spesifikasi  dari jenis   populasi,  yaitu bentuk matematis dari populasi yang mencakup parameter yang tidak diketahui.
2.      Estimasi,  yaitu pemilihan metode statistik untuk mengestimasi parameter dari populasi
3.      Sebaran, yaitu sebaran statistik dari contoh atau sampel.
Tulisan tersebut memperkenalkan suatu metode yang terkenal dengan nama Maximum Likelihood yang digunakan untuk estimasi dan pengujian hipotesis.
Pada tahun 1925 terbit buku Statistical Methods for Research Workers karangan Fisher yang berisi rancangan percobaan dan analisis varians di bidang biologi.  Fisher yang cara berfikirnya dipengaruhi aliran statistika yang dianut Karl Pearson, yaitu penarikan kesimpulan didasarkan pada model peluang (model-driven) merupakan promotor penggunaan cara-cara stastistika di dalam bidang-bidang ilmu pertanian, biologi dan genetika.  Untuk jasanya ini Fisher dianugerahi gelar Baronet oleh Ratu Inggris, sehingga ia berhak menggunakan nama Sir Ronald Fisher.      Kontribusi Fisher membuat cakupan metode pengembangan yang sesuai untuk sampel kecil, seperti Gosset, penemuan presisi sebaran dari beberapa statistik sampel dan penemuan analisis varians.  Fisher merekomendasikan maximum likelihood, yang digunakan untuk estimasi dan pengujian hipotesis.  Fisher dianggap penemu statistika modern karena kontribusinya yang sangat penting dan dianggap sebagai pemikir ulung tempaan abad kedua puluh.
      Pada era Fisher, seorang  pemikir Rusia Jerzy Neyman (1894-1981) juga dipandang sebagai penemu besar dari statistika modern karena kontribusinya dalam mengembangkan teori peluang, uji hipotesis, selang kepercayaan, dan matematika statistik.  Neyman bekerjasama dengan Egon Pearson (anak Karl Pearson)  mengembangkan teori-teori untuk pengujian hipotesis, salah satu teorinya yang terkenal adalah Teorema Neymann-Pearson (1936). Selain itu Neyman juga mengembangkan teori sampling survey pada tahun 1934.
Pada tulisan Fisher (1915) mengemukakan representasi geometrik data peubah-ganda dua (bivariate) untuk menurunkan distribusi sampling bersama dari penduga matriks varian-kovarians.  Pada tahun 1928 Wishart menggunakan metode yang sama untuk menurunkan distribusi bersama dari penduga matriks varians-kovarians untuk sebaran Normal ganda (Multivariate Normal) yang akhirnya populer dengan distribusi Wishart.
Pada tahun 1936, Fisher membuka area baru penelitian yang disebut fungsi diskriminan yang pada awalnya untuk menjawab pertanyaan yang diajukan oleh ahli antropologi yaitu untuk menentukan jenis kelamin dari pemilik tulang rahang tengkorak yang mempunyai ukuran-ukuran tertentu. Fungsi diskriminan untuk membedakan kedua jenis kelamin ini populer dengan nama fungsi linear diskriminan Fisher (LDF) untuk 2 grup dan merupakan salah satu metode pada analisis peubah ganda.
Calyampudi Radhakrishnan Rao (1920 -  ) adalah mahasiswa bimbingan dari Fisher.  Rao bekerja di museum antropologi sambil menyelesaikan Ph.D tahun 1948.  Tahun 1946 Rao mengembangkan fungsi diskriminan linear Fisher untuk klasifikasi dengan banyak grup.  Selain itu Rao juga berkontribusi dalam mengembangkan matematika statistik dengan teorinya yang terkenal pertidaksamaan Rao-Cramer dan teorema Rao-Blackwell yang dikemukakan secara terpisah oleh Rao pada tahun 1945 dan Blackwell pada tahun 1947.  Salah satu buku karangan Rao yang terkenal adalah Linear Statistical Inference yang telah diterjemahkan ke dalam 6 bahasa.
            Prasantha Chandra Mahalanobis (1893-1972) berkontribusi dalam mengembangkan analisis peubah ganda.  Salah satu kontribusinya yang besar adalah jarak Mahalanobis (D-statistik) yang merupakan ukuran jarak untuk data dengan variabel banyak yang digunakan dalam analisis klasifikasi.  Mahalanobis juga pendiri jurnal statistik India yang sangat terkenal bernama Sankya. Pada tahun 1931 Mahalanobis mendirikan Indian Statistical Institute dengan salah satu divisinya bernama National Sample Survey (NSS) yang bertugas mengumpulkan data sosioekonomik dan demografi di seluruh India.  Divisi ini membuat Mahalanobis mempunyai peranan penting dalam perencanaan ekonomi di India dan akhirnya NSS sekarang berfungsi sebagai bagian penting dari Ministry of Planning.
            Pada tahun 1931 Hotelling memperkenalkan statistik T2 yang merupakan generalisasi dari statistik t-student untuk menguji hipotesis nilai tengah pada data peubah-ganda.  Distribusi tak nol dari T2 adalah sama dengan Mahalanobis-Distance yang mempunyai tujuan berbeda ditemukan oleh Bose dan Roy pada tahun 1938.
            Seperti telah disebutkan bahwa aliran yang dianut Karl Pearson, Gosset dan R.A. Fisher mendasarkan kesimpulan pada jenis sebaran dari populasi sehingga dikenal dengan metode parametrik. Jika asumsi sebaran populasi tidak dipenuhi maka perlu dilakukan transformasi data, salah satunya adalah transformasi pangkat yang ditemukan oleh Box dan Cox tahun 1964, sehingga dikenal dengan nama transformasi Box-Cox. Di lain pihak pada tahun 1945 Frank Wilcoxon memperkenalkan metode statistik non parametrik yang bebas dari sebaran populasi yang sekarang dikenal dengan Uji Tanda Peringkat. Kemudian berkembang metode-metode non parametrik untuk analisis padanan dari metode parametrik. Seperti tahun 1952 W. H. Kruskal dan W. A. Wallis memperkenalkan uji non parametrik yang berpadanan dengan uji kesamaan mean pada analisis varians yang dikenal dengan nama Uji Kruskal-Wallis. Pada tahun 1958 Kaplan mengunakan metode non parametrik untuk pendugaan sekuensial. 
Pada akhirnya dengan adanya perkembangan teknologi komputer metode eksplorasi data berkembang pesat sekitar tahun 1970.  J. W. Tukey (1915-    ) mempunyai kontribusi besar dalam pengembangan metode eksplorasi baik secara grafis maupun numerik.  Beberapa penemuannya adalah diagram dahan-daun dan diagram kotak garis.
Pada pertengahan 1970 Efron memperkenalkan Metode Bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstraping ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneiville pada tahun 1948.  Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach.  Pada dekade 80-an perkembangan metode non parametrik mulai sering digunakan seperti pada regresi nonparametrik, estimasi distribusi dengan kernel, dan neural network.

Daftar Pustaka

Gani, J.  1982.  The Making of Statisticians.  Springer- Verlag.  New York.
Mallows, C. (1998).  1997, Fisher Memorial Lecture.  The Zeroth Problem.  ASA 52(1) : 1-9.
Nasoetion, A. H. dan Rambe, A. 1984.  Teori Statistika untuk ilmu-ilmu Kuantitatif.  Bhratara Karya Aksara.  Jakarta.
Parzen. Emanuel. 2002. Data Mining, Statistical Methods Mining and History of Statistics”.  (Department of statistics Texas A & M University College) termuat di internet.
Rao, C. R. and Szekely, G. J.  2000.  Statistics for The 21st Century.  Methodologies for Applications of the future.  Marcell Dekker. New York.
Rao, C. R. 2001 Has Statistics a Future ? If So in What Form ?  termuat di internet.


0 komentar:

Posting Komentar