SEJARAH
PERKEMBANGAN STATISTIKA DAN APLIKASINYA
AWAL PERKEMBANGAN STATISTIKA SECARA
UMUM
Perkembangan
statistika diawali sebagai suatu ilmu yang membahas cara-cara mengumpulkan
angka sebagai hasil pengamatan menjadi bentuk yang lebih mudah dipahami. Menurut Murray R. Spiegel, PhD. (1961)
statistika berasal dari kata “status” yang berarti negara. Sehingga pada awalnya statistika berkaitan
dengan ilmu untuk angka-angka (keterangan) atas perintah raja suatu negara, yang
ingin mengetahui kekayaan negaranya seperti jumlah penduduk, hewan piaraan,
hasil pertanian, dan modal. Contoh
tertua mengenai hal ini dapat diambil dari zaman Kaisar Agustus yang membuat
pernyataan bahwa seluruh dunia harus dikenai pajak, sehingga setiap orang harus
melapor kepada statistikawan terdekat (pengumpul pajak). Peristiwa lain di dalam sejarah yang dapat
dikemukakan ialah sewaktu William si Penakluk memerintahkan mengadakan
pencacahan jiwa dan kekayaan di seluruh wilayah Inggris untuk pengumpulan pajak
dan tugas militer. Semua pengamatan
dicatat di dalam sebuah buku yang dikenal dengan Domesday Book.
|
Dari
keperluan semacam ini timbullah teknik pencatatan angka-angka pengamatan dalam
bentuk daftar dan grafik. Bagian statistika yang membicarakan cara mengumpulkan
dan menyederhanakan angka-angka pengamatan ini dikenal sebagai statistika
deskriptif.Statistika deskriptif dapat berkembang tanpa memerlukan dasar
matematika yang kuat, selain kecermatan dalam teknik berhitung.
Sejak tahun 1700-an
analisis data yang dilakukan secara deskriptif berdasarkan tabel-tabel
frekuensi, rataan, dan ragam untuk sampel (contoh) ukuran besar. Kemudian pada tahun 1800-an merupakan awal
penggunaan grafik-grafik untuk penyajian data, seperti histogram, sejalan
dengan penemuan sebaran (kurva) Normal. Florence Nightengale (1820-1920) adalah
seorang perawat yang terkenal dengan inovasi di bidang ilmu perawatan merupakan
pelopor dalam penyajian data secara grafik. Selama perang Crimean, Nightengale
mengumpulkan data dan membuat sistem pencatatan. Dari data tersebut dapat
ditentukan tingkat mortalitas yang dapat menunjukkan hasil perbaikan kondisi
kesehatan yang cenderung menurunkan tingkat kematian. Selanjutnya data-data
tersebut disajikan dalam bentuk grafik yang merupakan suatu inovasi statistika
di masa tersebut.
Dalam statistika
deskriptif tidak ada perbedaan antara yang diperoleh dari sampel dengan
populasinya, dan apa yang dihitung dari sampel digunakan untuk menandai
populasi. Pada taraf selanjutnya orang
tidak puas hanya mengumpulkan angka-angka pengamatan saja. Mereka juga tidak
puas bahwa yang diperoleh dari sampel digunakan untuk mencirikan populasi.
Timbullah usaha-usaha untuk memperbaiki kesimpulan dalam melakukan ramalan-ramalan
populasi berdasarkan
angka-angka statistik yang dikumpulkan dari sampel
tersebut. Bagian ilmu yang membahas
cara-cara mengambil kesimpulan berdasarkan angka-angka pengamatan ini dinamakan
statistika induktif. Perkembangan
statistik induktif tidak lepas dari pengetahuan mengenai peluang, maka ada
baiknya kita lihat terlebih dahulu sejarah perkembangan ilmu peluang yang
mendasari statistika induktif.
SEJARAH PERKEMBANGAN ILMU
PELUANG
Pengetahuan mengenai
peluang ini diawali oleh adanya pertanyaan seorang bangsawan Perancis yang juga penjudi bernama Chevalier
de Mere kepada Pascal (1623-1662). Penjudi tersebut ingin mengetahui bagaimana
pola pembagian uang taruhan pada suatu perjudian apabila permainannya terpaksa
dihentikan sebelum selesai. Pertanyaan
ini kemudian menjadi bahan pertukaran pikiran antara Pascal dan Fermat
(1601-1665) melalui surat. Dari
surat-menyurat antara kedua pemikir inilah kemudian timbul dasar-dasar cabang
matematika yang dinamakan hitung peluang (the theory of probability) pada
tahun 1654.
Pada tahun 1657 seorang
ilmuwan Jerman Christian Huygens (guru Leibniz) menerbitkan buku De
Ratiocinilis in Ludo Aleae yang berisi tentang risalat perjudian dan sejak saat itu teori peluang
mulai terkenal. Perkembangan
pesat terjadi pada abad 18 yang dipelopori oleh Jacob Bernoulli (1654-1705) dan
Abraham de Moivre (1667-1754).
Kurva Normal dan
persamaannya ditemukan oleh Abraham de Moivre pada tahun 1733. Dia pertama-tama menyatakan sifat-sifat dari
kurva Normal yang kemudian dikembangkan oleh
dua orang astronom matematika yaitu Pierre de Laplace (1749-1827) berasal dari Perancis dan Gauss (1777-1855)
yang berasal dari Jerman secara terpisah sehingga diperoleh fungsi normal dan
aplikasinya. Terbitan kurva Normal oleh de Moivre ditemukan Karl Pearson pada
tahun 1924 di suatu perpustakan yang digunakan untuk pengembangan statistika
induktif untuk ukuran sampel besar. Adolph
Quetelet (1796-1874) mempopulerkan sebaran Normal ini pada bermacam-macam data
biologi dan sosial.
Thomas Bayes memberikan
landasan teori statistika Bayesian (Bayesian
Statistics) yang pada mulanya menuliskan gagasan tersebut dalam jurnal Philosophical Transaction pada tahun
1764. Dewasa ini Bayesian sering
dipakai oleh para teoritikus genetika kuantitatif secara ekslusif dan juga pada
ilmu-ilmu keteknikan, kesehatan, dan lain-lain.
S. D. Poisson dikenal
sebagai penemu Sebaran Poisson (Poisson
Distribution) telah memberikan landasan teori untuk rare event yang dituangkan dalam tulisannya Recherches sur la probabilite pada tahun 1837. Teori Poisson banyak
digunakan dalam dunia industri, manajemen, transportasi, biologi dan lain-lain Pada tahun 1812 Pierre de Laplace
memperkenalkan ide baru dan teknik matematika dalam bukunya Theorie
Analytique des Probabilities.
Laplace mulai menerapkan peluang pada banyak permasalahan saintifik
dan praktis, tidak hanya pada permainan
judi
Jadi walaupun hitung
peluang diawali di atas meja judi, ilmu ini telah menjadi pengetahuan yang
sangat bermanfaat bagi perikemanusiaan.
Di dalam statistika, teori peluang yang melandasi inferensia statistika
(statistika induktif) yang menjadi cikal bakal statistika modern.
SEJARAH PERKEMBANGAN
STATISTIKA INDUKTIF
Awal perkembangan
statistika induktif terjadi pada
peralihan abad ke 19 ke abad 20 dengan Karl Pearson (1857-1936) sebagai
pelopornya. Masa ini merupakan titik awal perkembangan statistika modern. Pada abad 19 Karl Pearson menerapkan
statistika pada biologi untuk masalah hereditas dan proses evolusi biologi yang
diterbitkan dalam jurnal Biometrika.
Dari tahun 1893 sampai 1912 Karl Pearson telah menulis 18 paper yang
berjudul kontribusi matematika ke teori evolusi. Paper-paper ini mempunyai kontribusi ke
analisis regresi dan koefisien korelasi.
Pearson menciptakan istilah standard deviation (simpangan baku)
pada tahun 1893. Dalam statistika
deskriptif Pearson juga memperkenalkan
ukuran penyimpangan terhadap distribusi data yang simetrik yang disebut
koefisien kemiringan dan kurtosis. Pada tahun 1900 Karl Pearson menemukan uji Khi-kuadrat
untuk tabel kontingensi 2 arah.
Dalam menarik kesimpulan tentang
korelasi dan uji khi-kuadrat, Pearson menggunakan sampel besar (n>1000).
Analisis data yang digunakan Pearson mengasumsikan data menyebar Normal.
Sehingga pada Biometrika volume 1 yang terbit tahun 1901 sebagian besar
penelitiannya menggunakan ukuran contoh besar.
Sebelum tahun 1912 sedikit
sekali penemuan di bidang pengujian hipotesis sampai akhirnya W. S. Gosset
(1876-1937) memperkenalkan uji t-student untuk sampel kecil. Gosset adalah seorang mahasiswa (student)
dari Karl Pearson pada awalnya adalah seorang ahli kimia yang bekerja di
perusahaan bir Guinness di Dublin.
Gosset menemukan uji-t untuk
menangani sampel-sampel kecil untuk quality control di perusahaan bir
tersebut. Dia menerbitkan papernya
dengan nama Student pada jurnal Biometika 1908 untuk menghindari
larangan dari perusahaan bagi karyawannya yang menulis di dalam sebuah jurnal.
Bentuk sebaran secara matematis yang digunakan Gosset tersebut sebenarnya telah
ditemukan oleh astronom Jerman Jakob Luroth pada tahun 1875. Gosset menggunakan data hasil pengukuran
terhadap tinggi dan jari tengah tangan kiri 3000 narapidana yang dipublikasikan
pada volume pertama Biometrika. Dengan metode Monte Carlo dipilih 750 sampel yang
berukuran 4 dan diperoleh distribusi data yang mendekati distribusi
teoritiknya. Sebaran t-student banyak dipakai sebagai acuan dalam menduga
parameter rataan ukuran contoh kecil (n<30).
Metode estimasi parameter
populasi yang digunakan sebelum tahun 1912 adalah metode kuadrat terkecil yang dikemukakan oleh Gauss dan metode
deviasi mutlak terkecil yang dikemukakan Laplace. Kedua metode ini digunakan untuk mengestimasi
parameter dalam model linier. Kemudian
Karl Pearson memperkenalkan metode momen untuk estimasi parameter pada tabel
frekuensi.
Statistika induktif mulai
berkembang pesat setelah R. A. Fisher (1890 –1962) menulis paper yang sangat
terkenal pada tahun 1922 yaitu On the
Mathematical Foundations of Theoritical Statistics (Mallows, 1998). Fisher memperkenalkan istilah specification
untuk mengidentifikasi 3 problem yang muncul pada reduksi data, yaitu :
1. Spesifikasi dari jenis
populasi, yaitu bentuk matematis
dari populasi yang mencakup parameter yang tidak diketahui.
2.
Estimasi, yaitu pemilihan
metode statistik untuk mengestimasi parameter dari populasi
3.
Sebaran, yaitu sebaran statistik dari contoh atau sampel.
Tulisan tersebut memperkenalkan suatu
metode yang terkenal dengan nama Maximum Likelihood yang digunakan untuk
estimasi dan pengujian hipotesis.
Pada tahun 1925 terbit
buku Statistical Methods for Research Workers karangan Fisher yang
berisi rancangan percobaan dan analisis varians di bidang biologi. Fisher yang cara berfikirnya dipengaruhi
aliran statistika yang dianut Karl Pearson, yaitu penarikan kesimpulan
didasarkan pada model peluang (model-driven) merupakan promotor
penggunaan cara-cara stastistika di dalam bidang-bidang ilmu pertanian, biologi
dan genetika. Untuk jasanya ini Fisher
dianugerahi gelar Baronet oleh Ratu Inggris, sehingga ia berhak
menggunakan nama Sir Ronald Fisher. Kontribusi Fisher membuat cakupan metode
pengembangan yang sesuai untuk sampel kecil, seperti Gosset, penemuan presisi
sebaran dari beberapa statistik sampel dan penemuan analisis varians. Fisher merekomendasikan maximum likelihood,
yang digunakan untuk estimasi dan pengujian hipotesis. Fisher dianggap penemu statistika modern
karena kontribusinya yang sangat penting dan dianggap sebagai pemikir ulung
tempaan abad kedua puluh.
Pada era Fisher, seorang
pemikir Rusia Jerzy Neyman (1894-1981) juga dipandang sebagai penemu
besar dari statistika modern karena kontribusinya dalam mengembangkan teori
peluang, uji hipotesis, selang kepercayaan, dan matematika statistik. Neyman bekerjasama dengan Egon Pearson (anak
Karl Pearson) mengembangkan teori-teori
untuk pengujian hipotesis, salah satu teorinya yang terkenal adalah Teorema
Neymann-Pearson (1936). Selain itu Neyman juga mengembangkan teori sampling
survey pada tahun 1934.
Pada tulisan Fisher (1915)
mengemukakan representasi geometrik data peubah-ganda dua (bivariate) untuk
menurunkan distribusi sampling bersama dari penduga matriks
varian-kovarians. Pada tahun 1928
Wishart menggunakan metode yang sama untuk menurunkan distribusi bersama dari
penduga matriks varians-kovarians untuk sebaran Normal ganda (Multivariate
Normal) yang akhirnya populer dengan distribusi Wishart.
Pada tahun 1936, Fisher
membuka area baru penelitian yang disebut fungsi diskriminan yang pada awalnya
untuk menjawab pertanyaan yang diajukan oleh ahli antropologi yaitu untuk
menentukan jenis kelamin dari pemilik tulang rahang tengkorak yang mempunyai
ukuran-ukuran tertentu. Fungsi diskriminan untuk membedakan kedua jenis kelamin
ini populer dengan nama fungsi linear diskriminan Fisher (LDF) untuk 2 grup dan
merupakan salah satu metode pada analisis peubah ganda.
Calyampudi Radhakrishnan
Rao (1920 - ) adalah mahasiswa bimbingan
dari Fisher. Rao bekerja di museum
antropologi sambil menyelesaikan Ph.D tahun 1948. Tahun 1946 Rao mengembangkan fungsi
diskriminan linear Fisher untuk klasifikasi dengan banyak grup. Selain itu Rao juga berkontribusi dalam
mengembangkan matematika statistik dengan teorinya yang terkenal pertidaksamaan
Rao-Cramer dan teorema Rao-Blackwell yang dikemukakan secara terpisah oleh Rao
pada tahun 1945 dan Blackwell pada tahun 1947.
Salah satu buku karangan Rao yang terkenal adalah Linear Statistical
Inference yang telah diterjemahkan ke dalam 6 bahasa.
Prasantha
Chandra Mahalanobis (1893-1972) berkontribusi dalam mengembangkan analisis
peubah ganda. Salah satu kontribusinya
yang besar adalah jarak Mahalanobis (D-statistik) yang merupakan ukuran
jarak untuk data dengan variabel banyak yang digunakan dalam analisis
klasifikasi. Mahalanobis juga pendiri
jurnal statistik India yang sangat terkenal bernama Sankya. Pada tahun
1931 Mahalanobis mendirikan Indian Statistical Institute dengan salah
satu divisinya bernama National Sample Survey (NSS) yang bertugas
mengumpulkan data sosioekonomik dan demografi di seluruh India. Divisi ini membuat Mahalanobis mempunyai
peranan penting dalam perencanaan ekonomi di India dan akhirnya NSS sekarang
berfungsi sebagai bagian penting dari Ministry of Planning.
Pada
tahun 1931 Hotelling memperkenalkan statistik T2 yang merupakan
generalisasi dari statistik t-student untuk menguji hipotesis nilai tengah pada
data peubah-ganda. Distribusi tak nol
dari T2 adalah sama dengan Mahalanobis-Distance yang
mempunyai tujuan berbeda ditemukan oleh Bose dan Roy pada tahun 1938.
Seperti
telah disebutkan bahwa aliran yang dianut Karl Pearson, Gosset dan R.A. Fisher
mendasarkan kesimpulan pada jenis sebaran dari populasi sehingga dikenal dengan
metode parametrik. Jika asumsi sebaran populasi tidak dipenuhi maka perlu
dilakukan transformasi data, salah satunya adalah transformasi pangkat yang
ditemukan oleh Box dan Cox tahun 1964, sehingga dikenal dengan nama transformasi
Box-Cox. Di lain pihak pada tahun 1945 Frank Wilcoxon memperkenalkan metode
statistik non parametrik yang bebas dari sebaran populasi yang sekarang
dikenal dengan Uji Tanda Peringkat. Kemudian berkembang
metode-metode non parametrik untuk analisis padanan dari metode parametrik.
Seperti tahun 1952 W. H. Kruskal dan W. A. Wallis memperkenalkan uji non
parametrik yang berpadanan dengan uji kesamaan mean pada analisis varians yang
dikenal dengan nama Uji Kruskal-Wallis. Pada tahun 1958 Kaplan mengunakan
metode non parametrik untuk pendugaan sekuensial.
Pada akhirnya dengan
adanya perkembangan teknologi komputer metode eksplorasi data berkembang pesat
sekitar tahun 1970. J. W. Tukey
(1915- ) mempunyai kontribusi besar
dalam pengembangan metode eksplorasi baik secara grafis maupun numerik. Beberapa penemuannya adalah diagram
dahan-daun dan diagram kotak garis.
Pada pertengahan 1970
Efron memperkenalkan Metode Bootstrap
untuk menduga parameter dari sebaran yang tidak diketahui bentuknya.
Bootstraping ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan
oleh Queneiville pada tahun 1948.
Berhubung metode ini pada awalnya tidak membobotkan model peluang,
tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach. Pada dekade 80-an perkembangan metode non
parametrik mulai sering digunakan seperti pada regresi nonparametrik, estimasi
distribusi dengan kernel, dan neural network.
Daftar Pustaka
Gani,
J. 1982.
The Making of Statisticians.
Springer- Verlag. New York.
Mallows,
C. (1998). 1997, Fisher Memorial
Lecture. The Zeroth Problem. ASA 52(1) : 1-9.
Nasoetion,
A. H. dan Rambe, A. 1984. Teori
Statistika untuk ilmu-ilmu Kuantitatif.
Bhratara Karya Aksara. Jakarta.
Parzen.
Emanuel. 2002. Data Mining, Statistical Methods Mining and History of
Statistics”. (Department of
statistics Texas A & M University College) termuat di internet.
Rao, C.
R. and Szekely, G. J. 2000. Statistics for The 21st
Century. Methodologies for
Applications of the future. Marcell
Dekker. New York.
Rao, C.
R. 2001 Has Statistics a Future ? If So
in What Form ? termuat di internet.
0 komentar:
Posting Komentar