Pendahuluan
Mata kuliah statistika bagi mahasiswa sangat diperlukan terutama ketika seorang mahasiswa harus mengumpulkan, mengolah, menganalisis dan menginterprestasikan data untuk pembuatan skripsi, thesis atau disertasi. Dalam hal ini pengetahuan statistik dipakai dalam menyusun metodologi penelitian.
Sebagai suatu ilmu, kedudukan statistika merupakan salah satu cabang dari ilmu matematika terapan. Oleh karena itu untuk memahami statistika pada tingkat yang tinggi, terebih dahulu diperlukan pemahaman ilmu matematika.
Dinegara maju seperti Amerika, Eropa dan Jepang, ilmu statistika berkembang dengan pesat sejalan dengan berkembangnya ilmu ekonomi dan teknik. Bahkan kemajuan suatu negara sangat ditentukan oleh sejauh mana negara itu menerapkan ilmu statistika dalam memecahkan masalah-masalah pembangunan dan perencanaan pemerintahannya. Jepang sebagai salah satu negara maju, konon telah berhasil memadukan ilmu statistika dengan ilmu ekonomi, desain produk, psikologi dan sosiologi masyarakat.
Sejauh itu ilmu statistika digunakan pula untuk memprediksi dan menganalisis perilaku konsumen, sehingga Jepang mampu menguasai perekonomian dunia sampai saat ini.
Statistik dan Statistika
Statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu.
Contoh :
Statistik penduduk adalah kumpulan angka-angka yang berkaitan dengan masalah penduduk.
Statistik ekonomi adalah kumpulan angka-angka yang berkaitan dengan masalah ekonomi.Statistika adalah pengetahuan yang berkaitan dengan metode, teknik atau cara mengumpulkan, mengolah, menganalisis dan menginterprestasikan data untuk disajikan secara lengkap dalam bentuk yang mudah dipahami penggunanya.
Pengertian Data
Dalam statistika dikenal beberapa jenis data. Data dapat berupa angka dapat pula bukan berupa angka. Data berupa angka disebut data kuantitatif dan data yang bukan angka disebut data kualitatif.
Berdasarkan nilainya dikenal dua jenis data kuantitatif yaitu data diskrit yang diperoleh dari hasil perhitungan dan data kontinue yang diperoleh dari hasil pengukuran.
Menurut sumbernya data dibedakan menjadi dua jenis yaitu data interen adalah data yang bersumber dari dalam suatu instansi atau lembaga pemilik data dan data eksteren yaitu data yang diperoleh dari luar.
Data eksteren dibagi menjadi dua jenis yaitu data primer dan data sekunder. Data primer adalah data yang langsung dikumpulkan oleh orang yang berkepentingan dengan data tersebut dan data sekunder adalah data yang tidak secara langsung dikumpulkan oleh orang yang berkepentingan dengan data tersebut.
Jenis – Jenis Statistika
Statistika dibedakan berdasarkan jenisnya menjadi dua yaitu Statistika Deskriptif dan Statistika Inferensia.
Statistika deskriptif adalah statistika yang berkaitan dengan metode atau cara medeskripsikan, menggambarkan, menjabarkan atau menguraikan data. Statistika deskripsi mengacu pada bagaimana menata, menyajikan dan menganalisis data, yang dapat dilakukan misalnya dengan menentukan nilai rata-rata hitung, median, modus, standar deviasi atau menggunakan cara lain yaitu dengan membuat tabel distribusi frekuensi dan diagram atau grafik.
Statistika inferensia adalah statistika yang berkaitan dengan cara penarikan kesimpulan berdasarkan data yang diperoleh dari sampel untuk menggambarkan karakteristik dari suatu populasi. Dengan demikian dalam statistika inferensia data yang diperoleh dilakukan generalisasi dari hal yang bersifat kecil (khusus) menjadi hal yang bersifat luas (umum).
Populasi Dan Sampel
Populasi adalah keseluruhan pengamatan atau obyek yang menjadi perhatian sedangkan Sample adalah bagian dari populasi yang menjadi perhatian.
Populasi dan sample masing-masing mempunyai karakteristik yang dapat diukur atau dihitung. Karakteristik untuk populasi disebut parameter dan untuk sample disebut statistik.
Contoh parameter adalah mean (standar deviasi , proporsi, dan korelasi)
Populasi orang atau individu adalah keseluruhan orang atau individu (dapat pula berupa benda-benda) yang menjadi obyek perhatian.
Populasi data adalah populasi yang terdiri atas keseluruhan karakteristik yang menjadi obyek perhatian.
Sample juga dibedakan menjadi dua jenis yaitu :
Sampel orang atau individu adalah sampel yang terdiri atas orang-orang (dapat pula berupa benda-benda) yang merupakan bagian dari populasinya yang menjadi obyek perhatian.
Sampel data adalah sebagaian karakteristik dari suatu populasi yang menjadi obyek perhatian.
Meskipun populasi merupakan gambaran yang ideal, tetapi sangat jarang penelitian dilakukan memakai populasi. Pada umumnya yang dipakai adalah sample. Ada beberapa alasan mengapa penelitian dilakukan menggunakan sample :
1. Waktu yang diperlukan untuk mengumpulkan data lebih singkat.
2. Biaya lebih murah.
3. Data yang diperoleh justru lebih akurat.
4. Dengan statistika inferensia dapat dilakukan generalisasi.
Cara Mengumpulkan Data
Untuk memperoleh data yang benar dan dapat dipertanggung jawabkan keabsahannya, data harus dikumpulkan dengan cara dan proses yang benar. Terdapat beberapa cara atau teknik untuk mengumpulkan data yaitu :
1. Wawancara (interview) yaitu cara untuk mengumpulkan data dengan mengadakan tatap muka secara langsung. Wawancara harus dilakukan dengan memakai suatu pedoman wawancara yang berisi daftar pertanyaan sesuai tujuan yang ingin dicapai.
Ada dua jenis wawancara yaitu wawancara berstruktur (structured interview) dan wawancara takberstruktur (unstructured interview). Wawancara berstruktur adalah wawancara yang jenis dan urutan dari sejumlah pertanyaannya sudah disusun sebelumnya, sedangkan wawancara takberstruktur adalah wawancara yang tidak secara ketat ditentukan sebelumnya. Wawancara takberstruktur lebih fleksibel karena pertanyaannya dapat dikembangkan meskipun harus tetap pada pencapaian sasaran yang telah ditentukan.
Ciri-ciri pertanyaan yang baik adalah :
a. Sesuai dengan masalah atau tujuan penelitian.
b. Jelas dan tidak meragukan.
c. Tidak menggiring pada jawaban tertentu.
d. Sesuai dengan pengetahuan dan pengalaman orang yang diwawancarai.
e. Pertanyaan tidak boleh yang bersifat pribadi.
Kelebihan dari wawancara adalah data yang diperlukan langsung diperoleh sehingga lebih akurat dan dapat dipertanggung jawabkan.
Kekurangannya adalah tidak dapat dilakukan dalam skala besar dan sulit memperoleh keterangan yang sifatnya pribadi.
2. Kuesioner (angket) adalah cara mengumpulkan data dengan mengirim atau menggunakan kuesioner yang berisi sejumlah pertanyaan.
Kelebihannya adalah dapat dilakukan dalam skala besar, biayanya lebih murah dan dapat memperoleh jawaban yang sifatnya pribadi.
Kelemahannya adalah jawaban bisa tidak akurat, bisa jadi tidak semua pertanyaan terjawab bahkan tidak semua lembar jawaban dikembalikan.
3. Observasi (pengamatan) adalah cara mengumpulkan data dengan mengamati obyek penelitian atau kejadian baik berupa manusia, benda mati maupun gejala alam. Data yang diperoleh adalah untuk mengetahui sikap dan perilaku manusia, benda mati atau gejala alam. Kebaikan dari observasi adalah data yang dieroleh lebih dapat dipercaya. Kelemahannya adalah bisa terjadi kesalahan interpretasi terhadap kejadian yang diamati.
4. Tes dan Skala Obyektif adalah cara mengumpulkan data dengan memberikan tes kepada obyek yang diteliti. Cara ini banyak dilakukan pada tes psikologi untuk mengukur karakteristik kepribadian seseorang. Beberapa contoh tes skala obyektif yaitu :
a. Tes kecerdasan dan bakat.
b. Tes kepribadian.
c. Tes sikap.
d. Tes tentang nilai.
e. Tes prestasi belajar, dsb.
5. Metode proyektif adalah cara mengumpulkan data dengan mengamati atau menganalisis suatu obyek melalui ekspresi luar dari obyek tersebut dalam bentuk karya lukisan atau tulisan. Metode ini dipakai dalam psikologi untuk mengetahui sikap, emosi dan kepribadian seseorang. Kelemahan dari metode ini adalah obyek yang sama dapat disimpulkan berbeda oleh pengamat yang berbeda.
Skala Pengukuran
Salah satu aspek penting dalam memahami data untuk keperluan analisis terutama statistika inferensia adalah Skala Pengukuran. Secara umum terdapat 4 tingkat/jenis skala pengukuran yaitu :
1. Skala nominal adalah skala yang hanya mempunyai ciri untuk membedakan skala ukur yang satu dengan yang lain. Contoh skala nominal seperti tabel dibawah ini :
| Jenis dan Jumlah buah-buahan yang |
| Diproduksi suatu Daerah pada Tahun 1998 |
| Jenis Buah-Buahan | Jumlah |
| Pepaya | 2 ton |
| Mangga | 1,5 ton |
| Apel | 1 ton |
| Duku | 1,4 ton |
| Manggis | 1,3 ton |
| |
| Sumber: Data Buatan | |
2. Skala Ordinal adalah skala yang selain mempunyai ciri untuk membedakan juga mempunyai ciri untuk mengurutkan pada rentang tertentu. Contoh skala ordinal seperti tabel dibawah ini :
| Penilaian Anggota Kelompok Belajar “ Bina Pintar “ |
| Kategori Nilai | Banyaknya |
| Istimewa | 6 orang |
| Baik | 18 orang |
| Rata-rata | 15 orang |
| Kurang | 7 orang |
| Kurang sekali | 0 orang |
| Sumber : Data Buatan |
3. Skala Interval adalah skala yang mempunyai ciri untuk membedakan, mengurutkan dan mempunyai ciri jarak yang sama. Contoh, suhu tertinggi pada bulan Desember dikota A, B dan C berturut-turut adalah 28, 31 dan 20 derajat Fahrenheit. Kita dapat membedakan dan mengurutkan besarnya suhu, sebab satu derajat Fahrenheit merupakan suatu besaran yang tetap, namun pada saat suhu menunjukkan nol derajat Fahrenheit tidak berarti tidak adanya panas pada kondisi tersebut. Hal ini dapat dijelaskan, misalnya kota A bersuhu 30 derajat Fahrenheit dan kota B bersuhu 60 derajat Fahrenheit, tidak dapat dikatakan bahwa suhu dikota B dua kali lebih panas dari pada suhu dikota A, karena suhu tidak mempunyai titik nol murni (tulen).
4. Skala ratio adalah skala yang mempunyai 4 ciri yaitu membedakan, mengurutkan, jarak yang sama dan mempunyai titik nol yang tulen (berarti). Contoh : Pak Asmuni mempunyai uang nol rupiah, artinya pak Asmuni tidak mempunyai uang.
PENYAJIAN DATA
Secara garis besar ada dua cara penyajian data yaitu dengan tabel dan grafik. Dua cara penyajian data ini saling berkaitan karena pada dasarnya sebelum dibuat grafik data tersebut berupa tabel. Penyajian data berupa grafik lebih komunikatif.
Dilihat dari waktu pengumpulannya, dikenal dua jenis data yaitu :
Cross section data adalah data yang dikumpulkan pada suatu waktu tertentu.
Data berkala adalah data yang dikumpulkan dari waktu ke waktu. Dengan data berkala dapat dibuat garis kecenderungan atau trend.
Penyajian data dengan tabel
Tabel atau daftar merupakan kumpulan angka yang disusun menurut kategori atau karakteristik data sehingga memudahkan untuk analisis data.
Ada tiga jenis tabel yaitu :
Tabel satu arah atau satu komponen adalah tabel yang hanya terdiri atas satu kategori atau karakteristik data. Tabel berikut ini adalah contoh tabel satu arah.
| Banyaknya Pegawai Negeri Sipil Menurut Golongan Tahun 1990 |
| Golongan | Banyaknya (orang) |
| I | 703.827 |
| II | 1.917.920 |
| III | 309.337 |
| IV | 17.574 |
| Jumlah | 2.948.658 |
| Sumber : BAKN, dlm Statistik Indonesia, 1986 |
Tabel dua arah atau dua komponen adalah tabel yang menunjukkan dua kategori atau dua karakteristik. Tabel berikut ini adalah contoh tabel dua arah.
| Jumlah Mahasiswa UPH menurut Fakultas dan Kewarganegaraan 1995 |
| Fakultas | WNI | WNA | Jumlah |
| Fak. Ekonomi | 1850 | 40 | 1890 |
| Fak. Teknologi Industri | 1320 | 10 | 1330 |
| Fak. Seni Rupa & Design | 530 | 5 | 535 |
| Fak. Pasca Sarjana | 250 | 10 | 260 |
| Jumlah | 3950 | 65 | 4015 |
| Sumber : Data Buatan |
Tabel tiga arah atau tiga komponen adalah tabel yang menunjukkan tiga kategori atau tiga karakteristik. Contoh tabel berikut ini.
| Jumlah Pegawai Menurut Golongan, Umur dan Pendidikan pada Departeman A Tahun 2000 |
| Golongan | Umur (tahun) | Pendidikan |
| 25 – 35 | > 35 | Bukan Sarjana | Sajana |
| I | 400 | 500 | 900 | 0 |
| II | 450 | 520 | 970 | 0 |
| III | 1200 | 2750 | 1850 | 2100 |
| IV | 0 | 250 | 0 | 250 |
| Jumlah | 2.050 | 4020 | 3720 | 2350 |
| Sumber : Data Buatan |
Penyajian data dengan grafik/diagram
Penyajian data dengan grafik dianggap lebih komunikatif karena dalam waktu singkat dapat diketahui karakteristik dari data yang disajikan.
Terdapat beberapa jenis grafik yaitu :
Grafik garis (line chart)Grafik garis atau diagram garis dipakai untuk menggambarkan data berkala. Grafik garis dapat berupa grafik garis tunggal maupun grafik garis berganda.
Grafik batang / balok (bar chart)Grafik batang pada dasarnya sama fugsinya dengan grafik garis yaitu untuk menggambarkan data berkala. Grafik batang juga terdiri dari grafik batang tunggal dan grafik batang ganda.
Grafik lingkaran (pie chart)Grafik lingkaran lebih cocok untuk menyajikan data cross section, dimana data tersebut dapat dijadikan bentuk prosentase.
Grafik Gambar (pictogram)Grafik ini berupa gambar atau lambang untuk menunjukkan jumlah benda yang dilambangkan.
Grafik Berupa Peta (Cartogram).Cartogram adalah grafik yang banyak digunakan oleh BMG untuk menunjukkan peramalan cuaca dibeberapa daerah.
Model Probabilitas
Sampling
Karena nafas dari probabilitas dan statistika adalah pengamatan (observasi) maka disini dijelaskan sejumlah terminologi yang berkaitan dengan itu. Yang disebut “pengamatan” itu sendiri bisa berupa proses melihat sederhana atau suatu deretan proses: mengukur, lalu menghitung, dlsb. yang pada akhirnya menghasilkan outcome atauhasil pengamatan.
Suatu pengamatan tidak selamanya dapat dilakukan secara menyeluruh. Oleh sebab itu pengamatan hanya dilakukan sebagian saja dari keseluruhan itu. Hal ini dikatakan bahwa kita melakukan sampling, yang artinya “melakukan observasi pada sebagian saja dari keseluruhan itu”.
Sampel
Sampel sendiri adalah obyek dari kegiatan pengamatan itu. Lalu Bagaimana kah caranya melakukan sampling? Pada saat ini belum waktunya membicarakan hal tersebut karena disini yang akan dibahas adalah terminologi yang terkait dengan sampling. Teori sampling merupakan bagian dari metode statistika yang tidak dapat dibahas swecara singkat.
Ruang Sampel
Semua kemungkinan sampel pengamatan yang dapat dilakukan disebut ruang sampel S. Penjelasan dengan teori himpunan maka ruang sampel adalah himpunan semesta 1 dari seluruh kemungkinan outcome. Outcome itu sendiri adalah anggota himpunan ruang sampel. Jadi ruang sampel benar-benar sebagai himpunan yang dapat beranggotakan 0 hingga tak berhingga. Misalnya satu obyek dadu dilemparkan secara berulang, dan pada setiap lemparan angka yang keluar diamati maka ruang sampel berisikan angka-angka “1” sampai dengan “6”. Pengamatan bisa terdiri juga atas beberapa pengamatan, misalnya melemparkan dadu dua kali berturut-turut maka akan menghasilkan outcome total angka yang muncul dengan ruang sampel {2, 3, …, 12}. Pengamatan ini dilakukan sebagai dua kali pengamatan: pengamatan pada lemparan dadu pertama dan pengamatan pada yang kedua. Sebagaimana dalam himpunan, ruang sampel dapat beranggota tertentu (countably) atau tak terbatas (uncountably). Ruang sampel dapat memiliki outcome-outcome berharga diskret atau kontinyu. Contoh ruang sampel berhingga yang diskret adalah pada lemparan dadu di atas. Jika anda mengukur tinggi badan seseorang outcome dari pengukuran itu kontinyu. Setiap ruang sampel kontinyu pasti tak berhingga. Mengapa? Sementara itu, ruang sampel yang diskret mungkin berhingga mungkin pula tak berhingga. Contohnya jika anda menghitung berapa kali anda melemparkan dadu sehingga anda mendapatkan lima kali berturut-turut selalu menghasilkan angka 6 pada setiap le mparannya.
Istilah sampel dalam terminologi ruang sampel ini lebih terkait ke hasil pengamatannya bukan pada obyek itu sendiri. Satu obyek jika diamati berulang bisa saja menghasilkan lebih dari satu outcome, bisa juga tidak ada outcome. Walaupun mungkin menjadi diskret karena pembulatan sesuai ketelitian alat ukur dan mata
Event
Suatu event adalah sejumlah pengamatan yang menghasilkan outcome-outcome dengan spesifikasi tertentu. Contoh, pelemparan dadu yang menghasilkan angka-angka bilangan genap. Analogi dengan teori himpunan maka event ini merupakan himpunan outcome pula yang merupakan himpunan bagian dari ruang sampel. Dari suatu ruang sampel dapat terdefinisi sejumlah event dan event-event itu bisa saling beririsan atau tidak beririsan, bisa juga yang satu menjadi himpunan bagian dari yang lain. Dengan operasi-operasi himpunan, maka dari dua event dioperasikan menghasilkan satu event baru. Ruang sampel dapat dipandang sebagai suatu event pula. Jadi semua sifat himpunan berlaku pada event dan notasi penulisannyapun menggunakan notasi himpunan.
Ringkasan notasi dan sifat-sifat himpunan yang dapat digunakan untuk event
• : notasi anggota event
• : notasi bukan anggota event
• Ø: event kosong (event tanpa elemen)
• Event komplemen
A = {x U |xA}
• Diagram Venn: memperlihatkan hubungan/operasi antara himpunan
• pr. gabungan:
AB= {x|xA atau xB}
• Opr. irisan:
A n B = {x|xA dan xB}
• Opr. perbedaan:
A–B= {x|xA danxB}
• Opr. perbedaan simetris:
AB= (A - B) (B - A)
• "A dan B disjoin": jika
AnB= Ø,
• Himpunan bagian: "A B" jika untuk setiap
xA maka xB tetapi ada kemungkinan y B, ternyata y A
• Himpunan bagian: "A B" jika untuk setiap
xA maka xB tetapi pasti ada kemungkinan yB, ternyata yA
• Sifat-sifat himpunan: komutatif, asosiatif, distributif, idempoten, absorptif
• Hukum De Morgan:
AB= (A’ n B’)’
Ruang sampel S dikatakan di-partisi menjadi event-event
A,A, …,A jika dan11n hanya jika •…AAA= S12n•nAA= Ø, untuk setiap 1 =i,j=n
danijij
Dalam suatu ruang sampel bisa terdefinisi sekian banyak event. Semua kemungkinan
even yang dapat didefinisikan dari satu ruang sampel adalah himpunan seluruh I
kemungkinan event
Probabilitas Mengingat satu event dengan event lainnya memiliki kecenderungan (likelihood) untuk muncul yang bisa tidak sama maka kemungkinan ini dikuantifikasi sebagai fungsi probabilitas dari kemungkinan kemunculan even (atau disingkat probabilitas event P). Fungsi probabilitas mengikuti aksioma.