Mira Mind's: ANALISIS REGRESI & KORELASI LINEAR

BAB 15

15.1 Pengantar

BAGIAN III STATISTIK INDUKTIF
Metode & distribusi sampling
Pengertian korelasi sederhana dan kegunaannya

BAB 15

15.1 Pengantar

BAGIAN III STATISTIK INDUKTIF
Metode & distribusi sampling
Pengertian korelasi sederhana dan kegunaannya

Teori pendugaan statistik
Uji signifikansi koefisien korelasi
Analisa regresi : metode kuadrat terkecil
Pegujian hipotesa sample besar
Pengujian hipotesa sample kecil
Kesalahan buku pendugaan
Analisis regresi dan korelasi linear
Perkiraan interval dan pengujian hipotesa
Hubungan koefisien korelasi, koefisien determinasudan kesalahan buku pendugaan
Analisis regresi dan korelasi berganda
Fungsi, variable dan masalah dalam analisis regresi
BAGIAN IV STATISTIKA NON - PARAMETRIK PARAMETIK
Uji Chi - kuadrat
Data berperingkat
Pengendalian mutu statistik

15.1 Pengantar

Dalam bab ini akan di bahas mengenai hipotesa, tujuan dari pengujian tersebut yaitu untuk mendapatkan bukti yang cukup apakah kesimpulan yang diperoleh dari sanpel mencerminkan kondisi sebenarnya. Dalam babini juga akan dibahas mengenai hubunagn antara dua atau lebih variabel serta mengetahui pengaruh suatu variabel baik besar dan arahnya terhadap variabel lain. Contoh yang biasa tejadi dalam kehidupan sehari – hari misalnya, apabila musim kemarau dan matahari sangat terik, maka orang membutuhkan paying sebagai pelindung atau es sebagai pelepas dahaga, jadi terdapat hubungan antara musim dengan apyung dan es. Contoh lain adalah inflasi dan suku bunga, apabila inflasi meningkat berarti terjadi kenaikan harga barang dan jasa, maka ada kecenderungan suku bunga akan menurun untuk menurunkan laju inflasi tersebut, sehingga dapat diduga adanya hubungan antara inflasi denagn suku bunga.

Dengan mengetahui adanya hubungan antara variabel, maka dapat dilakukan pendugaan suatu variabel berdasarkan variabel lain melalui persamaan yang dibuat atas hubungan tersebut. Letak pentingnya hal ini yaitu untuk mengetahui dampak yang terjadi akibat perubahan suatu variabel terhadap variabel lain sehingga dapat dilakukan antisipasi dalam menghadapi dampak tersebut.

Contoh kasus hubungan antar – variabel dalam kehidupan social ekonomi yaitu :
Pengaruh nilai kurs dalam kehidupan ekonomi suatu Negara . Jika suatu Negara mengadakan hubungan dagang dengan suatu Negara maka dia memerlukan adanya alat pembayaran yang disebut mata uang yang mana nilai nya disebut dengan kurs. Nilai kurs yang tidak stabil bisa mengakibatkan ketidakpastian bagi importer dan eksportir. Selain itu nilai kurs yang semakin tinggi akan mengakibatkan tingginya nilai barang impor tersebut yang dapat menggangu dalam proses industri dan konsumsi.
Banyaknya pengangguran yang disebabkan oleh menurunnya investasi disebabkan oleh suku bunga investasi yang masih tinggi. Dan, pihak perbankan yang belum menurunkan suku bunga kredit . Jadi hubungan natar suku bunga dan investasi adalah adalah negative. Apabila suku bunga meningkat 1%, maka investasi akan menurn sebesar 100. Perubahan saldo penurunan bunga meningkar,
Produksi atau komoditi pada umunya, dipengaruhi oleh factor harga disamping factor iklim. Apabila harga komoditi meningkat, maka produksinya akan meningkat juga, begitu umumnya terjadi pada kasus komoditi cabai, kelapa sawit dan produk pertanian lainya.

Pada ketiga contoh diatas baik menegnai hubungan antara nilai kurs dengan impor investasi dengan suku bunga maupun produksi dengan harga, menunjukan hubungan antara suatu variable dengan variable lainnya, atau pengaruh suatu variable terhadap variable lainnya.

15.2 Analisis korelasi sederhana
Analisis korelasi pertama kali dikembangkan oleh Karl Pearson pada tahun 1990. Tujuannya yaitu untuk menentukan seberapa erat hubungan antara dua variable . Analisis korelasi adalah suatu teknik statistika yang digunakan untuk mengukur keeratan hubungan atau korelasi antara dua variable.
ungan produksi dan harga
Minyak goring (korelasi positif)
Harga minyak goreng

Gbr inflasi & suku bunga Gbr produksi minyak goreng & harga
Analisis korelasi mencoba mengukur keeratan hubungan antara dua variable X dan Y. Keeratan hubungan antara dua varaibel tersebut dinyatakan dalam bentuk koefisien korelasi yang dilambangkan dengan huruf r.

15.2.1 Koefisien Korelasi
Ukuran korelasi antara dua buah varaibel yang paling banyak digunakan adalah koefisien korelasi momen yang dikembangkan oleh Perason. Rumus koefisien korelasi tersebut dinyatakan sebagai berikut :
N(∑XY) – (∑X)( ∑Y)
=
√ [n(∑X2) – (∑X)2] [N((∑Y2) – (∑Y)2]

Dimana : r = Nilai koefisien korelasi
∑X = Jumlah pengamatan variabel X
∑Y = Jumlah pengamatan variabel Y
∑XY = Jumlah hasil perkalian variable x dan y
(∑X2 ) = Jumlah kuadrat dari pengamatan varaibel X
(∑X)2 = Jumlah kuadrat dari jumlah pengamatan variable X
(∑Y2) = Jumlah kuadrat dari pengamatan variable Y
(∑Y)2 = Jumlah kuadrat dari jumlah pengamatan variable Y
N = Jumlah pasangan pengamatan Y dan X
Hubungan kuat dan lemahnya suatu korelasi
Koefisien korelasi mempunyai nilai rata – rata -1 sampai 1. Nilai r = -1 yang disebut dengan linier sempurna negative terjadi apabila titik contoh atau kombinasi terletak tepat pada suatu gais lurus yang mempunyai kemiringan negative. Nilai r = 1 disebut dengan linier sempurna positif, dan hal ini terjadi apabila semua titik contoh terletak tepat pada satu garis lurus dengan kemiringan positif. Jika nilai korelasinya mendekati -1 samapi 1 maka hubungan kedua variable adalah kuat atau korelasi kedua variable tinggi.

Korelasi negatif
Korelasi positif
Korelasi negative
sempurna
Korelasi negative
sedang
Tidak ada korelasi
Korelasi positif
sedang
Korelasi positif
sempurna
Korelasi negative
kuat
Korelasi negative
lemah
Korelasi positif
lemah
Korelasi positif
kuat
-1.0
-0.5
0.0
0.5
1.0

Contoh soal :
Ir. Abu Rizal Bakri selaku ketua KADIN mengharapkan agar pemerintah segera menurunkan tingkat suku bunga kredit. Hal tersebut didasarkan bahwa selama suku bunga tinggi, maka investasi akan menurun sehingga akan berdampak pada peningkatan pengangguran. Bagaimana sebenarnya hubungan antara suku bunga kredit dengan besarnya investasi? Berikut adalah data besarnya suku bunga dan investasi domestic di Indonesia pada tahun 1996 sampai 2002. Carilah koefisien korelasinya dan apa kesimpulannya?

Jawab :
Rumus koefisien korelasi

N(∑XY) – (∑X)( ∑Y)
=
√ [n(∑X2) – (∑X)2] [N((∑Y2) – (∑Y)2]

Untuk menghitung koefisien korelasi diperlukan penghitungan sebagai berikut :

Jadi = 9 x 8558054 – 196 x 404618
√[9(4478) – (196)2] [9(19888392650) – (404618)2]
= -0,412
Koefisien korelasi antara suku bunga dan investasi sebesar -0.412. Tanda negative ini menunjukan bahwa apabila suku bunga meningkat, maka investasi menurun dan sebaliknya apabila suku bunga turun, maka investasi meningkat. Nilai koefisien korelasi -0.412 termasuk dalam korelasi negative lemah.

15.2.2 Koefisien Determinasi
Merupakan ukuran untuk mengetahui kesesuain atau ketepatan antara nilai dugaan atau garis regresi dengan data sample. Koefisien Determinasi adalah bagian dari keragaman total variable tak bebas Y (variable yang dipengaruhi atau dependent) yang dapat diterangkan atau diperhitungkan oleh keragaman variable bebas X (variabel yang mempengaruhi atau independent).
Jadi koefisien determinasi adalah kemampuan variable X (variable independent) mempengaruhi variable Y (variable dependent). Semakin besar koefisien determinasi menunjukan semakin baik kemampuan X menerangkan Y. Besarnya koefisien determinasi adalah kuadrat dari koefisien korelasi dan dirumuskan sbb :

[ N(∑XY) – (∑X)( ∑Y)]2
=
√ [n(∑X2) – (∑X)2] [N((∑Y2) – (∑Y)2]

Contoh soal :
Carilah koefisien korelasi pada kasus hubungan antara suku bunga dengan investasi dan harga minyak dengan produksi minyak kelapa sawit, serta jelaskan apa artinya :
Jawab :
1. Koefisien korelasi antara suku bunga dengan investasi sebesar = -0.412, sehinga koefisien determinasi = r2 = -0.412 = 0,1681. Ini berarti bahwa kemampuan variable X (suku bunga) dalam menerangkan keragaman variable Y (investasi) sebesar 16,81%, sedang sisanya yaitu 83,19% oleh variable lainnya.
2. Koefisien korelasi antara harga minyak denagn produksi kelapa sawit sebesar = 0,862 , sehingga koefisien determinasi = r2=0,862 = 0,7396. Ini berarti bahwa kemampuan variable X (harga minyak) dalam menerangkan keragaman variable Y(produksi) sebesar 73, 96% sedang sisanya yaitu 26,04oleh variable lainnya.
3. Koefisien determinasi pada contoh 15-2 ternyata lebih besar dari contoh 15-1. Hal ini menunjukan bahwa semakin besar koefisien determinasi sebenarnya semakin baik. Karena kemampuan variable bebas (X) dalam menjelaskan variable tidak bebas(Y)semakin baik. Koefisien determinasi yang relative besar juga menunjukan spesifikasi atau pernyataan yang menghubungkan sesuatu dengan sesuatu yang lain lebih benar.

15.3 Uji signifikansi koefisien korelasi
Dimaksudkan untuk menguji apakah besarnya atau kuatnay hubungan antar – variable yang diuji sama dengan nol.Uji signifikansi koefisien korelasi dilakuakn mellaui 5 tahap sebagaimana pada pengujian hipotesa sample besar dan kecil yaitu :
Perumusan hopotesa yaitu menguji apakah r populasi(p) sama dengan nol.
Menentukan taraf nyata (α) dengan derajat bebas (df)=n-k
Menentukan uji stastistika
Menetukan daerah keputusan
Menentukan keputusan
Uji statistika untuk koefisien korelasi ( r ) adalah
t= r√n-2 atau t= r
√1-r2 √1-r2/n-2

Dimana : t : nilai t hitung
r : nilai koefisien korelasi
n : Jumlah data pengamatan

contoh Ujilah nilai (a) nilai r = -0,412 pada hubungan antara suku bunga dan investasi dan (b) r = 0,86 pada hubungan antara harga minyak dan produksi kelapa sawit sama dengan nol pada taraf nyata 5%?
Jawab :
Perumusan hipotesa, hipotesa diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam populasi dilambangkan dengan p, sedang pada sampel r.
H0 = 0
H1 ≠ 0
Taraf nyata 5% untuk uji dua arah (α/2 = 0,025) dengan derajat bebas (df) = n-k=9-2=7. Nilai taraf nyata α/2 = 0,025 dan df = 7 adalah =2,36. Ingat bahwa n adalah jumlah data pengamatan yaitu = 9, sedangkan k adalah jumlah variable Y dan X, jadi k = 2.
Menentukan nilai uji t
r = -0,41
t = √1-r2 / n - 2 √ 1- (-0,41)2/ 9-2 = 1,21

Menentukan daerah keputusan dengan nilai kritis 2,36

Menentukan keputusan . Nilai t-hitung ternyata terletak pada daerah tidak menolak H0. Ini menunjukan bahwa tidak terdapat cukup bukti untuk menolak H0, sehingga dapat disimpulkan bahwa korelasi dalam populasi sama dengan nol, dan hubungan antara tingkat suku bunga dengan investasi lemah dan tidak nyata.
Jawaban soal B :
Perumusan hipotesa :
Hipotesa yang diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam populasi dilambangkan dengan p, sedang pada sample r.
H0 : p = 0
H0 : p ≠ 0
Taraf nyata 5% untuk uji dua arah (α/2 = 0,05/2 = 0,025) dengan derajat bebas (df) =
N – k = 12 – 2 = 10. Nilai taraf nyata α/2 = 0,025 dan df = 10 adalah 2,23
3. Menentukan nilai uji t

t = r√n – 2 / √1-r2 = 0,86√ 12 – 2 / √ 1- (0,86)2 = 5,33

4. M entukan daerah keputusan dengan nilai kritis 2,23
5. Menentukan keputusan . Nilai t-hitung berada di daerah menolak H0. Yang berarti bahwa
H0 di tolak dan menerima H1, ini menun jukan bahwa koefisien korelasi pada populasi
Tidak sama dengan nol, dan ini membuktikan bahwa terdapat hubungan yang kuat dan nyata
Dan nyata antara harga minyak dan produksi kelapa sawit.

Bagaimana menggunakan MS. Excel untuk mencari Korelasi
Beberapa langkah yang dapat ditempuh :
Masukkan data Y ke kolom A, dan data X ke kolom B
Klik icon insert dan pilih fungsi fx function
Setelah memilih fx function muncul kotak dialog seperti dibawah ini. Pilihlah statistical pada function category dan corel pada function name:
Setelah pada langkah ke 3, maka muncul kotak dialog seperti berikut ini. Buatlah blok pada kolom a untuk Array 1 dan kolom B untuk array 2. Pada contoh ini blok untuk kolom A adalah (A2:A13) dan kolom B(B2:B13). Hasilnya berupa korelasi muncul pada formula result atau tanda sama dengan (=) yaitu sebesar 0,855.

15.4 Analisis regresi
Analisis regresi yaitu suatu tehnik yang digunakan untuk membangun suatu persamaan yang menghuibungkan antara varaibel tidak bebas (Y) dengan varaibel bebas (X) dan sekaligus untuk menentukan nilai ramalan atau dugaannya. Persamaan regresi adalah suatu persamaan matematika yang mendefinisikan hubungan antara dua variable. Bentuk sebenarnya dari persamaan regresi pada populasi adalah Y = A + B X. Karena dalam kenyataannya tidak dapat diketahui nilai sebenarnya dari parameter A dan B., maka dapat diperkirakan dengan dengan menggunakan data sampel yang ditarik dari populasi, sehingga bentuk persamaan regresi perkiraannya menjadi Y = a + bX. Beberapa langkah yang ditempuh untuk mendapatkan persamaan regresi yaitu :

Pengumpulan data dari variable Y dan X
Membuat gambar titik – titik kombinasi Y dan X dalam scatter diagram.
Mencari persamaan bentuk kurvanya (curve fitting)
Contoh scatter diagram untuk hubungan antara inflasi dan suku bunga dapat digambarkan sebagai berikut :

Inflasi
Hubungan inflasi dan suku bunga
Suku bunga

inflasi
Hubungan inflasi dan suku bunga
Gambar B
Suku
Bunga

Biasa juga dengan cara :
Berikut diberikan contoh penerapan paket program Microsoft Excel untuk analisis regresi. Misalkan data X diketik di kolom A sel 2 sampai 11 dan data Y diketik pada kolom B sel 2 sampai 11. Tahapan berikut digunakan untuk memperoleh hasil analisis regresi :
Pilih tools pada menu utama
Pilih data Analysys
Ketika kotak dialog muncul, pilih regression
Ketika kotak dialog berikutnya muncul ,
Ketik B2 : B11 pada kotak Input Y Range (letak data Y)
Ketik A2 : A11 pada kotak Input X Range (letak data X)
Ketik A14 pada kotak Output Range
Pilih OK

Cara membaca keluaran (output) tersebut adalah sebagai berikut :
Tampilan analisis regresi dapat dilihat mulai dari baris ke-14. Sel Multiple R menunjukkan koefisien korelasi sebesar 0,9501.R. Square memberikan nilai untuk koefisien determinasi (90,27%)dan Standard error menyajikannilai kesalahan baku standard (Se) sebesar 13,829. Nilai di bawah Significance F sebesar 0,000 menunjukkan bahwa hipotesis H0 : b = 0 dapat nol ditolak (nilai 0,000 biasanya dibandingkan dengan nilai A yang digunakan dalam pengujian; misalnya untuk A = 5%=0.05, jika significance F nilainya krang dari 0,05 maka hipotesis ditolak). Koefisien regresi untuk intercept adalah 60 (baris ke 30) dan koefisien regresi untuk X atau b = 5; sehingga persamaan regresinya adalah y = 60 + 5x. t stat menunjukkan nilai t observasi yang harus dibandingkan dengan ta (t-tabel) untuk keperluan pengujian koefisien regresi. Tetapi biasanya yang digunakan untuk pengujian, dalam hal ini pengujian koefisien regresi, cukup melihat niali P-value yang dibandingkan denagn nlai A (taraf pengujian).
Pendugaan interval untuk koefisien A dan B dapat dilihat pada nilai dibawah lower 95% dan upper 95%. Output diatas menunjukkan bahwa dengan tingkat kepercayaan 95% parameter A terletak antara 38,72 dan 81,28 (38,72 ≤ A ≤ 81,28), sedangkan parameter B terletak antara 3,66 dan 6,34 (3,66 ≤ B≥ 6,34) untuk persamaan regresi Y = A + BX.

5.4.1 Metode kuadrat terkecil
Metode kuadrat terkecil (ordinary least square) adalah suatu metode untuk menentukan persamaan regresi berdasarkan atas selisih kuadrat antara nilai Y sebenarnya (actual) dengan nilai Y dugaan/ramalan yang minimal atau dapat dituliskan (Y – Z) minimal. Metode kuadrat terkecil bias juga diartikan sebagai suatu metode untuk menentukan persamaan regresi dengan meminimumkan jumlah kuadrat jarak vertical antara nilai actual Y dan nilai dugaan atau ramalan Y, atau dilambangkan ∑℮2i = ∑(Y1 – Y1)2 = minimum. Bentuk prsamaan regresinya : Y = a + bx.

Dimana : Y : Nilai dugaan atau ramalan dai variable Y berdasarkan nilai variable X yang diketahui biasa disebut dengan Y “cap” atau Y topi.
a : Intersep yaitu titik potong garis dengan sumbu Y atau nilai perkiraan bagi Y pada saat nilai X sama dengan nol.
b : Slope atau kemiringan garis yaitu perubahan rata – rata pada Y untuk setiap unit
perubahan pada variable X
X : Sembarang nilai bebas yang dipilih dari vaiabel bebas.
Contoh :

Pada gambar A persamaan regresinya adalah Y = a + bx, antara nilai Y dan X mempunyai hubungan yang positif, apa bila X naik, maka nilai Y juga naik. Nilai b menunjukan persamaan regresi maka nilai Y turun. Metode kuadrat terkecil pada umumnya digunakan untuk menghitung nilai sttaistik a dan b sebagai perkiraan dari nilai parameter A dan B sedemikian rupa. . Rumus yang digunakan utnuk mencari koefisien a dan B :

b = n (∑XY) – (∑X) (∑Y) / n(∑X2) - ∑(X)2

a = (∑Y)/n – b(∑X)/n

Dimana : Y : Nilai variable bebas Y
a : Intersep yaitu titik potong garis dengan sumbu Y
b : Slope atau kemiringan garis ayitu perubahan rata – rata pada Y untuk setiap unit perubahan pada variable x .
X : Nilai variable bebas X
n : Jumlah sample
Contoh : Kita kembali pada contoh hubungan harga minyak kelapa sawit (CPO) denagn produksi kelapa sawit. Berdasarkan pada data berikut ini, tentukan persamaan regresi linearnya yaitu
Y = a + bx dan apa artinya.
Jawab :
Rumus koefisien regresi a dan b dari persamaan dugaan Y = a + bx adalah :

a = (∑Y)/n – b(∑X)/n

b = n (∑XY) – (∑X) (∑Y) / n(∑X2) - ∑(X)2

15.5. Standar error atau kesalahan baku pendugaan
Standar error atau kesalahan baku pendugaan adalah suatu ukuran ketepatan pendugaan Y berdasarkan niali X yang diketahui dengan nilai pengamatan (Y). Standar error atau kesalahn baku pendugaan adalah suatu ukuran yang mengukur ketidak akuratan pencaran atau persebaran nilai – nilai pengamatan (Y) trehadap garis regresinya (Y). Standar error selanjutnya dapat dihitung dengan menggunakan rumus berikut :

S y.x = √∑℮2 /n-2 = √∑(Y-Y)2 / n-2

Dimana : Sy.x : standar error variable Y berdasarkan variable X yang diketahui
Y : Nilai pengamatan dari Y
Y’ : Nilai dugaan dari Y
n : Jumlah sample, derajat bebas n-2 karena terdapat dua parameter yang akan diduga yaitu a dan b.
Contoh : Hitunglah standar error antara y dengan X dan standard error untuk penduga a dan bdari contoh soal sebelumnya Y = 2.8631 + 0.0086X
Jawab : Untuk mengetahui Sy.x, ada 2 rumus yang bias dipakai yaitu :
S y.x = √∑℮2 /n-2 = √∑(Y-Y)2 / n-2
S y.x = √ ∑Y2 - a∑Y - b∑XY / n-2
Untuk mengetahui nilai Sy.x maka diperlukan table seperti dibawah ini :

S y.x = √∑℮2 /n-2 = √∑(Y-Y)2 / n-2
= ∑(6.0235)2/11 – 2
= 0.818

S y.x = √ ∑Y2 - a∑Y - b∑XY / n-2
= √458,37 – 2,8631.69,67 – 0,0086.29509 / 11-2 = 0.818
Standar error untuk koefisien regresi b :
Sb = Sy.x/ [√ ∑X2 – (∑X)2/n]
= 0.818/[√1955125 – (4455)2 / 11 = 0.0021
Standar error untuk koefisien regresi a :
Sa = √ ∑X2.Sy.x)/n∑X2 - ∑X
= √ (1955125.0.818) / 11.1944125 – (4455)2 = 0.98

15.6 Asumsi – asumsi metode kuadrat terkecil
Metode kuadrat terkecil dikembangkan oleh Carl Fiedrich Gauss yang menggunakan metode terentu.Metode kuadrat terkecil berlaku untuk pendugaan interval dan menguji hipotesa koefisien regresi populasi. Berikut adalah beberapa asumsi penting tentang metode kuadrat terkecil :
1. Nilai rata – rata dari error term atau expected value untuk setiap nilai X sama dengan nol, asumsinya dinyatakan dengan : E(ei/Xi) = 0
2. Nilai error dari Ei dan Ej atau biasa disebut dengan kovarian saling tidak berhubungan atau berkorelasi, asumsi dilmabangkan dengan Cov (EI,Ej) = 0, dimana i≠j.
3. Varian dari error bersifat konstan, asumsi ini dilambangkan dengan Var (Ei/Ej) = E(ei – ej)2 = 02.
4. Variabel bebas X ridak berkorelasi dengan error term E, dilambangkan dengan Cov (Ei,i) = 0
Keempat asumsi diatas sangat penting dalam analisi regresi. Apabila ke – 4 asumsi tersebut terpenuhi maka nilai – nilai penduga yaitu a dan b akan mempunyai sifat – sifat sebagai berikut :
Tidak bias
Memiliki varians yang minimum sehingga penduga merupakan penduga yang efisien yaitu tidak bias dan memiliki varians minimum.
Konsisten yaitu apabila ukuran sampel diperbesar tanpa batas maka nilai dugaan akan mendekati nila parameter populasi yang sebenarnya.
Intersep yaitu a memiliki distribusi normal dengan nilai rata – rata harapan E(a) = A dan varians (a) = 0, dimana nilai dugaan sample dan A adalah nilai populasi yang sebenarnya.
Slope atau kemiringan kurva yaitu b memiliki normal dengan nilai rata – rata harapan E(b) = B dan varians (b) = 0, dimana b adalah nilai dugaan sample dan b adalah nilai populasi yang sebenarnya.

15.6.1 Perkiraan Interval dan Pengujian Hipotesa
Bagian terpenting dari ilmu statistika adalah statistic induktif yaitu menarik kesimpulan tentang populasi dengan menggunakan sampel dan pengujian hipotesa. Apabila nilai dugaan semakin mendekati nilai sesungguhnya pada populasi, maka dugaan tersebut semakin baik. Hal yang perlu diketahui apakah nilai koefisien dari sampel mendekati nilai parameter populasinya , dan untuk itu diperlukan pengujian hipotesa.Beberapa asumsi penting metode kuadrat terkecil.

Nilai rata – rata dari error term atau expected value untuk setiap nilai x sama dengan nol.
Nilai error dari Ei dan Ej atau biasa disebut dengan kovarian saling tidak berhubungan atau berkorelasi.

Varian dari error bersifat konstan
Variabel bebas X tidak berkorelasi dengan error term E.

15.6.1 Perkiraan atau pendugaan interval
Pada teori pendugaan (estimation theory) terdapat dua hal yang penting yaitu pendugaan interval (confidence interval, atau interval estimation) dan pendugaan tunggal (prediction interval atau point estimation). Pendugaan interval dimaksudkan untuk menggambarkan nilai tengah untuk setiap nilai X tertentu, sedang pendugaan tunggal untuk menggambarkan kisaran nilaiuntuk setiap nilai X tertentu .

1. Pendugaan interval nilai tengah Y
Pendugaan interval nilai tengah Y dimaksudkan untuk mengetahui nilai dugaan bagi Y untuk seluruh nilai X yang diketahjuui. Rumus interval unutk nilai tengah Y adalah :
Y ^± t(Syx) √ 1/n + (X – X)2 / ∑ X2 – (∑X)2 / n

Dimana : Y^ = Nilai dugaan dari Y untukm nilai X tertentu
t = Nilai t table untuk taraf nyata tertentu
Sy.x = Standard error variabel Y berdasarkan variabel X yang diketahui
X = Nilai data pengamatan variabel bebas
X = Nilai rata – rata data pengamatan variabel bebas
n = Jumlah sampel
Contoh :
Htunglah nilai interval dugaan Y untuk nilai harga saham sebesar Rp. 505/ lembar sahamnya dengan menggunakan taraf nyata 5% . Gunakan data pada contoh 15 -5
Jawab :
Untuk membuat interval nilai tengah Y diperlukan pengetahuan tentang besranya Y^, Sy.x, n, (X-X)2, ∑X2 dan ∑X. Hal yang dapat diketahui dari niali itu :
Persamaan regresi yaitu Y^ = 2,8631 + 0,0086X, sehingga untuk X = 505, nilai Y^ = 2,8631 + 0,0086 505 = 7,21
Nilai standar error Sy.x – 0,818. Apabila belum diketahui maka harus dicari dahulu sesuai dengan rumus standar error Sy.x
Jumlah n = 11, sehingga derajat bebas df = n – 2 = 11 – 2 = 9 dengan taraf nyata 5%, maka nilai t –tabel adalah 2,262
Nilai ∑X2 = 1955125 dan ∑X = 4455. Sehingga nilai X rata – rata = 4455/11 = 405
Setelah mendapat seluruh komponen nilai, maka dapat dimasukkan dalam rumus sebagai berikut :
Y ^± t(Syx) √ 1/n + (X – X)2 / ∑ X2 – (∑X)2 / n
= 7,21 ± 2,262(0,818) √ 1/11 + (505- 405)2/ 1955125 – (4455)2 / 11
= 7,21 ± 0,734
Jadi pendugaan interval nilai Y^ untuk nilai X505 adalah 7,21 ± 0,734 atau antara 6,48 sampai 7,94. Ini dapat disimpulkan bahwa pada tingkat keyakinan 95% nilai dugaan produksi kelapa sawit dengan harga minyak sawit sebesar 505 U$/ton berkisar antara 6,48 juta ton sampai 7,94 juta ton.
2. Pendugaan Interval nilai koefisien regresi a dan b
Koefisien regresi a dan b yang dihasilkan dari analisis regresi merupakan nilai dugaan tunggal. Dengan menggunakan asumsi bahwa nilai Ei bersifat normal.Interval untuk koefisien regresi a dan b adalah :
Sehingga interval B adalah : (b - tα/2 . Sb≤B≤a + tα/2 . Sb)
Sedangkan interval A adalah : (a - tα/2 . Sa≤B≤a + tα/2 . Sa)

Dimana Sa dan Sb adalah sebagai berikut :
Sb = Sx.y /[√∑X2 – (∑X)2 /n] Sa = √∑X2 . Sx.y)/n∑X2 - ∑X)2
Contoh :
Diketahui : a. Nilai a = 2,8631 dan b = 0,0086
b. standard error a(Sa) = 0,98 dan standard error b (Sb) = 0,0021
c. Nilai t untuk uji dua arah dengan taraf nyata 5%, df = n – k = 11 – 2 = 9 adalah 2,262
sehingga interval koefisien B adalah :
= (b - tα/2 . Sb≤B≤a + tα/2 . Sb)
= (0,0086 – 2,262 . 0,0021 ≤ B ≤ 0,0086 + 2,262 . 0,0021 )
= (0,0086 – 0,00475 ≤ B ≤ 0,0086 + 0,00475 )
= 0,00385 ≤ B ≤ 0,01335
Jadi interval koefisien B adalah terletak antara 0,00385 ≤ B ≤ 0,01335.
Selang interval koefisien A adalah :
= (a - tα/2 . Sa≤B≤a + tα/2 . Sa)
= (2,8631 – 2,262 . 0,98 ≤B≤2,8631 + 2,262 . 0,98 )
= (2,8631 – 2,26168 ≤A≤ 2,8631 + 2,2168
= 0,6463 ≤A≤ 5,0799
Jadi interval koefisien A terletak antara 0,6463 ≤A≤ 5,0799

15.6.2 Pengujian hipotesa
1.Pengujian hipotesa dengan pendekatan interval
Pengujian hipotesa dengan pendekatan interval dimaksudkan bahwa dalam jangka panjang interval keyakinan tersebut akan memuat nilai parameter populasi A atau B yang sebenarnya dengan taraf nyata α %. Interval keyakinan merupakan suatu himpunan dari hipotesa nol yang dapat diterima , apabila interval keyakinan di dalamnya termasuk niali hipotesa nol, maka hipotesa nol tersebut dapat diputuskan untuk diterima, sebaliknya apabila dalam interval keyakinan tidak termasuk nilai hipotesa nol, maka hipotesa nol nya ditolak. Tahapan pengujiannya yaitu :
Merumuskan hipotesa
Menentukan taraf nyata
Menyusun interval keyakinan
Melakukan pengujian atau pengecekan populasi a atau B
Memutuskan untuk menerima atau menolak hipotesa
Atau bisa menggunakan panduan bagan sperti berikut ini :
Stop
Rumuskan H0 dan Ha
Tentukan taraf nyata (α)
Start
Tentukan frekuensi yang diobservasi dari sampel
Hitung frekuensi yang diarapkan
Hitung nilai x2
Tentukan nilai kritis X2
Bandingkan hasil perhitungannya

Contoh :
Didapatkan persamaan regresi Y = 2,8631 + 0,0086 X, ujilah koefesien regresi apakah pengaruhnya sama dengan nol pada taraf nyata 5%. ?
Jawab :
Pengujian untuk koefisien A
a. Perumusan hipotesa
H0 : A = 0
H1 : A ≠ 0
b. Menentukan taraf nyata yaitu 5% untuk uji dua arah (ingat pada H1, bertanda ≠ tidak menunjukan arah daerah penolakan H0). Pada soal no. 5 jumlah N = 11, sehingga derajat bebasnya , df = n – k = 11 – 2 = 9. Nilai t-tabel untuk t0,05/2,9 = 2,262.

c. Menentukan interval
Rumus interval keyakinan untuk koefisien A adalah :
(a - tα/2 . Sa ≤ A ≤ a + tα/2 . Sa) dan nilai Sa adalah :
Sa = √ (∑X2. SY.X)/(n∑X2 – (∑X))
Pada langkah nyata maka niali Sa dan Sy.x harus di ketahui lebih dahulu, sehingga nilai Intervalnya dapat di hitung. Berdasarkan pada contoh soal 15-9 diketahui interval untuk A adalah :
= (a - tα/2 . Sa ≤ A ≤ a + tα/2
= (2,8631 – 2,262.0,98 ≤ B ≤ 2,8631 + 2,262 . 0,98)
= (2,8631 – 2,2168 ≤ A ≤ 2,8631 + 2,2168)
= 0,6463 ≤ A ≤ 5,0799.
Jadi interval koefisien A terletak antara 0,6463 ≤ A ≤ 5,0799
c. Mengecek apakah nilai H0 terletak pada interval. Nilai H0 adalah = 0 dan interval A adalah 0,6463 ≤ A ≤ 5,0799, jadi H0 tidak termasuk dalam interval untuk menerima H0. Sehingga dapat disimpulkan bahwa H0 ditolak dan H1 diterima. Ini menunjukan bahwa nilai intersep yaitu 2,8631 tidaklah sama dengan nol.
Pengujian untuk koefisien B
Perumusan hipotesa
H0 : B = 0
H1 : B ≠ 0
Menentukan taraf nyata yaitu 5% utnuk uji dua arah, jumlah n = 11, sehingga derajat bebasnya, df = n – k = 11 – 2 = 9. Niali t-tabel untuk t0,05/2,9 = 2,6
Mementukan interval
Rumus interval keyakinan untuk koefisien B adalah :
(b – tα/2 . Sb ≤ B ≤ b + tα/2 . Sb), dan nilai Sb adalah :
Sb = Sy.x / [√∑X2 – (∑X)2 /n]
Berdasarkan pada soal 15-9 diketahui interval untuk B adalah :
= (b - tα/2 . ≤ B ≤ b + tα/2 . Sb)
= (0,0086 – 2,262.0,0021 ≤ B ≤ 0,0086 + 2,262 . 0,0021)
= (0,0086 – 0,00475 ≤ B ≤ 0,0086 + 0,00475)
= 0,00385 ≤ B ≤ 0,01335
Jadi, interval koefisien B terletak antara 0,00385 ≤ B ≤ 0,01335
Mengecek apakah nilai H0 terletak pada interval. Niali H0 adalah = 0 dan interval B adalah 0,00385 ≤ B ≤ 0,01335 jadi H0 tidak termasuk dalam interval untuk menerima H0. Sehingga dapat disimpulkan bahwa H0 ditolak dan H1 diterima. Ini menunjukan bahwa nilai koefisien regresi B yaitu 0,0086 yaitu 0,0086 tidaklah sama dengan nol.

Contoh 15 – 11
Pemerintah daerah Tingkat II Jember, Jawa Timur meyakini bahwa dengan otonomi maka kesejahteraan rakyatnyamakin makmur, dan Pemda menargetkan 50% dari pendapatan untuk tabungan dan 50% untuk konsumsi atau dengan istilah lain MPC (marginal propensity to consume) = 0,5. Ujilah apakah target Pemda tersebut benar dengan taraf nyata 10%, apabila data terakhir dari beberapa sample adalah sebagai berikut :

Jawab :
Persamaan konsumsi adalah Y = a + bX, MPC adalah koefisien b. Oleh sebab itu , untuk menguji B, maka nilai b dan Sb harus diketahui lebih dahulu. Untuk keperluan tersebut diperlukan table sebagi berikut :

Rumus untuk b adalah :
b = n(∑XY) - (∑X) (∑Y) / n(∑X)2 - (∑X)2
= 6(74725) – (745)(545) / 6(102625)-(745)2
= 0,6970
a = (∑XY)/n - b(∑X)/n
= 545/6 – 0,6970(745) / 6
= 4,2898
Standar error Y dengan x =
Sx.y = √∑Y2 - a∑Y2 - b∑XY / n – 2
= √ 54625 – 4,2898 . 45 – 0,6970 . 74725 / 6 – 2
= 7,1435
Standar error untuk b adalah :
Sb = Sxy /[√∑X2 – (/[∑X)2/n]
= 7,1435/[√102625 – (745)2 / 6]
= 0,071

Langkah – langkah pengujian hipotesa :
1. Perumusan hipotesa
H0 : B = 0,5
H1 : B ≠ 0,5
2. Menunjukan taraf nyata yaitu 10% untuk uji du arah, jumlah n = 6, sehingga derajat
Bebasnya, df = n – k = 6 – 2 = 4. Nilai ttabel untuk t0,1/2,4 = 2,132.
3. Menentukan interval :
Rumus interval keyakian untuk koefisien B adalah :
(b – tα/2 . Sb ≤ B ≤ b + tα/2 . Sb),
= (0,6970 – 2,132 . 0,071 ≤ B ≤ 0,6970 + 2,132 . 0,071)
= (0,6970 – 0,1514 ≤ B ≤ 0,6970 + 0,1514)
= 0,5456≤ B ≤ 0,8484
4. Mengecek apakah nilai H0 terletak pada interval. Niali H0 adalah = 0,5 dan interval B adalah 0,5456≤ B ≤0,8484, jadi H0 tidak termasuk dalam interval untuk menerima H0. Sehingga dapat disimpulkan bahwa H0 ditolak dan H1 diterima. Ini menunjukan bahwa nilai MPC tidak sama dengan 0,5. MPC kabupaten Jember berkisar 0,5456 berkisar sampai 0,8484. Oleh sebab itu, target Pemda Jember belum tercapai pada taraf nyata 10%.
2. Pengujian hipotesa dengan pendekatan uji Signifikan (Nyata)
Uji signifikan adalah suatu prosedur untuk memeriksa apakah koefisien (a dan b)yang dihasilkan dari sample sesuai atau tidak denagn nilai parameter populasi sebenarnya (A dan B) atau yang dihipotesakan, ayitu dengan menguji nilai t dimana nilai t adalah : t = (b – B) / Sb dan probabilitas interval keyakinanya adalah :
P(-tα/2 - ≤ (b – B)/Sb≤) tα/2 = 1 – α atau dapat dinyatakan dengan :
P(b-tα/2. Sb) ≤ B ≤(b+tα/2.Sb) = 1 – α
Pada prakteknya untuk uji signifikan kita tidak perlu menghitung interval keyakinan, tetapi kita harus menghitungnilai t yaitu t = (b-B)/Sb. Kemudian terlihat apakah nilai t-hitung terletak dalam interval antara -tα/2 dan tα/2, jika ya maka H0 diterima dan kalau tidak H0 ditolak dan hipotesa alternative dierima. Dalam bentuk daerah keputusan dapat digambarkan sebagai berikut :

Pada gambar diatas apabila nilai t-hitung terletak pada -tα/2 dan tα/2, maka H0 diterima dan ditolak. Dalam bahasa statistik, nilai parameter dugaan (a dan b) dikatakan signifikan secara statistik (statistically significant) apabila berada di daerah kritis yaitu t-hitung lebih kecil dari tα/2 dan atau t-hitung lebih besar dari tα/2.
Contoh 15-12
Pada contoh 15-5 kita mendapatkan persamaan regresi Y^ = 2,8631 + 0,0086X. Ujilah apakah koefisien regresi tersebut pengaruhnya nyata pada taraf uji 5% ?
Jawab :
Dari contoh 15-5 didapatkan persamaan Y6 = 2,8631 + 0,0086X dan ari contoh 15-7 didapatkan niali Sb = 0,0021 dan Sa = 0,98
Pengujian hipotesa a :
Perumusan hipotesa
H0 : A = 0
H1 : A ≠ 0
Niali kritis t dengan taraf nyata 5% , uji dua arah dan derajat bebas,
df = n – k = 11 – 2 = 9, 0,05/2,9 = 2,262
Nilai t-hitung
t = (a-A)/Sa = (2,8631 – 0) /0,98 = 2,92
karena nilai t-hitung (2,92) leebih besar dari t-tabel 2,262, maka niali t-hitung tersebut terletak pada daerah kritis yaitu daerah penolakan H0 dan penerimaan H1. Oleh sebab itu, dapat disimpulkan bahwa koefisien a tidak sama dengan nol,, serta pengaruhnya nyata secara statistik.

2 Pengujian hipotesa B :
Perumusan hipotesa
H0 : B = 0
H1 : B ≠ 0
Nilai kritis t dengan taraf nyata 5%, uji dua arah dan derajat bebas,
df = n – k = 11 – 2 = 9, 0,05/2,9 = 2,262
nilai t-hitung
t = (a-B)/Sa = (0,0086 – 0) /0,0021 = 4,095
Nilai t-hitung (4,095) lebih besar dari t-tabel 2,262 nilai –hitung tersebut terletak pada daerah kritis yaitu daerah penolakan H0 dan penerimaan H1. Oleh sebab itu, dapat disimpulkan bahwa koefisien B tidak sama dengan nol, serta pengaruhnya nyata secara statistik.

15.7 Hubungan antara koefisien korelasi, koefisien determinasi dan kesalahan baku pendugaan.
Antara koefisien korelasi (r), koefisien determinasi (r2) dan kesalahan baku pendugaan (Sy.x) sebenarnya mempunyai hubungan. Koefisien korelasi (r) menunjukan keeratan hubungan antara dua atau lebih variable. Apabila nilai yang sesungguhnya yaitu Y mendekati garis regresi Y, maka koefisien korelasinya juga besar dan kesalahan pendugaannya akan kecil. Koefisien determinasi menunjukan seberapa besar persentase keragaman Y yang dapat dijelaskan oleh keragaman X, atau bahasa sederhananya seberapa besar kemampuan X dalam menjelaskan Y. Kesalahan baku pendugaan merupakan suatu ukuran yang menyatakan kedekatan suatu niali yang sesungguhnya terhadap garis regresi. Jadi, antara koefisien korelasi dan kesalahan baku pendugaan mempunyai kesamaan dalam fungsinya yaitu mengukur kedekatan niali sesungguhnya atau nilai pengamatan terhadap nilai dugaan atau garis regresinya. Semakin besar koefisien korelasi dan semakin kecil kesalahan baku pendugaan maka hasil dugaannya akan semakin baik. Untuk mengukur kesalahan baku kita mnghitung error yaitu selisih Y dengan Y^ atau dapat dinyatakan dalam bentuk persamaan. :
E = Y – Y^ atau Y = Y^ + e

Berikut adalah contoh table ANOVA :

Sumber keragaman (source)
Derajat bebas (df)
Sum square (SS)
Mean square (MS)
Regresi (regression)
1 (jml var bebas, X)
SSR = ∑(Y - Y)2
MSR = SSR/1
Kesalahan (error)
N – 2
SSE = ∑(Y - Y)2
MSE = SSE/(n-2)
Total
N - 1
SST = ∑(Y - Y)2

Dengan menggunakan tabel anova tersebut dapat dicari koefisien determinasi, kesalahan baku pendugaan dan pengujian hipotesa bagi koefisien regresi b terhadap populasinya B.
Koefisien determinasi merupakan kemampuan variable X dalam menjelaskan Y, kemampuan X tersebut etrcermin dari analisis regresi berupa niali Y^. Oleh sebab itu, koefisien determinasi dapat dirumuskan sebagai berikut :
r2 = keragaman regresi (SSR) / keragaman total (SST) = 1 – SSE/SST
SST = SSR + SSE
Kesalahan baku pendugaan mengukur seberapa tidak akurat nilai Y menyebar terhadap nilai dugannya Y^ . JAdi kesalahan baku pendugaan mengukur seberapa error yang terjadi rumus kesalahan baku pendugaan dapat dinyatakan sebagai berikut :

Sy.x = SSE/(n-2)
Sementara nili F dinyatakan dengan :
F = (SSR/1)/(SSE/(n-2) = MSR /MSE
Contoh 15-13
Pada contoh 15-11dari data yang ada di Pemda Jember Jawa Timur dapat di analisis persamaan regresi fungsi konsumsi terhadap pendapatan. Hasil regresinya adalah + Y^ = 4,2898 + 0,6970X.Tabel anova yang yang dihitung dengan computer disajikansebagai berikut :

Sumber keragaman (source)
Derajat bebas (df)
Sum square (SS)
Mean square (MS)
Regresi (regression)
1
4916,79
4916,79
Kesalahan (error)
n – 2 = 6 – 2 = 4
204,04
51,01
Total
n – 1 = 6 – 1 = 5
5120,83

Dengan mempergunakan table anova tersebut hitunglah koefisien determinasi dan ujilah koefisien regresinya pada taraf nyata 5% !

Jawab :
Koefisien determinasi
r2 = SSR/SST = 4916,79 / 5120,83 = 0,96
Koefisien determinasi 0,96 menunjukan bahwa variable X mampu menerangkan keragaman Y sebesar 96%, sedang sisanya yaitu 4% oleh variable lain selain variable X.
Pengujian hipotesa untuk koefisien regresi
Nilai F table denagn taraf nyata 5%, derajat bebas pembilang k – 1 = 2 – 1 = 1, dan derajat bebas penyebut n – k = 6 – 2 = 4 adalah 7,71
Nilai F + ( SSR/1) / (SSE/(n-2)) = MSR/MSE = 4916, 79 / 81,01 = 96,39
Niali F (96,39) lebih besar dari f-tabel (7,71) maka nilai f-hitung berada di daerah kritis yaitu penolakan H0 dan menerima H1. Oleh sebab itu, pengaruh variable X terhadap Y berbeda dengan nol dan nyata pada taraf uji 5%.

15.8 Ringkasan
1. Analisis korelasi adalah suatu tehnik statistika yang digunakan untuk mengukur keeratan hubungan atau korelasi antara dua variable.
r = n(∑XY)- (∑X) (∑Y) / √[n(∑X)2 - (∑X)2] [n(∑Y2 - (∑Y2]
t = r√n-2 /√1-r2
2. Rumus untuk koefisien regresi b
b = n∑XY)- (∑X) (∑Y)/ (∑X)2 - (∑X)2
rumus untuk koefisien regresi a
a = (∑Y)/n – b (∑X)/n

3. Rumus kesalahan baku pendugaan adalah :
Sy.x = √(∑Y2 -a∑Y - b∑XY
Rumus kesalahan baku untuk koefisien regresi b
Sb = Sy.x /[√∑X2 – (∑X)2 /n]
Rumus kesalahan baku untuk koefisien regresi a
Sa = √(∑X2 – sY.X)/n√∑X - ∑X2
4. Pendugaan interval niali tengah Y
Y ± t (Sy.x) √ 1/n + (X – X)2/∑X2 – (∑X)2/n
5. Pendugaan interval untuk koefisien regresi A dan B
Interval untuk B adalah :
(b – t Sb≤B + t. Sb)
Interval untuk A adalah :
(a– t Sb≤A≤a + t. Sa

6. Pengujian hipotesa
t = (b-B) /Sb
Nilai t-hitung untuk a adalah :
T = (a – A)/Sa
7. Rumus koefisien determinasi :
R2 = keragaman regresi / keragaman total = SSR/SST = 1- SSE/SST
Rumus kesalahan baku pendugaan
Sy.x = SSE/(n-2)
Rumus untuk uji F F = (SSR/1) / (SSE/(n-2)) = MSR/MSE

15.9 Latihan soal terjawab
PT. Durian Cijeruk adalah perusahan perkebunan durian ayng relative besar di Cijeruk bogor. Perusahaan ini melakukan uji coba pemberian pupuk organik dan diharapkan dapat mempengaruhi produksi durian. Selama uji coba 6 bulan pertama tahun 2003 dapat diperoleh data sebagai berikut :

Jumlah produksi durian (kg)

Dari data tersebut, hitunglah koefisien korelasi dan koefisien regresinya serta jelaskan apa maksud dari hasil tersebut !

Jawab :
Untuk keperluan pencarian koefisien korelasi dan regresi diperlukan data sebagai berikut :
Rumus koefisien korelasi
r = n(∑XY) – (∑X)(∑Y) / √[n(∑X2) - (∑X)2] [n(∑Y2) – (∑Y)2]
= 8(4465) – (26)(1285) / √[8(92) – (26)2] [8(218225) – (1285)2]
= 0,97

b = n(∑XY) – (∑X)(∑Y) / n((∑X2) – (∑X)2
= 8(4465) – (26) (1285) / 8(92) – (26)2
= 38,5
a = n (∑Y) /n - b (∑X)/n
= (1285)/8 – 38,5(26) / 8
= 35,5

Jadi persamaan regresinya adalah = Y = 35,5 + 38,5 X , apabila pupuk ditambahkan 1 kg maka produksi durian akan meningkat sebesar 38,5 kg

Pihak manajemen PT. Durian Cijeruk setelah memperoleh persamaan regresi Y^ = 35,5 + 38,5X ,dan pihak manajemen agak ragu apakah koefisien etrsebut pengaruhnya memang nayat atau karena factor kebetulan. Oleh sebab itu, perusahaan ingin menguji apakah niali koefisien regresi berbeda nyata dengan 0 pada taraf nyata 5%. Apabila pengaruhnya nyata, perusahaan merencanakan untuk memberi pupuk sebesar 8 kg/ perbatang. Buatlah interval untuk produksi durian yang mungkin terjadi, apabila diketahui bahwa kesalahan baku pendugaan (sy.x) = 10,84
Jawab :
Melkauakn pengujian apakah koefisien A dan B sama dengan nol .
Ho : A = 0 ; H1 : A ≠ 0 serta
H0 : B = 0 ; dan H1 : B ≠ 0
Pengujian hipotesa dialkukan dengan pengujian signifikansi.Nilai t-hitung diperoleh dari :
t = (b-B)/Sbdan t = (a-A)/Sa. Niali Sa dan Sb diperoleh dengan rumus sebagai berikut :
Sb = Sy.x /[√∑X2 – (∑X)2 / n ]
= 10,84/[√92 – (26)2/8]
= 3,958
Sa = √(∑X2. Sy.x)/(n∑X – (∑X)2)
= √(92.10,84)/(8.92 – (26)2)
= 3.958
t-hitung b = (b – B)/sb
= (38,5 – 0) / 3.958
= 9,73

t-hitung a = (a-B)/Sa
= (35.5 – 0)/4,077
= 8,71
Interval produksinya adalah :
343.5 ± 2,447 . 10.84 √ (1/8) + [(8 – 3.25)2/(92 – (26)2/8]
343,5 ± 2,447.10,84 . 1,77
343.5 ± 46,96
Jadi interval produksi durian utnuk pupuk 8 kg adalah untuk terendah 296,54 dan tertinggi 390,46

CV. Nani housing prima terletak di kebon jeruk, Jakarta Barat. Pada bulan Agustus 2003 perusahaan ini mampu menjual rumah sebanyak 6 buah. Data harga jual dan ukuran rumah adalah sebagai berikut :
Harga jual (jutaan)
Dari data tersebut, perusahaan ini berkeyakinan bahwa ada hubungan yang positif antara ukuran rumah dengan harga rumah. Ujilah keyakinan perusahaan tersebut denga taraf nyata 5%. Buatlah persamaan regresinya untuk mengetahui berapa pengaruh ukuran rumah terhadap harga jualnya?.

Jawab :
Untuk melakukan uji signifikasi korelasi, maka nilai korelasi, maka nilai korelasinya perlu diketahui. Untuk pendugaan korelasi dan regresinya diperlukan table berikut ini :

Rumus koefisien korelasi adalah :
= 7(70.200) – (620)(650)
√ [6(71.450) – (620)2] [6(71.750) – (650)2]
= 0,97
Perumusan hipotesa :
H0 : p = 0
H1 : p ≠ 0
Taraf nyata 5% untuk uji dua arah (α/2 = 0,05/2 = 0,025) dengan derajat bebas (df) = n – k =
6 – 2 = 4. Nilai taraf nyata α/2 = 0,025 dan df = 4 adalah = 2,667.
Menentukan nilai uji t
t = 0,97√6 – 2
√ 1 – (0,97)2
= 8,08
Untuk analisis regresi dilakukan dengan pendugaan terhadap a dan b dari persamaan Y = a + b X
Dimana Y adalah ahrag rumah dan X adalah ukuran rumah.

B = 6(70.200) – (260)(650)
6(71.450) – (620)2
= (650) /6 – 0,41(620) / 6
= 65,88

Jadi persamaan regresinya menjadi Y = 65,88 + 0,41X, jadi apabila ukuran rumah meningkat 1m2, maka diduga harga rumah akan meningkat 0,41 juta.

BAB 13
PENGUJIAN HIPOTESA SAMPEL BESAR

BAGIAN III STATISTIK INDUKTIF
Metode & distribusi sampling
Pengertian korelasi sederhana dan kegunaannya
Teori pendugaan statistik
Uji signifikansi koefisien korelasi
Analisa regresi : metode kuadrat terkecil
Pegujian hipotesa sample besar
Pengujian hipotesa sample kecil
Kesalahan buku pendugaan
Analisis regresi dan korelasi linear
Perkiraan interval dan pengujian hipotesa
Hubungan koefisien korelasi, koefisien determinasudan kesalahan buku pendugaan
Analisis regresi dan korelasi berganda
Fungsi, variable dan masalah dalam analisis regresi
BAGIAN IV STATISTIKA NON - PARAMETRIK PARAMETIK
Uji Chi - kuadrat
Data berperingkat
Pengendalian mutu statistik

131 Pengantar

Setelah mempelajari bab 13 maka sekarang kita akan belajar mengenai bab 14 yaitu pengujian hipotesa sampel kecil, karena tidak semua dalam kehidupan nyata ini menggunakan sampel besar. Dalam kehidupan nyata tidak seluruhnya dapat diambil sampel besar yaitu jumlah sampel lebih dari 30. Berikut beberapa contoh yang mungkin terjadi :
Indonesia merupakan Negara agraris. Oleh sebab itu, pemerintah mendorong perusahaan berbasis pertanian untuk masuk ke pasar modal dalam rangak memperkuat struktur permodalan, teknologi, dan sumber daya manusia.
Ada pula perusahaan event organizer yang misalkan dalam satu tahun menergetkan 8 konser dengan biaya kurang – lebih perkonser yaitu kira – kira 1,5 miliar dan uang yang kira – kira akan mereka capai adalah 2,5 – 3 miliar setiap satu kali konser.
Harga rata – rata tiket salah satu jasa transportasi, dimana antara jumlah alat angkut yang dimiliki harus disesuaikan dengan harga atau ongkos ke setiap jurusan.

14.2 Sampel kecil dan ciri – ciri distribusi t-student
Dalam kenyataannya sangatsulit mendapatkan data – data seperti umur rata – rata penduduk Indonesia, rata – rata jumlah tabungan seluruh nasabah perbnakan, maupun kenaiak harag pangan di seluruh Indonesia.Untuk sampel berukuran besar , n ≥ 30, maka niali dugaan terbaik dari standar deviasi populasi adalah standar deviasi sampel (s). Apabila nilai standar deviasi merupakan dugaan populasi yang tidak terlalu bervariasi maka niali uji statistiknya yaitu (Z = X - µ/s√n) tidak bersifat normal. Oleh karena itu, untuk sebaran distribusi sampel kecil dikembangkan suatu distribusi khusus yang dikenal sebagai distribusi t atau t-student. Nilai – nialui distribusi dinyatakan sebagai berikut :

t = (X - µ) / s/√n

Dimana :
t : Nilai distribusi t
µ : Nilai rata – rata populasi
X : Nilai rata – rata sampel
S : Standar deviasi sampel
n : Jumlah sampel

Rumus ini merupakan hasil pengembangan dari W.S Gosset pada tahun 1908 (Lind 2003). Hasil penariakn sampel yang dilakuakn Gosset walaupun bukan dari sebaran normal ternyata berbentuk genta seperti halnay kurva normal tetapi dengan distribusi yang lebih besaratau mendatar dan melebar dibandingkan dengan kurva normal. HAsil penelitian itu kemudian dikembangakn dengan nama “student”

132.1 Ciri – cirri distribusi t-student
Berikut adalah ciri – cirinya tapi dengan asumsi bahwa populasi yang diamati mendekati normal :
1. stribusi t-student seperti distribusi Z merupakan sebuah disrtibusi continue, dimana nilainya dapat menempati semua titik pengamatan.
2. Distribusi t-student seperti distribusi Z berebtuk genta atau loncengdan simetris dengan nilai rata – rata sama dengan nol.
3. Distribusi t-student bukan merupakan satu kurva seperti kurva Z, tetapi distribusi t. Setiap distribusi t mempunyai rata – rata hitung sama dengan nol, tetapi dengan standar deviasi yang berbeda - beda, sesuai dengan besarnya sampel (n). Ada distribusi t akan mendekati normal.
4. Distribusi t lebih mendatar dan melebar dibandingkan dengan distribusi Z. Dampak dari distribusi t yang lebih melebar adalah suatu untuk suatu taraf nyata

133 Menguji rata – rata hitung populasi
Dalam menguji rata – rata hitung populasi dalam sample kecil tetap mengikuti proses pengujian hipotesa sebagaimana pengujian hipotesa untuk rata – rata hitung pada sampel besar. Tahapannya yaitu :
1. Merumuskan hipotesa nol & hipotesa alternative (H0 dan H1).
2. Menentukan taraf nyata apakah 1% atau 5% atau pada taraf lainnya serta menetahui
3. Menentukan uji statistic dengan menggunakan rumus uji-t
4. Menentukan daerah keputusan yaitu daerah tidak menolak H0 dan daerah menolak H0, dan]
5. Mengambil keputusan untuk menolak dan menerima dengan membandingkan nilai kritis taraf nyata dengan gen

Contoh 14-1
Selama kurun waktu Aguatus 2003, harga saham peruasahaan berbasis PERTANIAN Rp. 354 per lembarnya. Untuk melihat bagaimana kinerja saham perusahaan berbasis pertanian di pasar modal, maka diambil 4 sampel yang terdiri, 1 perusahaan perkebunan, peternakan, perikanan dan kehutanan.Dari empat perusahaan tersebut dikathui bahwa harga rata – rata sahamnya mencapai Rp. 272 perlembar dengan standar deviasi 260. Pada taraf 1%, apakah harga saham perusahaan berbasis pertanian mengalami penurunan, atau perbedaan selisih yang terjadi karena factor kebetulan saja?

Jawab :

1. Perumusan hipotesa
Hipotesa yang ingin diuji apakh harga saham perusahaan berbasis pertanian mengalami penurunan, yang dimaksud dengan penurunan tentunya dibawah 354. Perumusan hipotesanya adalah :
H0 : µ ≥ 354
H1 µ ≤ 354
Tanda > pada H1 menunjukan uji satu arah dengan daerah penolakan H0 berada di ekor sebelah kiri.
2. Menentukan taraf nyata yaitu 1%. Untuk menentukan titik kritis digunakan table t-student. Pada table t-student perlu diketahui, yaitu :
a. Taraf nyata dan uji searah atau dua arah, dalam hal ini taraf nyata 1% (0,01) dan uji searah,
b. Derajat bebas (v) yang diperoleh dari n – 1. Jumlah n = 4, jadi v = 4 – 1 = 3.
c. Melakukan uji statistic t dengan rumus sebagai berikut :t
t = (X- µ) /(s/√n) = (272 – 354) / (260/√4) = -0.63
d. Menentukan daerah keputusan dengan nilai kritis 4,541, uji stau arah dengan ekor ada di
sebelah kiri.
e. Nilai uji-t terletak di daerah tidak menolak H0 pada taraf nyata 1%, ini menunjukkan bahwa harga rata – rata saham perusahaan berbasis pertanian tidak mengalami penurunan nyata.

Contoh 2 :
Kereta Api untuk jurusan Cirebon, Yogyakarta dan Surabaya sebanyak 24 buah . Harga rata – rata tiket sebesar Rp. 253 ribu rupiah. Akibat dari banyaknya perusahaan penerbangan dan terjadi perang tariff diantara mereka, harga tiket pesawat bersaing ketat dengan harga tiket kereta kelas eksekutif. Agar penumpang KA tidak turun drastic, manajemen KAI memberikan kebijakan untuk memberikan diskon terhadap harga tiket KA eksekutif. Setelah kebijakan tersebut diberlakukan selanjutnya diambil sampel secara acak terhadap 16 jenis tiket ternyata harga rata – rata mencapai Rp. 212 ribu dan standar deviasi Rp. 46 ribu. Apakah penurunan tariff tersebut berbeda nyata denagn tariff sebelumnya pada taraf 5% sehingga cukup berarti bagi konsumen ?

Jawab :
1. Perumusan hipotesa :
Hipotesa yang ingin dijual apakah harga tiket setelah diskon berbeda nyata dengan harga tiket sebelum diskon. Perumusan hipotesanya adalah :
H0 : µ = 253
H1 : µ ≠ 253
Tanda ≠ pada H1 menunjuakn uji dua arah.
2. Menentukan taraf nyata yaitu 5%. Pada tabel t dapat dilihat dengan taraf nyata 5% untuk uji dua
Dua arah dengan derajat bebas V = n – 1 = 16 – 1 = 15
3. Melakukan uji statistic t dengan runus sebagai berikut :
(212 – 253) / (46/√16) = -3.57
4. Menentukan daerah kritis dengan nilai nilai kritis 2,131 uji dua arah.
5. Nilai uji-t terletak di aderah menolak Ho pada taraf nyata 5%, ini menunjukkan bahwa terdapat
Cukup bukti harga rata – rata tiket kereta api sesudah diskon berbeda nyata dengan harga sebelum diskon pada taraf nyata 5%. Perbedaan yang nyata – nyata berbeda ini diharapkan dapat menraik konsumen kembali untuk menggunakan jasa kereta api.

134 Menguji selisih rata – rata hitung populasi
Maksud dari pengujian selisih rata – rata hitung populasi adalah untuk membandingkan niali rata – rata dua populasi apakah sama atau berbeda.Untuk maksud membedakan sesuatu dengan sesuatu tersebut harus diketahui apakah sampel – sampel diambil dari populasi yang normal dengan rata – rata yang sama. Ada tiga asumsi yang diperluakn dalam menguji selisih rata – rata sampel kecil yaitu :
a. Populasi harus terdistribusi secara normal
b. Populasi bersifat independent
c. Varians populasi harus sama

Dalam uji-t kadang – kadang pula diperlukan penggabungan dua varians dengan alas an :
a. Kedua populasi memiliki varians yang sama, sehingga penggabungan semu ainformasi akan menghasilkan penduga yang terbaik.
b. Kedua varians akan menghasilkan varians tertimbang yang memperhatikan karakteristik kedua populasi.
Jumlah sampel dan varians sangat menentukan nilai dari penduga tunggal.. Rumus varians gabungan yaitu :
S2p = (n1 – 1)(S21) + (n2 – 1)(S22) / (n1 + n2) – 2
Dan uji t menjadi :
t = X1 – X2 / √ S2p[1/n1 + 1/n2]

Dimana :
t = Nilai distribusi t
X1 = Nilai rata – rata sampel pertama
X2 = Nilai rata – rata sampel kedua
S2p = Penduga varians gabungan populasi
N1 = Jumlah sampel populasi pertama
N2 = Jumlah sampel populasi kedua
S12 = Varians sampel pertama
S22 = Varians sampel kedua.

Contoh :
Masalah bias gender pria dan wanita mengemuka pada saat wacana tentang peningkatan peran wanita terus berkembang. Apakh bias gender ini juga melanda dunia hiburan Indonesia? Majalah Propsektif V(25) membahas dunia hiburan dan pendapata para artis. Haisl wawancara terhadap 16 artis pria menunjukkan rata – rata penghasilan setiap pentas adalah Rp. 35 juta dengan stanadr deviasi 20 juta . Terhadap 10 artis wanita mempunyai penghasilan rata – rata 53 juta dengan standar deviasi 32 juta. Dengan taraf nyata 5%, uji apakah tidak terjadi bias gender dalam pemdapatan antara artis pria dan wanita?

Jawab :
1. Perumusan hipotesa
H0 : µ1 = µ2 atau µ1 - µ2 = 0
H1 : µ1 ≠ µ2 atau µ1 - µ2 ≠0
2. Menentukan taraf nyata yaitu 5%. Nilai t-student dengan taraf nyata 5% (0,05) uji dua arah dan
df = (n1 + n2) – 2 = (16+10) – 2 = 24 adalah 1.316
3. Melakukan uji statistic t :
= 35 – 53/√634 [1/16 + 1/10]
= -1.77
4. Menentukan daerah keputusan dengan nilai kritis 1,316
5. Nilai uji-t terletak di daerah menolak H0 pada taraf nyata 5%, ini menunjukkan bahwa terdapat cukup bukti bahwa penghasilan artis pria dan wanita tidak sama. Karena tingkat penghasilan tidak sama, maka dapat disimpulkan terjadinya bias gender dengan keberpihakkan pada artis wanita.

135 Menguji hipotesa pengamatan berpasangan
Data berpasangan yaitu data yang satu berpasangan dengan data yang lain secara khusus. Data yang sudah berpasangan tidak dapat dipisahkan untuk membentuk pasangan yang lainnya. Data berpasangan dikenal dengan data tidak bebas atau non-independent.
Uji statistic untuk pengujian hipotesa data berpasangan dinyatakan :
t = d/sd√n

dan standar deviasi (sd) dirumuskan :
sd = √∑d2 – (∑d2) /n / n – 1
t : Nilai distribusi t
d : Nilai rata – rata perbedaan antara pengamatan berpasangan
sd : Standar deviasi dari perbedaan antara pengamatan berpasangan
n : Jumlah pengamatan berpasangan
d : Perbedaan antara data berpasangan

Contoh :
PT. PSK Jaya merupakan perusahaan konveksi yang berada di jl. Legok Tangerang. Untuk meningkatkan keterampilan tenaga kerja sesuai denag undang – undang Nomor. 13 thaun 2003, maka perusahaan melakukan pelatihan tenaga kerja dengan maksud untuk mengurangi kerusakan terhadap produk pakaian yang akan dikirim ke Eropa. Catatan terhadap 10 orang bagian pemotong yang mengikuti pelatiha n adalah sebagai berikut :

Dengan taraf nyata 5% apakah harapan mnajer bahwa pelatihan meningkatkan keterampilan sehingga kerusakan semakin kecil dapat terwujud ?

Jawab :
1. Perumusan hipotesa
Hipotesa yang ingin diuji apakah pelatihan dapat menurunkan kerusakan pakaian. Hal ini berarti bahwa selisih (µd) antara sesudah dan sebelum lebih kecil dari nol. Perumusan hipotesanya adalah
H0 : µd ≥ 0
H1 : µd < 0
2. Menentukan taraf nyata yaitu 5%. Niali t-student dengan taraf nyata 5% (0,05) uji satu arah dengan derajat bebas (df) = n – 1 = 10 – 1 = 9 adalah 2,262

3. Melakkan uji statistik t :

Sd = √48- [(-18)2/10] / 10 – 1 = 1,32
t = -18/1.32/√10 = 0,432
4. Menentukan daerah keputusan dengan niali kritis -2.262
5. Mengambil keputusan, nilai uji-t berada di daerah tidak menolak H0. Ini menunjukan tidak terdapat cukup bukti utuk menolak H0, sehingga tidak terdapat perbedaan kerusakan antar sesudah dan sebelum pelatihan. Ini menunjukkan bahwa pelatihan yang bertujuan untuk menurunkan angka kerusakan menjadi lebih kecil belum berhasil.

Linkbar

Mira Mind's

Labels

About Me

Kamis, 13 Agustus 2009

ANALISIS REGRESI & KORELASI LINEAR

0 komentar:

BEACH

Blog Archive

Wisdom