Analisis Data Mining Mahasiswa Universitas Buana Perjuangan
Karawang
Data mining adalah teknik analisis data yang dapat membantu
kita menemukan pola dan wawasan yang berguna dari kumpulan data besar. Dalam
artikel ini, kita akan membahas hasil analisis data mining yang dilakukan pada
data transkrip nilai dan data lulusan mahasiswa Universitas Buana Perjuangan
Karawang.
Tujuan Analisis
Tujuan dari analisis ini adalah untuk memahami performa
akademik mahasiswa, faktor-faktor yang mempengaruhi kelulusan, dan potensi
korelasi antara nilai mata kuliah dan predikat kelulusan. Dengan menggali data
ini, kita dapat mengidentifikasi tren yang menarik dan memberikan saran untuk
meningkatkan kualitas pendidikan di universitas.
Sumber Data
Analisis ini
menggunakan data kelulusan mahasiswa yang berjumlah 4542, disimpan dalam
variabel df_mslulusan
, dan data transkrip nilai mahasiswa
yang berjumlah 256299, disimpan dalam variabel df_trankip
. Data transkrip nilai berisi detail
nilai yang diperoleh mahasiswa untuk setiap mata kuliah yang diambil. Sedangkan
data kelulusan memberikan informasi demografis dan akademik mahasiswa, termasuk
tanggal masuk dan lulus, serta predikat kelulusan.
Tahap Integrasi dan Pembersihan Data
Menghitung Nilai IPS
Menghitung
nilai ips tiap mata kuliah yang berasal dari df_transkip (nilai_grade dan
sks_mk) dengan menjumlahkannya, lalu membaginya dengan jumlah total sks_mk. Dan
Kemudian dihitung rata rata tiap nim, sehingga jumlah data menjadi 4526 Baris
serta dibuatkan menjadi pivot
Gambar : Nilai IPS
Menggabungkan IPS
menggabungkan colum ips ke dalam dataset df_mslulusan
Gambar : Menggabungkan IPS dan Dataset Ms_lulusan
Durasi Studi
Menambahkan Kolom Durasi Studi. Kolom ini akan berisi data
berupa jumlah hari studi yang dihitung dengan mengurangkan tanggal lulus dengan
tanggal masuk mahasiswa. Durasi studi akan menunjukkan jumlah hari yang
dihabiskan mahasiswa selama periode studi.
Gambar : Menambahkan Durasi Studi ke Dataset
Pembersihan Data
Pada pengecekan data miss ditemukan beberapa data yang miss
yaitu Nan, Sehingga data Nan diubah menjadi 0
Gambar : Cek data null
Pada pembersihan data juga dilakukan penghapusan row pada
kolom predikat yang berisi predikat
Gambar : Kolom Predikat
Standarisasi
Mengubah jenis kelamin yang awalnya 0 dan 1 menjadi Laki laki dan Perempuan
Gambar : Standarisasi Jenis Kelamin
Tahap Analisis
Analisis Hubungan antara Nilai Rata-rata Mata Kuliah (IPS)
dan Lulusan Tepat Waktu
Gambar : Grafik HeatMap Hubungan Rata-rata IPS dalam Lulusan
Tepat Waktu dan Tidak
Korelasi antara rata-rata Indeks Prestasi Semester (IPS) dan kelulusan tepat waktu sebesar 0,15 menunjukkan bahwa ada hubungan yang sangat lemah antara kedua variabel tersebut.
Korelasi adalah ukuran statistik yang menunjukkan seberapa
kuat hubungan antara dua variabel. Nilai korelasi berkisar antara -1 hingga 1.
Nilai 0 berarti tidak ada hubungan sama sekali, sementara nilai mendekati 1
atau -1 menunjukkan hubungan yang kuat.
- Korelasi positif: Jika korelasi positif, nilai rata-rata IPS yang lebih tinggi sedikit berkaitan dengan kemungkinan kelulusan tepat waktu yang lebih tinggi. Namun, dengan korelasi sebesar 0,15, hubungan ini sangat lemah.
- Kekuatan hubungan: Korelasi sebesar 0,15 berarti hubungan antara rata-rata IPS dan kelulusan tepat waktu sangat lemah. Artinya, perubahan pada rata-rata IPS tidak memiliki banyak pengaruh terhadap kelulusan tepat waktu, atau sebaliknya.
- Kemungkinan faktor lain: Ada kemungkinan faktor lain yang lebih signifikan mempengaruhi kelulusan tepat waktu daripada rata-rata IPS.
Secara keseluruhan, korelasi sebesar 0,15 menunjukkan bahwa
rata-rata IPS bukanlah indikator yang kuat untuk memprediksi kelulusan tepat
waktu. Namun, hubungan yang lemah ini dapat memberikan informasi tambahan dalam
analisis yang lebih besar tentang faktor-faktor yang mempengaruhi kelulusan
tepat waktu.
Analisis hubungan antara predikat kelulusan 'Pujian' dengan
lulusan tepat waktu
Gambar : Grafik HeatMap Hubungan antara Predikat Kelulusan dan Lulus Tepat Waktu
Korelasi point biserial: Nilai korelasi point biserial antara predikat Pujian dan lulus tepat waktu adalah 0.35. Nilai ini menunjukkan tingkat hubungan antara dua variabel biner (predikat Pujian dan lulus tepat waktu).
Interpretasi nilai korelasi: Nilai korelasi berkisar antara -1 dan 1. Nilai 0.35 menunjukkan korelasi positif sedang antara predikat Pujian dan lulus tepat waktu. Artinya, ada hubungan positif yang moderat antara predikat Pujian dan lulus tepat waktu. Semakin tinggi nilai korelasi, semakin kuat hubungan tersebut.
Nilai p: Nilai p yang dihasilkan adalah 0.0000, yang
menunjukkan bahwa korelasi ini signifikan secara statistik pada tingkat
signifikansi 0.05 (atau 5%).
Interpretasi nilai p: Nilai p menunjukkan tingkat signifikansi korelasi. Nilai p sebesar 0.0000 berarti bahwa korelasi yang ditemukan sangat signifikan, karena peluang untuk mendapatkan hasil korelasi ini jika tidak ada hubungan (nol) antara variabel sangat rendah.
Secara keseluruhan, hasil analisis menunjukkan bahwa
predikat Pujian memiliki hubungan positif yang signifikan dengan lulus tepat
waktu. Ini berarti bahwa mahasiswa yang mendapatkan predikat Pujian cenderung
lebih mungkin lulus tepat waktu daripada yang tidak mendapatkan predikat
Pujian.
Analisis hubungan antara durasi studi dengan predikat
kelulusan
Gambar : HeatMap Hubungan antara Kategori Durasi Studi dan Predikat Kelulusan
Nilai Chi-Square: Nilai Chi-Square yang tinggi, seperti 542.6754157475119, menunjukkan bahwa terdapat perbedaan signifikan antara kategori durasi studi (kategori_durasi) dan predikat kelulusan (predikat). Nilai ini dihitung berdasarkan seberapa banyak frekuensi yang diamati (observed frequencies) berbeda dari frekuensi yang diharapkan (expected frequencies) dalam tabel kontingensi.
P-value: P-value yang sangat rendah (1.443878794385324e-118) menunjukkan bahwa perbedaan yang diamati antara kategori durasi studi dan predikat kelulusan sangat kecil kemungkinannya disebabkan oleh kebetulan. P-value yang rendah (biasanya kurang dari 0,05) menunjukkan bahwa perbedaan antara variabel sangat signifikan secara statistik.
Kesimpulan: Karena p-value yang sangat rendah, Dapat disimpulkan
bahwa ada hubungan yang signifikan antara kategori durasi studi dan predikat
kelulusan. Dengan kata lain, kategori durasi studi (pendek atau panjang)
memiliki pengaruh terhadap predikat kelulusan mahasiswa.
Hasil ini menunjukkan bahwa durasi studi dapat berhubungan
dengan jenis predikat kelulusan yang diperoleh oleh mahasiswa.
Perbandingan Nilai Total antara Jenis Kelamin
Gambar : Grafik Boxplot Distribusi Nilai Total berdasarkan Jenis Kelamin
Hasil uji t dua sample independent yang di peroleh menunjukkan bahwa ada perbedaan signifikan antara rata-rata nilai total kelompok laki-laki dan perempuan.
- T-statistic: Nilai t-statistic yang di peroleh adalah -13.7622. Nilai ini menunjukkan seberapa besar perbedaan rata-rata antara kelompok laki-laki dan perempuan dalam satuan standar deviasi. Nilai negatif menunjukkan bahwa rata-rata nilai total kelompok laki-laki lebih rendah daripada rata-rata nilai total kelompok perempuan.
- P-value: P-value yang di peroleh adalah 0.0000. P-value adalah probabilitas mendapatkan hasil seperti itu atau lebih ekstrem jika hipotesis nol (tidak ada perbedaan rata-rata) benar. Dalam praktiknya, p-value sangat kecil, menunjukkan bahwa perbedaan rata-rata antara kelompok laki-laki dan perempuan sangat signifikan secara statistik.
Interpretasi: Karena p-value (0.0000) jauh lebih kecil daripada tingkat signifikansi standar 0.05, dapat disimpulkan bahwa ada perbedaan yang signifikan dalam rata-rata nilai total antara kelompok laki-laki dan perempuan. Ini menunjukkan bahwa rata-rata nilai total kedua kelompok benar-benar berbeda, dan perbedaan ini bukan hanya kebetulan.
Kesimpulannya, hasil uji t menunjukkan bahwa rata-rata nilai
total kelompok laki-laki lebih rendah secara signifikan dibandingkan dengan
kelompok perempuan, dan perbedaan ini sangat mungkin bukan disebabkan oleh
kebetulan.
Kesimpulan
Dari hasil analisis dan uji statistik yang dilakukan, dapat disimpulkan beberapa hal terkait dengan faktor-faktor yang mempengaruhi kelulusan tepat waktu dan predikat kelulusan mahasiswa:
- Korelasi antara IPS dan Kelulusan Tepat Waktu: Korelasi sebesar 0,15 menunjukkan hubungan yang lemah antara rata-rata IPS dan kelulusan tepat waktu. Meskipun hubungan ini lemah, informasi ini tetap berguna dalam analisis faktor-faktor yang mempengaruhi kelulusan tepat waktu.
- Predikat Pujian dan Kelulusan Tepat Waktu: Predikat Pujian memiliki hubungan positif yang signifikan dengan kelulusan tepat waktu. Mahasiswa yang mendapatkan predikat Pujian cenderung lebih mungkin lulus tepat waktu dibandingkan dengan yang tidak mendapatkan predikat Pujian.
- Durasi Studi dan Predikat Kelulusan: Ada hubungan yang signifikan antara durasi studi dan predikat kelulusan mahasiswa. Durasi studi, baik pendek maupun panjang, berpengaruh terhadap predikat kelulusan yang diperoleh oleh mahasiswa.
- Perbandingan Nilai Total antara Jenis Kelamin: Uji t menunjukkan bahwa rata-rata nilai total kelompok laki-laki lebih rendah secara signifikan dibandingkan dengan kelompok perempuan. Perbedaan ini sangat mungkin bukan disebabkan oleh kebetulan dan menunjukkan adanya perbedaan akademik berdasarkan jenis kelamin.
Kesimpulan ini memberikan wawasan yang berguna tentang
faktor-faktor yang mempengaruhi kelulusan tepat waktu dan predikat kelulusan
mahasiswa. Meskipun beberapa hubungan yang ditemukan mungkin lemah, informasi
ini dapat digunakan sebagai dasar untuk analisis lebih lanjut dan pertimbangan
dalam upaya meningkatkan hasil akademik mahasiswa.
No comments: