recent posts

Analisis Data Mining Mahasiswa Universitas Buana Perjuangan Karawang

Analisis Data Mining Mahasiswa Universitas Buana Perjuangan Karawang

 

Data mining adalah teknik analisis data yang dapat membantu kita menemukan pola dan wawasan yang berguna dari kumpulan data besar. Dalam artikel ini, kita akan membahas hasil analisis data mining yang dilakukan pada data transkrip nilai dan data lulusan mahasiswa Universitas Buana Perjuangan Karawang.

Tujuan Analisis

Tujuan dari analisis ini adalah untuk memahami performa akademik mahasiswa, faktor-faktor yang mempengaruhi kelulusan, dan potensi korelasi antara nilai mata kuliah dan predikat kelulusan. Dengan menggali data ini, kita dapat mengidentifikasi tren yang menarik dan memberikan saran untuk meningkatkan kualitas pendidikan di universitas.

Sumber Data

Analisis ini menggunakan data kelulusan mahasiswa yang berjumlah 4542, disimpan dalam variabel df_mslulusan, dan data transkrip nilai mahasiswa yang berjumlah 256299, disimpan dalam variabel df_trankip. Data transkrip nilai berisi detail nilai yang diperoleh mahasiswa untuk setiap mata kuliah yang diambil. Sedangkan data kelulusan memberikan informasi demografis dan akademik mahasiswa, termasuk tanggal masuk dan lulus, serta predikat kelulusan.

Gambar : Kolom pada Dataset df_mslulusan dan df_transkip

Tahap Integrasi dan Pembersihan Data

Menghitung Nilai IPS

Menghitung nilai ips tiap mata kuliah yang berasal dari df_transkip (nilai_grade dan sks_mk) dengan menjumlahkannya, lalu membaginya dengan jumlah total sks_mk. Dan Kemudian dihitung rata rata tiap nim, sehingga jumlah data menjadi 4526 Baris serta dibuatkan menjadi pivot

Gambar : Nilai IPS

Menggabungkan IPS
menggabungkan colum ips ke dalam dataset df_mslulusan

Gambar : Menggabungkan IPS dan Dataset Ms_lulusan

Durasi Studi

Menambahkan Kolom Durasi Studi. Kolom ini akan berisi data berupa jumlah hari studi yang dihitung dengan mengurangkan tanggal lulus dengan tanggal masuk mahasiswa. Durasi studi akan menunjukkan jumlah hari yang dihabiskan mahasiswa selama periode studi.

Gambar : Menambahkan Durasi Studi ke Dataset

Pembersihan Data

Pada pengecekan data miss ditemukan beberapa data yang miss yaitu Nan, Sehingga data Nan diubah menjadi 0

Gambar : Cek data null

Pada pembersihan data juga dilakukan penghapusan row pada kolom predikat yang berisi predikat

Gambar : Kolom Predikat

Standarisasi
Mengubah jenis kelamin yang awalnya 0 dan 1 menjadi Laki laki dan Perempuan

Gambar : Standarisasi Jenis Kelamin


Tahap Analisis

Analisis Hubungan antara Nilai Rata-rata Mata Kuliah (IPS) dan Lulusan Tepat Waktu

Gambar : Grafik HeatMap Hubungan Rata-rata IPS dalam Lulusan Tepat Waktu dan Tidak

 

Korelasi antara rata-rata Indeks Prestasi Semester (IPS) dan kelulusan tepat waktu sebesar 0,15 menunjukkan bahwa ada hubungan yang sangat lemah antara kedua variabel tersebut.

Korelasi adalah ukuran statistik yang menunjukkan seberapa kuat hubungan antara dua variabel. Nilai korelasi berkisar antara -1 hingga 1. Nilai 0 berarti tidak ada hubungan sama sekali, sementara nilai mendekati 1 atau -1 menunjukkan hubungan yang kuat.

  • Korelasi positif: Jika korelasi positif, nilai rata-rata IPS yang lebih tinggi sedikit berkaitan dengan kemungkinan kelulusan tepat waktu yang lebih tinggi. Namun, dengan korelasi sebesar 0,15, hubungan ini sangat lemah.
  • Kekuatan hubungan: Korelasi sebesar 0,15 berarti hubungan antara rata-rata IPS dan kelulusan tepat waktu sangat lemah. Artinya, perubahan pada rata-rata IPS tidak memiliki banyak pengaruh terhadap kelulusan tepat waktu, atau sebaliknya.
  • Kemungkinan faktor lain: Ada kemungkinan faktor lain yang lebih signifikan mempengaruhi kelulusan tepat waktu daripada rata-rata IPS.

Secara keseluruhan, korelasi sebesar 0,15 menunjukkan bahwa rata-rata IPS bukanlah indikator yang kuat untuk memprediksi kelulusan tepat waktu. Namun, hubungan yang lemah ini dapat memberikan informasi tambahan dalam analisis yang lebih besar tentang faktor-faktor yang mempengaruhi kelulusan tepat waktu.

 

Analisis hubungan antara predikat kelulusan 'Pujian' dengan lulusan tepat waktu

Gambar : Grafik HeatMap Hubungan antara Predikat Kelulusan dan Lulus Tepat Waktu

Korelasi point biserial: Nilai korelasi point biserial antara predikat Pujian dan lulus tepat waktu adalah 0.35. Nilai ini menunjukkan tingkat hubungan antara dua variabel biner (predikat Pujian dan lulus tepat waktu).

Interpretasi nilai korelasi: Nilai korelasi berkisar antara -1 dan 1. Nilai 0.35 menunjukkan korelasi positif sedang antara predikat Pujian dan lulus tepat waktu. Artinya, ada hubungan positif yang moderat antara predikat Pujian dan lulus tepat waktu. Semakin tinggi nilai korelasi, semakin kuat hubungan tersebut.

Nilai p: Nilai p yang dihasilkan adalah 0.0000, yang menunjukkan bahwa korelasi ini signifikan secara statistik pada tingkat signifikansi 0.05 (atau 5%).

Interpretasi nilai p: Nilai p menunjukkan tingkat signifikansi korelasi. Nilai p sebesar 0.0000 berarti bahwa korelasi yang ditemukan sangat signifikan, karena peluang untuk mendapatkan hasil korelasi ini jika tidak ada hubungan (nol) antara variabel sangat rendah.

Secara keseluruhan, hasil analisis menunjukkan bahwa predikat Pujian memiliki hubungan positif yang signifikan dengan lulus tepat waktu. Ini berarti bahwa mahasiswa yang mendapatkan predikat Pujian cenderung lebih mungkin lulus tepat waktu daripada yang tidak mendapatkan predikat Pujian.

 

Analisis hubungan antara durasi studi dengan predikat kelulusan

Gambar : HeatMap Hubungan antara Kategori Durasi Studi dan Predikat Kelulusan

Nilai Chi-Square: Nilai Chi-Square yang tinggi, seperti 542.6754157475119, menunjukkan bahwa terdapat perbedaan signifikan antara kategori durasi studi (kategori_durasi) dan predikat kelulusan (predikat). Nilai ini dihitung berdasarkan seberapa banyak frekuensi yang diamati (observed frequencies) berbeda dari frekuensi yang diharapkan (expected frequencies) dalam tabel kontingensi.

P-value: P-value yang sangat rendah (1.443878794385324e-118) menunjukkan bahwa perbedaan yang diamati antara kategori durasi studi dan predikat kelulusan sangat kecil kemungkinannya disebabkan oleh kebetulan. P-value yang rendah (biasanya kurang dari 0,05) menunjukkan bahwa perbedaan antara variabel sangat signifikan secara statistik.

Kesimpulan: Karena p-value yang sangat rendah, Dapat disimpulkan bahwa ada hubungan yang signifikan antara kategori durasi studi dan predikat kelulusan. Dengan kata lain, kategori durasi studi (pendek atau panjang) memiliki pengaruh terhadap predikat kelulusan mahasiswa.

Hasil ini menunjukkan bahwa durasi studi dapat berhubungan dengan jenis predikat kelulusan yang diperoleh oleh mahasiswa.

 

Perbandingan Nilai Total antara Jenis Kelamin


Gambar : Grafik Boxplot Distribusi Nilai Total berdasarkan Jenis Kelamin

Hasil uji t dua sample independent yang di peroleh menunjukkan bahwa ada perbedaan signifikan antara rata-rata nilai total kelompok laki-laki dan perempuan.

  • T-statistic: Nilai t-statistic yang di peroleh adalah -13.7622. Nilai ini menunjukkan seberapa besar perbedaan rata-rata antara kelompok laki-laki dan perempuan dalam satuan standar deviasi. Nilai negatif menunjukkan bahwa rata-rata nilai total kelompok laki-laki lebih rendah daripada rata-rata nilai total kelompok perempuan.
  • P-value: P-value yang di peroleh adalah 0.0000. P-value adalah probabilitas mendapatkan hasil seperti itu atau lebih ekstrem jika hipotesis nol (tidak ada perbedaan rata-rata) benar. Dalam praktiknya, p-value sangat kecil, menunjukkan bahwa perbedaan rata-rata antara kelompok laki-laki dan perempuan sangat signifikan secara statistik.

Interpretasi: Karena p-value (0.0000) jauh lebih kecil daripada tingkat signifikansi standar 0.05, dapat disimpulkan bahwa ada perbedaan yang signifikan dalam rata-rata nilai total antara kelompok laki-laki dan perempuan. Ini menunjukkan bahwa rata-rata nilai total kedua kelompok benar-benar berbeda, dan perbedaan ini bukan hanya kebetulan.

Kesimpulannya, hasil uji t menunjukkan bahwa rata-rata nilai total kelompok laki-laki lebih rendah secara signifikan dibandingkan dengan kelompok perempuan, dan perbedaan ini sangat mungkin bukan disebabkan oleh kebetulan.


Kesimpulan

Dari hasil analisis dan uji statistik yang dilakukan, dapat disimpulkan beberapa hal terkait dengan faktor-faktor yang mempengaruhi kelulusan tepat waktu dan predikat kelulusan mahasiswa:

  • Korelasi antara IPS dan Kelulusan Tepat Waktu: Korelasi sebesar 0,15 menunjukkan hubungan yang lemah antara rata-rata IPS dan kelulusan tepat waktu. Meskipun hubungan ini lemah, informasi ini tetap berguna dalam analisis faktor-faktor yang mempengaruhi kelulusan tepat waktu.
  • Predikat Pujian dan Kelulusan Tepat Waktu: Predikat Pujian memiliki hubungan positif yang signifikan dengan kelulusan tepat waktu. Mahasiswa yang mendapatkan predikat Pujian cenderung lebih mungkin lulus tepat waktu dibandingkan dengan yang tidak mendapatkan predikat Pujian.
  • Durasi Studi dan Predikat Kelulusan: Ada hubungan yang signifikan antara durasi studi dan predikat kelulusan mahasiswa. Durasi studi, baik pendek maupun panjang, berpengaruh terhadap predikat kelulusan yang diperoleh oleh mahasiswa.
  • Perbandingan Nilai Total antara Jenis Kelamin: Uji t menunjukkan bahwa rata-rata nilai total kelompok laki-laki lebih rendah secara signifikan dibandingkan dengan kelompok perempuan. Perbedaan ini sangat mungkin bukan disebabkan oleh kebetulan dan menunjukkan adanya perbedaan akademik berdasarkan jenis kelamin.

Kesimpulan ini memberikan wawasan yang berguna tentang faktor-faktor yang mempengaruhi kelulusan tepat waktu dan predikat kelulusan mahasiswa. Meskipun beberapa hubungan yang ditemukan mungkin lemah, informasi ini dapat digunakan sebagai dasar untuk analisis lebih lanjut dan pertimbangan dalam upaya meningkatkan hasil akademik mahasiswa.

 

Link Dokumen : Link PDF

Analisis Data Mining Mahasiswa Universitas Buana Perjuangan Karawang Analisis Data Mining Mahasiswa Universitas Buana Perjuangan Karawang Reviewed by Vikha Trivicika on April 28, 2024 Rating: 5

No comments:

Powered by Blogger.