Pada masa kini, bahasa pengaturcaraan seperti Python dan R tidak diragukan lagi adalah beberapa bahasa yang paling banyak diminati dalam Sains Data dan Pembelajaran Mesin.
Tetapi adakah mungkin untuk melakukan tugas Pembelajaran Mesin dan Sains Data biasa tanpa semestinya mahir dalam pengekodan?
Sudah tentu ia! Weka adalah pakej sumber terbuka berasaskan antara muka pengguna grafik. Ia dapat digunakan untuk melakukan tugas-tugas Sains Data biasa hanya dengan menggunakan antara muka grafik.
Asas
Weka boleh dipasang dengan mudah di mana-mana jenis platform dengan mengikuti arahan di pautan berikut. Satu-satunya syarat ialah memasang Java 8.0 pada mesin tempatan anda.
Setelah anda memasang Weka, anda akan mempunyai satu set teknik pemprosesan data dan inferensi standard seperti:
- Pra-pemprosesan data : setelah memuatkan set data, Weka membolehkan anda meneroka atribut dan kejadiannya dengan cepat. Selain itu, teknik penapisan yang berbeza tersedia untuk, misalnya, menukar data kategori menjadi angka atau melakukan pemilihan ciri untuk mengurangkan dimensi kumpulan data kami (mis. Untuk mempercepat masa latihan dan prestasi).
- Algoritma Pengelasan dan Regresi:koleksi algoritma yang berbeza seperti Gaussian Naive Bayes, Decision Trees, K-Nearest Neighbor, teknik Ensembles, dan pelbagai varian regresi linear.
- Penggabungan: teknik ini dapat digunakan untuk mengenal pasti kategori utama dalam data kami dengan cara yang tidak diawasi. Beberapa contoh algoritma yang terdapat dalam koleksi Weka adalah K-Means Clustering dan Expectation Maximization.
- Discovering Associations: menemui peraturan dalam set data kami untuk mengenal pasti corak dan hubungan antara ciri yang berbeza dengan lebih mudah.
- Visualisasi Data:rangkaian teknik visualisasi data bersepadu untuk memvisualisasikan korelasi antara ciri dengan cepat dan mewakili corak pembelajaran mesin yang dipelajari seperti Pokok Keputusan dan Pengelompokan K-Means.
Satu lagi ciri menarik dari Weka adalah kemampuan untuk memasang pakej baru semasa dibuat.
Salah satu contoh pakej tambahan yang boleh anda pasang ialah AutoML. AutoML sebenarnya sangat berguna untuk pemula yang mungkin sukar untuk mengenal pasti model Pembelajaran Mesin mana yang paling baik digunakan untuk tugas tertentu.
Dengan menggunakan pakej WML AutoML, anda dapat dengan mudah menguji pelbagai model Pembelajaran Mesin dengan cepat. Ini juga membolehkan anda menyesuaikan parameter hipernya secara automatik untuk meningkatkan prestasi.
Akhirnya, bagi pengguna yang lebih pakar, Weka juga menawarkan antara muka baris perintah untuk menggunakan kod Java. Ini sangat berguna terutamanya jika anda menggunakan sejumlah besar data.
Contohnya
Kita sekarang akan melalui contoh sederhana untuk menunjukkan bagaimana memulakan Weka.
Pertama sekali, kita boleh memulakan analisis kita dengan membuka Weka Explorer dan membuka dataset kita (dalam contoh ini, Iris Dataset).

Pilih tab Kelaskan, pilih Naive Bayes sebagai pengelasan kami, dan klik mula. Anda akan dapat melihat bahawa kita dapat mencapai ketepatan klasifikasi 96% dengan cepat tanpa perlu menulis kod apa pun!

Kesimpulannya
Sekiranya anda mencari lebih banyak maklumat mengenai cara memulakan Weka, siri YouTube oleh Google Developers ini adalah tempat yang baik untuk memulakan.
Hubungi saya
Sekiranya anda ingin terus mengemas kini artikel dan projek terbaru saya, ikuti saya di Medium dan melanggan senarai surat saya. Ini adalah beberapa maklumat kenalan saya:
- Blog Peribadi
- Laman Web Peribadi
- Profil Sederhana
- GitHub
- Kaggle
Foto sampul dari artikel ini.