Setiap kursus Pembelajaran Mesin di internet, diberi peringkat berdasarkan ulasan anda

Setahun setengah yang lalu, saya berhenti dari salah satu program sains komputer terbaik di Kanada. Saya mula membuat program sarjana sains data saya sendiri menggunakan sumber dalam talian. Saya sedar bahawa saya dapat mempelajari semua yang saya perlukan melalui edX, Coursera, dan Udacity. Dan saya dapat mempelajarinya dengan lebih pantas, lebih cekap, dan dengan sebahagian kecil kos.

Saya hampir selesai sekarang. Saya telah mengikuti banyak kursus yang berkaitan dengan sains data dan beberapa bahagian yang diaudit. Saya tahu pilihannya di luar sana, dan kemahiran apa yang diperlukan untuk pelajar mempersiapkan peranan penganalisis data atau saintis data.Oleh itu, saya mula membuat panduan berdasarkan ulasan yang mengesyorkan kursus terbaik untuk setiap subjek dalam sains data.

Untuk panduan pertama dalam siri ini, saya mencadangkan beberapa kelas pengekodan untuk saintis data pemula. Kemudian itu adalah statistik dan kelas kebarangkalian. Kemudian pengenalan kepada sains data. Juga, visualisasi data.

Sekarang ke pembelajaran mesin.

Untuk panduan ini, saya menghabiskan masa belasan jam untuk mengenal pasti setiap kursus pembelajaran mesin dalam talian yang ditawarkan pada Mei 2017, mengambil maklumat penting dari sukatan dan ulasan mereka, dan mengumpulkan penilaian mereka. Tujuan akhir saya adalah untuk mengenal pasti tiga kursus terbaik yang ada dan membentangkannya kepada anda, di bawah.

Untuk tugas ini, saya beralih kepada komuniti Kelas Pusat sumber terbuka, dan pangkalan data beribu-ribu penilaian dan ulasan kursus.

Sejak tahun 2011, pengasas Class Central Dhawal Shah mengawasi kursus dalam talian dengan lebih dekat daripada orang lain di dunia ini. Dhawal secara peribadi menolong saya mengumpulkan senarai sumber ini.

Bagaimana kami memilih kursus untuk dipertimbangkan

Setiap kursus mesti memenuhi tiga kriteria:

  1. Ia mesti mempunyai sejumlah besar kandungan pembelajaran mesin. Sebaik-baiknya, pembelajaran mesin adalah topik utama.Perhatikan bahawa kursus hanya pembelajaran mendalam tidak termasuk. Lebih lanjut mengenai itu kemudian.
  2. Ia mesti berdasarkan permintaan atau ditawarkan setiap beberapa bulan.
  3. Ia mestilah kursus dalam talian interaktif, jadi tidak ada buku atau tutorial baca sahaja . Walaupun ini adalah kaedah yang boleh dipelajari, panduan ini memberi tumpuan kepada kursus. Kursus yang merupakan video yang ketat (iaitu tanpa kuiz, tugasan, dll.) Juga tidak termasuk.

Kami yakin kami merangkumi setiap kursus penting yang memenuhi kriteria di atas. Oleh kerana terdapat ratusan kursus mengenai Udemy, kami memilih untuk mempertimbangkan kursus yang paling banyak dikaji dan dinilai tinggi sahaja.

Walaupun begitu, selalu ada kemungkinan kita kehilangan sesuatu. Oleh itu, sila beritahu kami di bahagian komen jika kami meninggalkan jalan keluar yang baik.

Bagaimana kami menilai kursus

Kami mengumpulkan penilaian purata dan jumlah ulasan dari Class Central dan laman web tinjauan lain untuk mengira penilaian purata berwajaran untuk setiap kursus. Kami membaca ulasan teks dan menggunakan maklum balas ini untuk menambah penilaian berangka.

Kami membuat panggilan penilaian sukatan pelajaran subjektif berdasarkan tiga faktor:

  1. Penjelasan mengenai aliran kerja pembelajaran mesin. Adakah kursus menggariskan langkah-langkah yang diperlukan untuk melaksanakan projek ML yang berjaya? Lihat bahagian seterusnya untuk apa yang memerlukan aliran kerja biasa.
  2. Liputan teknik dan algoritma pembelajaran mesin. Adakah pelbagai teknik (seperti regresi, klasifikasi, pengelompokan, dll.) Dan algoritma (misalnya dalam klasifikasi: Bayes naif, pohon keputusan, mesin vektor sokongan, dll.) Dilindungi atau hanya beberapa pilihan? Keutamaan diberikan kepada kursus-kursus yang merangkumi lebih banyak perkara tanpa perlu memperhatikan secara terperinci.
  3. Penggunaan alat sains sains dan pembelajaran mesin yang biasa. Adakah kursus yang diajar menggunakan bahasa pengaturcaraan yang popular seperti Python, R, dan / atau Scala? Bagaimana dengan perpustakaan yang popular dalam bahasa-bahasa tersebut? Ini tidak perlu, tetapi bermanfaat sehingga sedikit pilihan diberikan kepada kursus ini.

Apa itu pembelajaran mesin? Apakah aliran kerja?

Definisi yang popular berasal dari Arthur Samuel pada tahun 1959: pembelajaran mesin adalah bidang sains komputer yang memberikan "komputer kemampuan untuk belajar tanpa diprogram secara eksplisit." Dalam praktiknya, ini bermaksud mengembangkan program komputer yang dapat membuat ramalan berdasarkan data. Sama seperti manusia dapat belajar dari pengalaman, begitu juga komputer, di mana data = pengalaman.

Aliran kerja pembelajaran mesin adalah proses yang diperlukan untuk menjalankan projek pembelajaran mesin. Walaupun projek individu boleh berbeza, kebanyakan aliran kerja mempunyai beberapa tugas biasa: penilaian masalah, penerokaan data, pemprosesan data, latihan model / ujian / penyebaran, dan lain-lain. Di bawah ini anda akan dapat melihat visualisasi langkah-langkah teras ini:

Kursus yang ideal memperkenalkan keseluruhan proses dan memberikan contoh, tugasan, dan / atau kuiz interaktif di mana pelajar dapat melaksanakan setiap tugas itu sendiri.

Adakah kursus ini merangkumi pembelajaran mendalam?

Pertama, mari kita tentukan pembelajaran mendalam. Berikut adalah penerangan ringkas:

"Pembelajaran mendalam adalah subbidang pembelajaran mesin yang berkaitan dengan algoritma yang diilhami oleh struktur dan fungsi otak yang disebut jaringan saraf tiruan." - Jason Brownlee dari Machine Learning Mastery

Seperti yang diharapkan, sebahagian dari kursus pembelajaran mesin mengandungi kandungan pembelajaran yang mendalam. Namun, saya memilih untuk tidak memasukkan kursus pembelajaran mendalam sahaja. Sekiranya anda berminat untuk belajar secara mendalam, kami akan memberi anda artikel dengan artikel berikut:

Ikuti Pembelajaran Dalam dengan 12 kursus dalam talian percuma

Setiap hari membawa tajuk utama bagaimana pembelajaran mendalam mengubah dunia di sekitar kita. Beberapa contoh: medium.freecodecamp.com

Tiga cadangan utama saya dari senarai itu ialah:

  • Aplikasi Kreatif Pembelajaran Dalam dengan TensorFlowoleh Kadenze
  • Rangkaian Neural untuk Pembelajaran Mesin oleh University of Toronto (diajar oleh Geoffrey Hinton) melalui Coursera
  • Pembelajaran Dalam AZ ™: Rangkaian Neural Buatan Tangan

    oleh Kirill Eremenko, Hadelin de Ponteves, dan Pasukan SuperDataScience melalui Udemy

Prasyarat yang disyorkan

Beberapa kursus yang disenaraikan di bawah meminta pelajar untuk mempunyai pengalaman pengaturcaraan, kalkulus, aljabar linear, dan statistik sebelumnya. Prasyarat ini dapat difahami memandangkan pembelajaran mesin adalah disiplin yang maju.

Hilang beberapa subjek? Berita baik! Sebilangan pengalaman ini dapat diperoleh melalui cadangan kami dalam dua artikel pertama (pengaturcaraan, statistik) Panduan Kerjaya Sains Data ini. Beberapa kursus peringkat tinggi di bawah ini juga menyediakan kalkulus lembut dan penyegar aljabar linear dan menonjolkan aspek-aspek yang paling berkaitan dengan pembelajaran mesin bagi mereka yang kurang biasa.

Pilihan kami untuk kursus pembelajaran mesin terbaik adalah…

  • Pembelajaran Mesin (Universiti Stanford melalui Coursera)

Pembelajaran Mesin Universiti Courford di Coursera adalah pemenang semasa yang jelas dari segi penilaian, ulasan dan sukatan pelajaran. Diajar oleh Andrew Ng yang terkenal, pengasas Google Brain dan mantan ketua saintis di Baidu, kelas inilah yang memicu penubuhan Coursera. Ia mempunyai penilaian purata berwajaran 4.7 bintang berbanding 422 ulasan.

Dikeluarkan pada tahun 2011, ia merangkumi semua aspek aliran kerja pembelajaran mesin. Walaupun ia mempunyai ruang lingkup yang lebih kecil daripada kelas Stanford yang asal, tetapi ia tetap dapat merangkumi sebilangan besar teknik dan algoritma. Garis masa anggaran adalah sebelas minggu, dengan dua minggu yang dikhaskan untuk rangkaian saraf dan pembelajaran mendalam. Pilihan percuma dan berbayar ada.

Ng adalah pengajar yang dinamik namun lembut dengan pengalaman yang jelas. Dia menginspirasi keyakinan, terutama ketika berkongsi petua dan peringatan pelaksanaan praktikal mengenai perangkap umum. Penyegaran aljabar linear disediakan dan Ng menyoroti aspek kalkulus yang paling berkaitan dengan pembelajaran mesin.

Penilaian adalah automatik dan dilakukan melalui kuiz pilihan ganda yang mengikuti setiap pelajaran dan tugasan pengaturcaraan. Tugasan (ada lapan daripadanya) dapat diselesaikan dalam MATLAB atau Octave, yang merupakan versi sumber terbuka MATLAB. Ng menjelaskan pilihan bahasanya:

Pada masa lalu, saya telah cuba mengajar pembelajaran mesin menggunakan pelbagai jenis bahasa pengaturcaraan yang berbeza termasuk C ++, Java, Python, NumPy, dan juga Octave… Dan apa yang saya lihat setelah mengajar pembelajaran mesin selama hampir satu dekad ialah anda belajar lebih pantas jika anda menggunakan Octave sebagai persekitaran pengaturcaraan anda.

Walaupun Python dan R kemungkinan pilihan yang lebih menarik pada tahun 2017 dengan peningkatan populariti bahasa itu, pengulas menyatakan bahawa itu tidak boleh menghalang anda untuk mengikuti kursus ini.

Beberapa pengulas terkenal menyatakan perkara berikut:

Sudah lama terkenal di dunia MOOC, kursus pembelajaran mesin Stanford adalah pengenalan yang pasti untuk topik ini. Kursus ini merangkumi semua bidang utama pembelajaran mesin… Prof Ng mendahului setiap segmen dengan perbincangan dan contoh yang memotivasi.

Andrew Ng adalah seorang guru yang berbakat dan dapat menjelaskan subjek yang rumit dengan cara yang sangat intuitif dan jelas, termasuk matematik di sebalik semua konsep. Amat disyorkan.

Satu-satunya masalah yang saya dapati dengan kursus ini sekiranya menetapkan jangkaan sangat tinggi untuk kursus lain.

Pengenalan Liga Ivy baru dengan profesor yang cemerlang

  • Pembelajaran Mesin (Universiti Columbia melalui edX)

Pembelajaran Mesin Universiti Columbia adalah penawaran yang agak baru yang merupakan sebahagian daripada MikroMaster Kecerdasan Buatan mereka di edX. Walaupun lebih baru dan tidak mempunyai sebilangan besar ulasan, ulasan yang ada sangat kuat. Profesor John Paisley terkenal sebagai seorang yang cemerlang, jelas, dan pandai. Ia mempunyai penilaian purata berwajaran 4.8 bintang lebih dari 10 ulasan.

Kursus ini juga merangkumi semua aspek aliran kerja pembelajaran mesin dan lebih banyak algoritma daripada penawaran Stanford di atas. Columbia's adalah pengenalan yang lebih maju, dengan pengulas menyatakan bahawa pelajar harus selesa dengan prasyarat yang disyorkan (kalkulus, aljabar linear, statistik, kebarangkalian, dan pengekodan).

Kuiz (11), tugas pengaturcaraan (4), dan ujian akhir adalah kaedah penilaian. Pelajar boleh menggunakan Python, Octave, atau MATLAB untuk menyelesaikan tugasan. Jangka masa keseluruhan kursus adalah lapan hingga sepuluh jam seminggu selama dua belas minggu. Ia percuma dengan sijil yang disahkan tersedia untuk pembelian.

Berikut adalah beberapa ulasan berkilau yang disebutkan di atas:

Selama bertahun-tahun saya menjadi pelajar saya telah menemui profesor yang tidak cemerlang, profesor yang cemerlang tetapi mereka tidak tahu bagaimana menjelaskan perkara dengan jelas, dan profesor yang cemerlang dan tahu bagaimana menjelaskan perkara itu dengan jelas. Paisley tergolong dalam kumpulan ketiga.

Ini adalah kursus yang bagus ... Bahasa pengajar tepat dan itulah, menurut fikiran saya, salah satu perkara terkuat dalam kursus ini. Kuliah berkualiti tinggi dan slaid juga bagus.

Dr. Paisley dan penyelia adalah… pelajar Michael Jordan, bapa kepada pembelajaran mesin. [Dr. Paisley] adalah profesor ML terbaik di Columbia kerana kemampuannya untuk menerangkan perkara dengan jelas. Sehingga 240 pelajar telah memilih kursusnya pada semester ini, jumlah terbesar di antara semua profesor [mengajar] pembelajaran mesin di Columbia.

Pengenalan praktikal dalam Python & R dari pakar industri

  • Pembelajaran Mesin AZ ™: Hands-On Python & R Dalam Sains Data (Kirill Eremenko, Hadelin de Ponteves, dan Pasukan SuperDataScience melalui Udemy)

Machine Learning AZ ™ pada Udemy adalah persembahan hebatnya terperinci yang menyediakan arahan dalam kedua-dua Python dan R, yang jarang berlaku dan tidak boleh dikatakan untuk mana-mana kursus bahagian lain. Ia mempunyai penilaian rata-rata berwajaran 4.5 bintang daripada 8,119 ulasan, yang menjadikannya kursus yang paling banyak dikaji daripada yang dipertimbangkan.

Ini merangkumi keseluruhan aliran kerja pembelajaran mesin dan sebilangan algoritma yang hampir tidak masuk akal (dengan cara yang baik) melalui 40.5 jam video atas permintaan. Kursus ini mengambil pendekatan yang lebih terapan dan lebih sesuai dengan matematik daripada dua kursus di atas. Setiap bahagian dimulakan dengan video "intuisi" dari Eremenko yang merangkum teori asas konsep yang diajarkan. de Ponteves kemudian melalui pelaksanaan dengan video yang berasingan untuk Python dan R.

Sebagai "bonus," kursus ini merangkumi templat kod Python dan R untuk dimuat dan digunakan oleh pelajar pada projek mereka sendiri. Terdapat kuiz dan cabaran pekerjaan rumah, walaupun ini bukan titik kuat kursus ini.

Eremenko dan pasukan SuperDataScience dihormati kerana kemampuan mereka "membuat kompleks menjadi sederhana." Juga, prasyarat yang disenaraikan adalah "hanya beberapa matematik sekolah menengah," jadi kursus ini mungkin merupakan pilihan yang lebih baik bagi mereka yang ditakuti oleh persembahan Stanford dan Columbia.

Beberapa pengulas terkenal menyatakan perkara berikut:

Kursus ini dihasilkan secara profesional, kualiti suara sangat baik, dan penjelasannya jelas dan ringkas ... Ini adalah nilai yang luar biasa untuk pelaburan kewangan dan masa anda.

Sangat menakjubkan dapat mengikuti kursus dalam dua bahasa pengaturcaraan yang berbeza secara serentak.

Kirill adalah salah satu tenaga pengajar terbaik di Udemy (jika bukan Internet) dan saya mengesyorkan mengikuti kelas yang dia ajar. ... Kursus ini mempunyai banyak isi, seperti satu ton!

Pertandingan

Pilihan # 1 kami mempunyai penilaian purata berwajaran 4.7 daripada 5 bintang berbanding 422 ulasan. Mari lihat alternatif lain, disusun mengikut peringkat menurun. Peringatan bahawa kursus pembelajaran mendalam tidak termasuk dalam panduan ini - anda boleh mendapatkannya di sini.

The Edge Analytics (Massachusetts Institute of Technology / edX): Lebih tertumpu pada analisis secara umum, walaupun merangkumi beberapa topik pembelajaran mesin. Menggunakan R. Naratif kuat yang memanfaatkan contoh-contoh dunia nyata yang biasa. Mencabar. Sepuluh hingga lima belas jam seminggu selama dua belas minggu. Percuma dengan sijil yang disahkan tersedia untuk pembelian. Ia mempunyai penilaian rata-rata berwajaran 4.9 bintang daripada 214 ulasan.

Python for Science Science and Machine Learning Bootcamp (Jose Portilla / Udemy): Mempunyai sebahagian besar kandungan pembelajaran mesin, tetapi merangkumi keseluruhan proses sains data. Lebih banyak pengenalan yang sangat terperinci kepada Python. Kursus yang menakjubkan, walaupun tidak sesuai untuk skop panduan ini. 21.5 jam video atas permintaan. Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku. Ia mempunyai penilaian purata berwajaran 4.6 bintang lebih daripada 3316 ulasan.

Bootcamp Sains Data dan Pembelajaran Mesin dengan R (Jose Portilla / Udemy): Komen untuk kursus Portilla di atas juga berlaku di sini, kecuali video R. 17.5 jam atas permintaan Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku. Ia mempunyai penilaian rata-rata berwajaran 4.6 bintang daripada 1317 ulasan.

Siri Pembelajaran Mesin (Lazy Programmer Inc./Udemy): Diajar oleh saintis data / jurutera data besar / jurutera perisian tumpukan penuh dengan resume yang mengagumkan, Lazy Programmer kini mempunyai serangkaian 16 kursus yang berfokus pada pembelajaran mesin di Udemy. Secara keseluruhan, kursus ini mempunyai penarafan 5000+ dan hampir semuanya mempunyai 4.6 bintang. Urutan kursus yang berguna disediakan dalam penerangan setiap kursus. Menggunakan Python. Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku.

Pembelajaran Mesin (Georgia Tech / Udacity): Penyusunan tiga kursus berasingan: Pembelajaran Diawasi, Tidak Diawasi dan Pengukuhan. Sebahagian daripada Jurutera Pembelajaran Mesin Udacity Nanodegree dan Ijazah Sarjana Dalam Talian (OMS) Georgia Tech. Video bersaiz gigitan, seperti gaya Udacity. Profesor yang ramah. Jangka masa jangka masa empat bulan. Percuma. Ia mempunyai penarafan purata 4.56 bintang berbanding 9 ulasan.

Melaksanakan Predictive Analytics with Spark in Azure HDInsight (Microsoft / edX): Memperkenalkan konsep teras pembelajaran mesin dan pelbagai algoritma. Memanfaatkan beberapa alat mesra data besar, termasuk Apache Spark, Scala, dan Hadoop. Menggunakan Python dan R. Empat jam seminggu selama enam minggu. Percuma dengan sijil yang disahkan tersedia untuk pembelian. Ia mempunyai penilaian rata-rata berwajaran bintang 4,5 lebih dari 6 ulasan.

Sains Data dan Pembelajaran Mesin dengan Python - Hands On! (Frank Kane / Udemy): Menggunakan Python. Kane mempunyai pengalaman selama sembilan tahun di Amazon dan IMDb. Sembilan jam video atas permintaan. Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku. Ia mempunyai penilaian rata-rata berwajaran 4.5 bintang berbanding 4139 ulasan.

Scala dan Spark untuk Data Besar dan Pembelajaran Mesin (Jose Portilla / Udemy): "Big data" fokus, khususnya pada pelaksanaan di Scala dan Spark. Sepuluh jam video atas permintaan. Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku. Ia mempunyai penilaian rata-rata berwajaran bintang 4,5 lebih dari 607 ulasan.

Mesin Pembelajaran Mesin Nanodegree (Udacity): Program Mesin Pembelajaran unggulan Udacity, yang menampilkan sistem tinjauan projek terbaik dan sokongan kerjaya. Program ini adalah kompilasi beberapa kursus Udacity individu, yang percuma. Dicipta bersama oleh Kaggle. Jangka masa jangka masa enam bulan. Pada masa ini berharga $ 199 USD sebulan dengan bayaran balik tuisyen 50% tersedia bagi mereka yang lulus dalam 12 bulan. Ia mempunyai penilaian purata berwajaran 4.5 bintang berbanding 2 ulasan.

Belajar Dari Data (Pembelajaran Mesin Pengenalan) (California Institute of Technology / edX): Pendaftaran ditutup pada edX, tetapi juga tersedia melalui platform bebas CalTech (lihat di bawah). Ia mempunyai penilaian rata-rata berwajaran bintang 4.49 lebih dari 42 ulasan.

Belajar Dari Data (Pembelajaran Mesin Pengantar) (Yaser Abu-Mostafa / California Institute of Technology): "Kursus Caltech yang sebenar, bukan versi yang lemah." Ulasan menyatakan bahawa sangat baik untuk memahami teori pembelajaran mesin. Guru besar, Yaser Abu-Mostafa, terkenal di kalangan pelajar dan juga menulis buku teks yang menjadi asas kursus ini. Video adalah syarahan yang dirakam (dengan slaid ceramah gambar-dalam-gambar) yang dimuat naik ke YouTube. Tugasan kerja rumah adalah fail .pdf. Pengalaman kursus untuk pelajar dalam talian tidak digilap seperti tiga cadangan teratas. Ia mempunyai penilaian rata-rata berwajaran bintang 4,43 lebih daripada 7 ulasan.

Mining Massive Datasets (Stanford University): Pembelajaran mesin dengan fokus pada "data besar." Memperkenalkan sistem fail diedarkan moden dan MapReduce. Sepuluh jam seminggu selama tujuh minggu. Percuma. Ia mempunyai penilaian purata berwajaran 4.4 bintang lebih daripada 30 ulasan.

Pembelajaran Mesin AWS: Panduan Lengkap Dengan Python (Chandra Lingam / Udemy): Fokus unik pada pembelajaran mesin berasaskan awan dan khususnya Perkhidmatan Web Amazon. Menggunakan Python. Sembilan jam video atas permintaan. Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku. Ia mempunyai penilaian purata berwajaran 4.4 bintang lebih daripada 62 ulasan.

Pengenalan Pembelajaran Mesin & Pengesanan Wajah di Python (Holczer Balazs / Udemy): Menggunakan Python. Lapan jam video atas permintaan. Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku. Ia mempunyai penilaian purata berwajaran 4.4 bintang lebih daripada 162 ulasan.

StatLearning: Pembelajaran Statistik (Stanford University): Berdasarkan buku teks yang sangat baik, "Pengenalan Pembelajaran Statistik, dengan Aplikasi dalam R" dan diajar oleh profesor yang menulisnya. Pengulas menyatakan bahawa MOOC tidak sehebat buku ini, memetik latihan "tipis" dan video biasa-biasa saja. Lima jam seminggu selama sembilan minggu. Percuma. Ia mempunyai penilaian purata berwajaran 4.35 bintang lebih dari 84 ulasan.

Pengkhususan Pembelajaran Mesin (University of Washington / Coursera): Kursus yang bagus, tetapi dua kelas terakhir (termasuk projek batu penjuru) dibatalkan. Pengulas menyatakan bahawa siri ini lebih mudah dicerna (baca: lebih mudah bagi mereka yang tidak mempunyai latar belakang teknikal yang kuat) daripada kursus pembelajaran mesin teratas yang lain (contohnya Stanford atau Caltech's). Ketahuilah bahawa siri ini tidak lengkap dengan sistem cadangan, pembelajaran mendalam, dan ringkasannya tidak ada. Terdapat pilihan percuma dan berbayar. Ia mempunyai penilaian rata-rata berwajaran bintang 4,31 lebih daripada 80 ulasan.

Dari 0 hingga 1: Pembelajaran Mesin, NLP & Python-Cut to the Chase (Loony Corn / Udemy): "Teknik pembelajaran mesin yang sederhana, pemalu tetapi yakin." Diajar oleh pasukan empat orang dengan pengalaman industri selama puluhan tahun. Menggunakan Python. Kos berbeza-beza bergantung pada potongan Udemy, yang sering berlaku. Ia mempunyai penilaian purata berwajaran 4.2 bintang lebih daripada 494 ulasan.

Prinsip Pembelajaran Mesin (Microsoft / edX): Menggunakan Pembelajaran Mesin R, Python, dan Microsoft Azure. Sebahagian daripada Sijil Program Profesional Microsoft dalam Sains Data. Tiga hingga empat jam seminggu selama enam minggu. Percuma dengan sijil yang disahkan tersedia untuk pembelian. Ia mempunyai penarafan purata 4.09 bintang berbanding 11 ulasan.

Data Besar: Inferens Statistik dan Pembelajaran Mesin (Universiti Teknologi Queensland / FutureLearn): Kursus pembelajaran mesin penerokaan ringkas yang bagus dengan tumpuan pada data besar. Meliputi beberapa alat seperti R, H2O Flow, dan WEKA. Tempoh hanya tiga minggu pada dua jam seminggu yang disyorkan, tetapi seorang pengulas menyatakan bahawa enam jam seminggu akan lebih sesuai. Terdapat pilihan percuma dan berbayar. Ia mempunyai penilaian purata rata-rata bertaraf 4 bintang berbanding 4 ulasan.

Sains dan Pengelompokan Data Genomik (Bioinformatika V) (University of California, San Diego / Coursera): Bagi mereka yang berminat dalam persimpangan sains komputer dan biologi dan bagaimana ia mewakili sempadan penting dalam sains moden. Berfokus pada pengumpulan dan pengurangan dimensi. Bahagian Pengkhususan Bioinformatik UCSD. Terdapat pilihan percuma dan berbayar. Ia mempunyai penilaian rata-rata berwajaran tinggi 4 bintang berbanding 3 ulasan.

Pengenalan Pembelajaran Mesin (Udacity): Mengutamakan keluasan topik dan alat praktikal (dalam Python) lebih mendalam dan teori. Tenaga pengajar, Sebastian Thrun dan Katie Malone, menjadikan kelas ini sangat menyeronokkan. Terdiri daripada video dan kuiz bersaiz kecil diikuti dengan projek mini untuk setiap pelajaran. Kini merupakan sebahagian daripada Nanodegree Penganalisis Data Udacity. Jangka masa jangka masa sepuluh minggu. Percuma. Ia mempunyai penarafan purata 3.95 bintang lebih daripada 19 ulasan.

Pembelajaran Mesin untuk Analisis Data (Wesleyan University / Coursera): Pembelajaran mesin intro ringkas dan beberapa algoritma terpilih. Meliputi pokok keputusan, hutan rawak, regresi lasso, dan pengelompokan k-berarti. Bahagian Pengkhususan Analisis dan Tafsiran Data Wesleyan. Jangka masa jangka masa empat minggu. Terdapat pilihan percuma dan berbayar. Ia mempunyai penilaian purata berwajaran 3.6 bintang lebih daripada 5 ulasan.

Pengaturcaraan dengan Python untuk Sains Data (Microsoft / edX): Dihasilkan oleh Microsoft dengan kerjasama Coding Dojo. Menggunakan Python. Lapan jam seminggu selama enam minggu. Terdapat pilihan percuma dan berbayar. Ia mempunyai penarafan purata 3.46 bintang lebih daripada 37 ulasan.

Pembelajaran Mesin untuk Dagangan (Georgia Tech / Udacity): Berfokus untuk menerapkan pendekatan pembelajaran mesin probabilistik terhadap keputusan perdagangan. Menggunakan Python. Sebahagian daripada Jurutera Pembelajaran Mesin Udacity Nanodegree dan Ijazah Sarjana Dalam Talian (OMS) Georgia Tech. Jangka masa jangka masa empat bulan. Percuma. Ia mempunyai penarafan purata 3.29 bintang dengan lebih daripada 14 ulasan.

Pembelajaran Mesin Praktikal (Johns Hopkins University / Coursera): Pengenalan ringkas dan praktikal kepada sebilangan algoritma pembelajaran mesin. Beberapa ulasan satu / dua bintang menyatakan pelbagai kebimbangan. Bahagian Pengkhususan Sains Data JHU. Empat hingga sembilan jam seminggu selama empat minggu. Terdapat pilihan percuma dan berbayar. Ia mempunyai penarafan purata 3.11 bintang lebih daripada 37 ulasan.

Pembelajaran Mesin untuk Sains Data dan Analisis (Columbia University / edX): Memperkenalkan pelbagai topik pembelajaran mesin. Beberapa ulasan negatif yang bersemangat dengan kebimbangan termasuk pilihan kandungan, kekurangan tugas pengaturcaraan, dan persembahan yang tidak membangkitkan semangat. Tujuh hingga sepuluh jam seminggu selama lima minggu. Percuma dengan sijil yang disahkan tersedia untuk pembelian. Ia mempunyai penilaian purata berwajaran 2.74 bintang lebih daripada 36 ulasan.

Pengkhususan Sistem Pengesyorkan (Universiti Minnesota / Coursera): Fokus kuat satu jenis pembelajaran mesin - sistem pengesyorkan. Pengkhususan empat kursus ditambah projek batu penjuru, yang merupakan kajian kes. Diajar menggunakan LensKit (alat sumber terbuka untuk sistem pengesyoran). Terdapat pilihan percuma dan berbayar. Ia mempunyai penilaian rata-rata berwajaran 2 bintang berbanding 2 ulasan.

Pembelajaran Mesin Dengan Data Besar (University of California, San Diego / Coursera): Ulasan mengerikan yang menyoroti arahan dan penilaian yang buruk. Ada yang menyatakan hanya memerlukan beberapa jam untuk menyelesaikan keseluruhan kursus. Sebahagian daripada Pengkhususan Data Besar UCSD. Terdapat pilihan percuma dan berbayar. Ia mempunyai penarafan purata 1,86 bintang daripada 14 ulasan.

Analisis Ramalan Praktikal: Model dan Kaedah (University of Washington / Coursera): Pengenalan ringkas mengenai konsep pembelajaran mesin teras. Seorang pengulas menyatakan bahawa terdapat kekurangan kuiz dan tugasnya tidak mencabar. Sebahagian daripada Pengkhususan Sains UW pada Pengkhususan Skala. Enam hingga lapan jam seminggu selama empat minggu. Terdapat pilihan percuma dan berbayar. Ia mempunyai penilaian purata berwajaran 1.75 bintang lebih dari 4 ulasan.

Kursus berikut mempunyai satu atau tidak ada ulasan pada Mei 2017.

Pembelajaran Mesin untuk Pemuzik dan Artis (Goldsmiths, University of London / Kadenze): Unik. Pelajar belajar algoritma, alat perisian, dan amalan terbaik pembelajaran mesin untuk memahami gerak isyarat manusia, audio muzik, dan data masa nyata yang lain. Tujuh sesi berlangsung. Pilihan audit (percuma) dan premium ($ 10 USD sebulan) tersedia. Ia mempunyai satu ulasan 5 bintang.

Pembelajaran Mesin Terapan di Python (University of Michigan / Coursera): Diajar menggunakan Python dan alat pembelajaran scikit. Bahagian Sains Data Gunaan dengan Pengkhususan Python. Dijadualkan bermula pada 29 Mei. Terdapat pilihan percuma dan berbayar.

Pembelajaran Mesin Gunaan (Microsoft / edX): Diajar menggunakan pelbagai alat, termasuk Pembelajaran Mesin Python, R, dan Microsoft Azure (nota: Microsoft menghasilkan kursus). Termasuk makmal langsung untuk mengukuhkan kandungan kuliah. Tiga hingga empat jam seminggu selama enam minggu. Percuma dengan sijil yang disahkan tersedia untuk pembelian.

Pembelajaran Mesin dengan Python (Big Data University): Diajar menggunakan Python. Disasarkan kepada pemula. Anggaran masa penyelesaian empat jam. Big Data University bergabung dengan IBM. Percuma.

Pembelajaran Mesin dengan Apache SystemML (Big Data University): Diajar menggunakan Apache SystemML, yang merupakan bahasa gaya deklaratif yang dirancang untuk pembelajaran mesin berskala besar. Anggaran masa penyelesaian lapan jam. Big Data University bergabung dengan IBM. Percuma.

Pembelajaran Mesin untuk Sains Data (University of California, San Diego / edX): Tidak dilancarkan sehingga Januari 2018. Contoh dan tugasan pengaturcaraan terdapat di Python, menggunakan buku nota Jupyter. Lapan jam seminggu selama sepuluh minggu. Percuma dengan sijil yang disahkan tersedia untuk pembelian.

Pengenalan Pemodelan Analitis (Georgia Tech / edX): Kursus ini mengiklankan R sebagai alat pengaturcaraan utamanya. Lima hingga sepuluh jam seminggu selama sepuluh minggu. Percuma dengan sijil yang disahkan tersedia untuk pembelian.

Analisis Prediktif: Mendapatkan Wawasan dari Big Data (Queensland University of Technology / FutureLearn): Gambaran ringkas beberapa algoritma. Menggunakan platform Analisis Vertica Hewlett Packard Enterprise sebagai alat yang digunakan. Tarikh mula diumumkan. Dua jam seminggu selama empat minggu. Percuma dengan Sijil Pencapaian tersedia untuk pembelian.

Memperkenalkan Pembelajaran Mesin (Universiti Telefónica / Miríada X): Diajar dalam bahasa Sepanyol. Pengenalan pembelajaran mesin yang merangkumi pembelajaran diawasi dan tidak diawasi. Sebanyak dua puluh jam dianggarkan selama empat minggu.

Langkah Pembelajaran Mesin (Dataquest): Diajar di Python menggunakan platform penyemak imbas interaktif Dataquest. Pelbagai projek terpandu dan projek "tambah" di mana anda membina sistem pembelajaran mesin anda sendiri menggunakan data anda sendiri. Langganan diperlukan.

Enam kursus berikut ditawarkan oleh DataCamp. Gaya pengajaran hibrid DataCamp memanfaatkan arahan berasaskan video dan teks dengan banyak contoh melalui penyunting kod dalam penyemak imbas. Langganan diperlukan untuk akses penuh ke setiap kursus.

Pengenalan Pembelajaran Mesin (DataCamp): Meliputi algoritma klasifikasi, regresi, dan pengelompokan. Menggunakan R. Lima belas video dan 81 latihan dengan jangka masa enam jam.

Pembelajaran yang diawasi dengan scikit-belajar (DataCamp): Menggunakan Python dan scikit-belajar. Meliputi algoritma klasifikasi dan regresi. Tujuh belas video dan 54 latihan dengan jangka masa empat jam.

Pembelajaran Tanpa Pengawasan dalam R (DataCamp): Memberi pengenalan asas kepada pengumpulan dan pengurangan dimensi dalam R. Enam belas video dan 49 latihan dengan jangka masa empat jam.

Kotak Alat Pembelajaran Mesin (DataCamp): Mengajar "idea besar" dalam pembelajaran mesin. Menggunakan R. 24 video dan 88 latihan dengan jangka masa empat jam.

Pembelajaran Mesin dengan Pakar: Belanjawan Sekolah (DataCamp): Kajian kes dari pertandingan pembelajaran mesin di DrivenData. Melibatkan membina model untuk secara automatik mengklasifikasikan item dalam anggaran sekolah. DataCamp "Supervision Learning with scikit-learn" adalah prasyarat. Lima belas video dan 51 latihan dengan jangka masa empat jam.

Pembelajaran Tanpa Pengawasan di Python (DataCamp): Meliputi pelbagai algoritma pembelajaran tanpa pengawasan menggunakan Python, scikit-learning, dan scipy. Kursus diakhiri dengan pelajar membina sistem pengesyorkan untuk mengesyorkan artis muzik popular. Tiga belas video dan 52 latihan dengan jangka masa empat jam.

Pembelajaran Mesin (Tom Mitchell / Carnegie Mellon University): Kursus pembelajaran mesin pengantar siswazah Carnegie Mellon. Prasyarat untuk kursus peringkat siswazah kedua mereka, "Pembelajaran Mesin Statistik." Kuliah universiti yang dirakam dengan masalah latihan, tugasan kerja rumah, dan pertengahan semester (semua dengan penyelesaian) disiarkan dalam talian. Versi kursus 2011 juga ada. CMU adalah salah satu sekolah siswazah terbaik untuk belajar pembelajaran mesin dan mempunyai keseluruhan jabatan yang dikhaskan untuk ML. Percuma.

Pembelajaran Mesin Statistik (Larry Wasserman / Carnegie Mellon University): Mungkin kursus yang paling maju dalam panduan ini. Lanjutan dari kursus Pembelajaran Mesin Carnegie Mellon. Kuliah universiti yang dirakam dengan masalah latihan, tugasan kerja rumah, dan pertengahan semester (semua dengan penyelesaian) disiarkan dalam talian. Percuma.

Pembelajaran Mesin Prasiswazah (Nando de Freitas / University of British Columbia): Kursus pembelajaran mesin sarjana. Kuliah difilemkan dan diletakkan di YouTube dengan slaid yang disiarkan di laman web kursus. Tugasan kursus disiarkan juga (walaupun tidak ada penyelesaian) de Freitas kini menjadi profesor sepenuh masa di University of Oxford dan mendapat pujian atas kemampuan mengajarnya di pelbagai forum. Versi siswazah tersedia (lihat di bawah).

Pembelajaran Mesin (Nando de Freitas / University of British Columbia): Kursus pembelajaran mesin siswazah. Komen dalam kursus sarjana de Freitas (di atas) juga berlaku di sini.

Mengemasnya

Ini adalah yang kelima dari siri enam keping yang merangkumi kursus dalam talian terbaik untuk melancarkan diri anda dalam bidang sains data. Kami membahas pengaturcaraan pada artikel pertama, statistik dan kebarangkalian dalam artikel kedua, pengantar ke sains data pada artikel ketiga, dan visualisasi data pada artikel keempat.

Saya memberi peringkat setiap kursus Pengenalan kepada Sains Data di internet, berdasarkan ribuan titik data

Setahun yang lalu, saya berhenti dari salah satu program sains komputer terbaik di Kanada. Saya mula membuat data saya sendiri ...

Bahagian terakhir akan menjadi ringkasan artikel-artikel itu, serta kursus dalam talian terbaik untuk topik utama lain seperti pergolakan data, pangkalan data, dan juga kejuruteraan perisian.

Sekiranya anda mencari senarai lengkap kursus dalam talian Sains Data, anda boleh menemuinya di halaman subjek Sains Data dan Data Big Class Central.

Sekiranya anda gemar membaca ini, periksa beberapa karya lain dari Class Central:

Berikut adalah 250 kursus Ivy League yang boleh anda ikuti dalam talian sekarang secara percuma

250 MOOC dari Brown, Columbia, Cornell, Dartmouth, Harvard, Penn, Princeton, dan Yale.

50 kursus universiti dalam talian percuma terbaik mengikut data

Semasa saya melancarkan Class Central pada bulan November 2011, terdapat sekitar 18 kursus dalam talian percuma, dan hampir semua…

Sekiranya anda mempunyai cadangan untuk kursus yang saya ketinggalan, beritahu saya dalam jawapan!

Sekiranya anda menganggap ini berguna, klik? jadi lebih ramai orang akan melihatnya di sini di Medium.

Ini adalah versi ringkas dari artikel asal saya yang diterbitkan di Class Central, di mana saya telah memasukkan sukatan pelajaran terperinci.