5 Sumber Teratas untuk Sains Data dan Pembelajaran Mesin

Data adalah minyak baru. Dan Pembelajaran Mesin adalah api. Sesiapa yang mengawal kedua-duanya akan menguasai dunia.


Tidak, perkara di atas bukanlah frasa sombong yang diambil dari novel dystopian.

Inilah kenyataannya.

Tatanan dunia baru adalah tentang mengumpulkan sejumlah besar data yang relevan dan memprosesnya menjadi wawasan yang dapat ditindaklanjuti – sesuatu yang tidak dapat dilakukan oleh umat manusia dalam sejarah. Teknologi seperti inilah yang membolehkan negara maju ke hadapan yang lain, dan akhirnya, memerintah dunia. Akibatnya, ia dianggap sangat serius oleh negara-negara progresif dunia.

Pilihan kerjaya yang lumayan

Selain intrik, sains data dan pembelajaran mesin adalah bidang baru yang panas dengan peluang yang luar biasa. Permintaan berada di luar carta (secara sederhana), dan tidak ada cukup banyak saintis data. Tidak juga yang biasa-biasa sahaja.

Sepertinya kita tiba-tiba menemui banyak planet baru yang tidak dapat dihuni dan tidak ada cukup orang untuk memindahkannya. Saya boleh terus menerus dan terdengar seperti rakaman yang rosak, tetapi saya fikir infografik ini berfungsi dengan lebih baik:

Sumber: insidebigdata.com

Oleh itu, kita melihat bahawa gaji bermula dari $ 50,000 +, dan untuk pengurus, boleh meningkat melebihi $ 250,000.

Dan bukan hanya itu, menjelang tahun 2020 rata-rata orang di planet ini akan menghasilkan 1.7 MB data sesaat. Itu 3.500+ TB data sepanjang hayat – lebih banyak data daripada yang kita tahu bagaimana untuk menangani sekarang, apalagi digunakan untuk analisis. Untuk mengatakan bahawa masa depan adalah cerah akan merugikan padang rumput baru yang megah ini.

Adakah sains data dan pembelajaran mesin sukar dilakukan?

Soalan yang baik!

Dari pengalaman saya, jawapannya adalah “ya” dan “tidak.”

Kecerdasan buatan (dan secara meluas, pembelajaran mesin), adalah perkara paling sukar untuk dilakukan jika anda cenderung untuk menyelidik dan mendorong sampul surat. Untuk kerja sedemikian, bahkan Ph.D. masing-masing dalam sains komputer dan matematik tidak mencukupi. Tetapi kemudian, rata-rata orang tidak mempunyai cita-cita dan bukan masa untuk mengejarnya.

Di sisi lain adalah apa yang saya sebut Sains Data Gunaan dan Pembelajaran Mesin.

Maksudnya, anda menggunakan alat, teknik, dan algoritma yang ada, dan menggunakannya untuk menyelesaikan beberapa masalah di dunia nyata. Bahagian ini memerlukan dedikasi, persepsi dan pemikiran kreatif (dan pengetahuan tentang beberapa konsep matematik mudah, yang cepat dipelajari), tetapi mengenai pengetahuan “teknikal” yang sebenarnya, jauh lebih ringan daripada apa yang disebut oleh seorang jurutera perisian.

Dengan kata lain, ini bukan cakewalk, tetapi berjalan melalui nisbah ganjaran kepada usaha, adalah salah satu pelaburan terbaik di luar sana.

Sekarang setelah anda menguatkan tekad untuk menjadi saintis data dan jurutera pembelajaran mesin, mari kita mula meneroka pilihan terbaik di luar sana.

Kursus Kerosakan Pembelajaran Mesin (Google)

Tidak banyak orang yang sedar, tetapi Google mempunyai banyak, sangat praktikal dan kursus percuma mengenai Pembelajaran Mesin. Menurut syarikat itu, ini adalah sebahagian daripada komitmen mereka untuk memajukan teknologi AI / ML dan menjaga pengetahuan secara terbuka.

Perkara terbaik mengenai kursus ini adalah bahawa tidak ada prasyarat, tetapi bersiaplah untuk meluangkan masa untuk meneroka konsep statistik sendiri.

Maksud saya, itu tidak diperlukan, tetapi jika anda tidak mempunyai latar belakang statistik lanjutan, penjelasan dalam kursus ini mungkin tidak mencukupi. Tangkapan lain adalah bahawa kursus ini memperkenalkan Pembelajaran Mesin melalui TensorFlow, yang merupakan pelaksanaan ML yang dikembangkan oleh Google. Oleh itu, Google bertujuan untuk mempromosikan API-nya untuk Pembelajaran Mesin, tetapi memandangkan nilai yang ditawarkan oleh kursus ini, saya tidak melihat bagaimana itu harus menjadi batu sandungan.

Sekiranya ada, TensorFlow adalah salah satu cara mudah untuk masuk ke ML dan menikmati populariti yang garang (untuk perbandingan kerangka AI, lihat ini).

Sains Data CS109 (Universiti Harvard)

Nama Harvard menimbulkan rasa kagum, dan begitu juga kursus ini.

Perkara pertama yang pertama: bukan kursus let-get-kotor-cepat di mana anda memanfaatkan Mesin Pembelajaran dengan menulis coretan di sini atau skrip di sini. Kursus ini adalah pembaptisan api yang berat yang menuntut kerja keras dan pelaburan masa yang besar.

Kursus dilengkapi dengan video percuma, kod (dihoskan di GitHub), dan penyelesaian untuk latihan makmal, jadi secara praktikalnya, anda tidak akan dihalang oleh apa-apa jika anda ingin mengambilnya.

Penonton yang sesuai?

Anda … saya tidak bergurau.

Saya katakan profesional yang bekerja dengan pendidikan matematik yang baik, walaupun mereka mungkin tidak lagi berminat dalam matematik (kebiasaan inferens dan bukti adalah perkara yang paling diperlukan). Tetapi sekali lagi, harap diberi amaran: anda mungkin menganggap anda baik, tetapi kursus ini akan terasa seperti mengeras kuku untuk sarapan – masalah latihan cukup mencabar untuk membuat anda menangis, tetapi kemudian, itu mungkin perkara yang anda ‘ mencari semula!

Pembelajaran Mesin (Andrew Ng)

Berjalan ke bar yang dipenuhi oleh saintis data dan tanyakan siapa Andrew Ng, dan anda akan mendapat rentak hidup anda.

Dalam kalangan sains data dan pembelajaran mesin, Andrew Ng telah mencapai status seperti Tuhan, berkat kursus yang luar biasa di Coursera – Pembelajaran Mesin.

Dan jika anda meragui kelayakan Andrew Ng, saya akan membiarkan ini bercakap sendiri:

Ini adalah kursus berbayar, kerana ini adalah sebahagian daripada rancangan harga Coursera, tetapi komitmen dan tekad kewangan bukan satu-satunya prasyarat. Ini adalah jalan yang panjang kerana Andrew menyelami matematik di sebalik semua perkara ML dan membedah algoritma yang popular. Tetapi syukurlah, ini adalah kursus yang lengkap, dan anda akan dibimbing langkah demi langkah ke kedalaman paling gelap dan dibawa kembali.

Sangat digalakkan, terutama kerana memamerkan sijil penyempurnaan kursus ini telah menjadi perkara penting sekarang!

Sains Data Gunaan dengan Python

Pengkhususan pada Coursera terdiri daripada rangkaian kursus yang bertujuan untuk membawa anda dari sifar hingga mahir dalam konsep tertentu. Sekiranya anda mencari kursus Sains dan Pembelajaran Mesin yang lengkap, serius namun mesra dengan Python, saya tidak dapat mengesyorkan ini pengkhususan cukup.

Pada akhir kursus, anda memperoleh sijil.

Pembelajaran Dalam Praktikal Untuk Pengekod

Kursus ini adalah rahmat dan cadangan saya yang paling digemari dalam senarai ini jika anda seorang pengekod.

Saya akan mengatakannya sekali lagi: jika anda seorang pengekod.

Ini kerana kursus ini tidak menghabiskan masa untuk mengajar anda asas-asas pengaturcaraan. Huraian kursus mengatakannya dengan sangat jelas (penekanan adalah asli):

Kami menganggap bahawa semua orang yang mengikuti kursus ini mempunyai sekurang-kurangnya satu tahun pengalaman pengkodan. Kursus ini menggunakan python sebagai bahasa pengajaran, jadi jika anda belum mengetahui python maka kami menganggap bahawa anda akan meluangkan masa untuk belajar — untuk pengekod yang berpengalaman, anda harus mendapati bahawa python adalah bahasa yang mudah dipelajari.

Jadi jika anda sudah mengenali Python (jika tidak belajar di sini, atau dapat merasa selesa dengan cepat, ini adalah kursus yang tepat untuk para pragmatik yang ingin membina sistem yang nyata dan boleh digunakan tanpa terlalu bimbang tentang asas teori algoritma.

Saya mungkin mengatakan bahawa ini adalah untuk orang-orang yang tidak sabar (seperti saya!) Yang membenci upacara dan monoton.

Dan oh, adakah saya menyebutnya 100% percuma dan mempunyai komuniti yang hebat?!

Kesimpulannya

Phew!

Ini adalah satu senarai sukar untuk disusun. Bukan kerana tidak ada sumber yang cukup baik, tetapi kerana terlalu banyak sumber!

Pembelajaran Mesin adalah domain yang secara harfiah meletup dan menyelesaikan masalah sukar dengan sangat elegan, dan memang demikian beratus-ratus kursus dalam talian, percuma dan berbayar, kebanyakan mereka benar-benar hebat. Tetapi ini juga boleh menjadi sumber kekeliruan, itulah sebabnya saya telah mencubanya menjadi lima untuk pelbagai jenis pelajar mengikut tahap pengalaman mereka.

Semoga ia membantu!

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map