Ilmu Data - ilmu data yang muncul di persimpangan beberapa area luas: pemrograman, matematika dan pembelajaran mesin. Hal ini disebabkan oleh ambang tinggi untuk memasuki profesi dan kebutuhan untuk terus menerima pengetahuan baru.
Keterampilan kunci untuk pemula adalah:
- kemampuan menulis kode (Python);
- kemampuan memvisualisasikan hasil Anda;
- memahami apa yang terjadi "di bawah tenda".
Buku-buku yang telah dipilih oleh spesialis Plarium Krasnodar untuk pembaca dengan pengetahuan dasar dalam Ilmu Data dibagi menjadi tiga kategori ini.

Python
Beberapa orang mencari sendiri dalam R, tetapi jalan kebenaran terletak melalui Python. Buku-buku berikut adalah pilihan yang bagus untuk belajar.
Trik Python: Buku
Dan lebih burukBuku ini tentang berbagai trik dan kegunaan yang membantu untuk menjadi lebih produktif dan memprogram lebih baik.
Kita berbicara tentang tipe data dasar dari bahasa Python dan pendekatan untuk menulis kode - dari OOP hingga bekerja dengan dependensi. Ini layak dibaca untuk pemula dan siapa pun yang ingin menyegarkan ingatan mereka dengan desain pythonic yang khas.
Python Kinerja Tinggi: Pemrograman Pelaku Praktis untuk Manusia
Micha Gorelick, Ian OzsvaldBuku ini menjelaskan bahasa secara internal. Ini memberikan penjelasan tentang pekerjaan juru bahasa dan mekanisme kode, tipe data utama dan bagaimana mereka berinteraksi dengan memori. Panduan ini juga akan membantu Anda memahami cara memanfaatkan fitur tersembunyi Python.
Visualisasi
Setiap Data Scientist suatu kali menghadapi kebutuhan untuk mempresentasikan hasil karyanya. Dan seperti yang Anda tahu, tidak ada cara yang lebih baik daripada visualisasi berkualitas tinggi. Di sinilah diagram lingkaran mewah muncul ...
Bercerita dengan Data: Panduan Visualisasi Data untuk Profesional Bisnis
Cole nussbaumer knaflicBuku yang bagus tentang cara memvisualisasikan hasil Anda dengan cara yang berkualitas. Di dalamnya, mantan googler menjelaskan secara terperinci semua tahapan pembuatan grafik yang benar dan memberikan contoh tandingan.
Anda juga dapat mengunjungi situs penulis, yang mengumpulkan sejumlah besar opsi untuk menyajikan data dari spesialis terbaik. Tentu saja, petunjuk langkah demi langkah untuk menciptakan karya yang sempurna tidak dapat ditemukan di sini - dan di mana Anda akan menemukannya!
The Big Book of Dashboards. Memvisualisasikan Data Anda Menggunakan Skenario Bisnis Dunia Nyata
Steve Wexler, Jeffrey Shaffer, Andy CotgreaveVisualisasi data adalah pekerjaan yang melelahkan, tetapi ketika Anda tahu seperti apa bentuk ideal itu, Anda memahami apa yang perlu Anda perjuangkan.
Ini adalah pilihan dasbor yang sangat baik untuk semua kesempatan, di mana solusi direkomendasikan untuk hampir semua tugas bisnis. Sayangnya, tidak ada yang dikatakan tentang implementasi di Tableau - hanya komponen visual dan penjelasan tentang cara terbaik dan mengapa lebih baik.
Algoritma ML
Ini adalah area di mana relatif mudah untuk memahami apa yang dilakukan algoritma, tetapi sangat sulit untuk mencapai penguasaan.
Pembelajaran Mesin Langsung dengan Scikit-Learn dan Tensor Flow: Konsep, Alat, dan Teknik untuk Membangun Sistem yang Cerdas
Aurélien géronBuku ini dapat dengan aman direkomendasikan kepada siapa saja yang ingin memahami bagaimana model dibangun - dari linier hingga pohon. Pada bagian pertama, prinsip-prinsip pengoperasian algoritma dijelaskan dalam bahasa yang dapat diakses. Ini akan sangat berguna bagi mereka yang baru memasuki profesi. Bagian kedua didedikasikan untuk TensorFlow.
Pembelajaran yang mendalam. Perendaman dalam dunia jaringan saraf
S. Nikolenko, A. Kadurin, E. ArkhangelskayaHampir semua literatur IT di dunia modern diterbitkan dalam bahasa Inggris, dan bidang Ilmu Data tidak terkecuali. Bahkan ada ungkapan: “Saya ingin menjadi seorang programmer, bahasa apa yang harus dipelajari? Belajar Bahasa Inggris terlebih dahulu. "
Ini adalah satu-satunya buku berharga tentang Deep Learning dan Neural Networks yang ditulis oleh penulis Rusia dalam bahasa Rusia. Selain itu, sangat ekspresif, dengan banyak contoh, berbagai cerita dari sains dan referensi ke sumber (satu daftar literatur dalam karya ini lebih berguna daripada banyak publikasi).
Elemen Pembelajaran Statistik: Penambangan Data, Inferensi, dan Prediksi, Edisi Kedua
Trevor Hastie, Robert Tibshirani, Jerome FriedmanHanya harus dibaca di setiap koleksi Ilmu Data. Pekerjaan mendasar pada algoritma pembelajaran mesin yang dapat digunakan sebagai buku pegangan. Membutuhkan persiapan, cocok untuk tingkat mahir.
Opsional
Statistik Dasar Secara Singkat
Katharine Alexis KormanikDalam seri singkat, mutiara sering ditemukan, dan ini adalah salah satunya. Di awal buku ada definisi dasar dengan gambar dan komentar, dan sisanya dikhususkan untuk pentingnya tes (tes T dan Z).
Bahasa yang dapat diakses dan minimal matematika (jumlah yang diperlukan untuk memahami) menjadikan manual ini sebagai pengantar yang bagus untuk statistik dari sudut pandang praktis.
Pekerjaan Dalam: Aturan untuk Fokus pada Kesuksesan di Dunia yang Terganggu
Cal newport
Penulis berbicara tentang pengalamannya dan pengalaman rekan kerja ketika mengerjakan tugas dengan konsentrasi maksimum. Buku tersebut dibaca dengan cukup mudah dan terdiri dari deskripsi pendekatan itu sendiri, berbagai contoh dan aturan.
Gagasan utama adalah bahwa keadaan otak seperti itu memungkinkan kita untuk mencapai kinerja tertinggi dan membawa hasil ke tingkat yang sama sekali baru. Batas otak, sayangnya, terbatas, tetapi kami berlatih. Kami menyarankan semua orang untuk membacanya.