Danh sách 10 cuốn sách và mô tả về khoa học dữ liệu hay nhất dành cho người tổng quát

Danh Sach 10 Cuon Sach Va Mo Ta Ve Khoa Hoc Du Lieu Hay Nhat Danh Cho Nguoi Tong Quat



Khoa học dữ liệu là lĩnh vực nghiên cứu xử lý lượng dữ liệu khổng lồ bằng cách sử dụng các phương pháp, quy trình, thuật toán và hệ thống khoa học để tìm ra các mẫu không nhìn thấy, lấy thông tin có ý nghĩa, đưa ra quyết định kinh doanh trong công ty và cũng sử dụng trong các tổ chức phi kinh doanh. Các tổ chức phi kinh doanh bao gồm các ngành về Chăm sóc sức khỏe, Trò chơi, Nhận dạng hình ảnh, Hệ thống đề xuất, Hậu cần, Phát hiện gian lận (ngân hàng và tổ chức tài chính), Tìm kiếm trên Internet, Nhận dạng giọng nói, Quảng cáo được nhắm mục tiêu, Lập kế hoạch lộ trình hàng không và Thực tế tăng cường. Khoa học dữ liệu là một tập hợp con của Trí tuệ nhân tạo. Dữ liệu được sử dụng để phân tích có thể đến từ nhiều nguồn khác nhau và được trình bày ở nhiều định dạng khác nhau. Một số dữ liệu nguồn có thể được chuẩn hóa; những người khác có thể không được tiêu chuẩn hóa.

Nói cách khác, các phương pháp khác nhau được sử dụng để thu thập dữ liệu (số nhiều của dữ kiện). Sau đó, kiến ​​​​thức (kết luận có giá trị) được trích xuất từ ​​​​dữ liệu được lắp ráp. Trong quá trình này, sau khi dữ liệu được thu thập, nghiên cứu được thực hiện trên chúng (dữ liệu) để thu được dữ liệu mới (kết quả) từ đó các vấn đề được giải quyết.







Khoa học dữ liệu như một môn học (chính) tồn tại ở cấp độ Cử nhân và Thạc sĩ tại trường đại học. Tuy nhiên, chỉ có một số trường đại học trên thế giới cung cấp Khoa học dữ liệu ở cấp độ Cử nhân hoặc Thạc sĩ. Ở cấp độ Cử nhân, sinh viên tốt nghiệp với bằng Khoa học dữ liệu. Đây giống như một mức độ mục đích chung. Ở cấp độ Thạc sĩ, sinh viên tốt nghiệp với Bằng sau đại học về Khoa học dữ liệu, chuyên về Phân tích dữ liệu, Kỹ thuật dữ liệu hoặc Nhà khoa học dữ liệu.



Người đọc có thể ngạc nhiên và có thể không may rằng Học máy, Mô hình hóa, Thống kê, Lập trình và Cơ sở dữ liệu là kiến ​​thức tiên quyết để nghiên cứu Khoa học dữ liệu ở cấp độ Cử nhân mặc dù thực tế là chúng là các khóa học đại học được tôn trọng theo quyền riêng của chúng, được nghiên cứu tại các ngành khác ở cấp độ Cử nhân hoặc Thạc sĩ. Mặc dù vậy, khi một sinh viên đến một trường đại học để học Khoa học dữ liệu ở cấp độ, tất cả các khóa học này sẽ vẫn được học, song song hoặc trước các khóa học thích hợp, về Khoa học dữ liệu.



Khoa học dữ liệu cho Bằng cử nhân hoặc các chuyên ngành của nó như Phân tích dữ liệu, Kỹ thuật dữ liệu hoặc với tư cách là Nhà khoa học dữ liệu vẫn đang được phát triển; mặc dù chúng đã đạt đến mức được áp dụng trong các ngành công nghiệp sau khi đã được nghiên cứu (ở trường đại học). Nhìn chung, Khoa học dữ liệu là một ngành học tương đối rất mới.





Hãy nhớ rằng trước tiên bạn phải là một nhà tổng quát trước khi trở thành một chuyên gia. Sự khác biệt giữa các chương trình chuyên gia vẫn chưa rõ ràng. Sự khác biệt giữa các chương trình tổng quát và chuyên gia vẫn chưa rõ ràng.

Vì Khoa học dữ liệu là một chuyên ngành tương đối mới, nên các cuốn sách được quy định trong tài liệu này dựa trên phạm vi nội dung chứ không phải phương pháp sư phạm (cuốn sách dạy tốt như thế nào). Và chúng dành cho chương trình Cử nhân (tổng quát). Có các khóa học tổng quát khác nhau.



Danh sách

Để biết thêm chi tiết và có thể mua bằng thẻ tín dụng, một siêu liên kết cho mỗi cuốn sách sẽ được cung cấp. Không một trong những cuốn sách bao gồm tất cả các khóa học tổng quát.

Toán cơ bản cho khoa học dữ liệu: Giải tích, Thống kê, Lý thuyết xác suất và Đại số tuyến tính

Được viết bởi: Hadrien Jean

  • Nhà xuất bản: Hadrien Jean
  • Ngày xuất bản: Sau ngày 30 tháng 9 năm 2020
  • Ngôn ngữ: ‎Tiếng Anh
  • Số trang: ‎hơn 400

Nội dung của cuốn sách này có thể được coi là khóa học toán học cho Khoa học dữ liệu. Mặc dù không nên tự học Khoa học dữ liệu, nhưng một học sinh tốt nghiệp trung học muốn tự học Khoa học dữ liệu nên bắt đầu với cuốn sách này.

Nội dung: Giải tích; Thống kê và Xác suất; Đại số tuyến tính; Vô hướng và vectơ; Ma trận và Tenxơ; Khoảng cách, Phụ thuộc tuyến tính và Chuyển đổi không gian; Hệ phương trình tuyến tính; Các vectơ riêng và các giá trị riêng; Phân rã giá trị số ít.

https://www.essentialmathfordatascience.com/

Hướng dẫn thông thường về cấu trúc dữ liệu và thuật toán: Nâng cao kỹ năng lập trình cốt lõi của bạn / Phiên bản thứ 2

Được viết bởi: Jay Wengrow

  • Nhà xuất bản: Kệ Sách Thực Dụng
  • Ngày xuất bản: 15 tháng 9 năm 2020
  • Ngôn ngữ: ‎Tiếng Anh
  • Kích thước: 7,5 x 1,25 x 9,25 inch
  • Số trang: ‎508

Cuốn sách này đề cập đến các thuật toán và cấu trúc dữ liệu được sử dụng trong Khoa học dữ liệu. Giả sử rằng ai đó đang tự học Khoa học dữ liệu sau khi tốt nghiệp trung học, thì đây là cuốn sách tiếp theo nên đọc sau khi đọc cuốn sách toán trước đó. Các chương trình ví dụ được cung cấp bằng JavaScript, Python và Ruby.

Nội dung: Tại sao cấu trúc dữ liệu lại quan trọng; Tại sao các thuật toán lại quan trọng; Ồ vâng! Ký hiệu O lớn; Tăng tốc mã của bạn với Big O; Tối ưu hóa mã có và không có Big O; Tối ưu hóa cho các kịch bản lạc quan; Big O trong Mã hàng ngày; Tra cứu cực nhanh với Bảng băm; Chế tạo mã thanh lịch với ngăn xếp và hàng đợi; Đệ quy Đệ quy với Đệ quy; Học cách viết đệ quy; Lập trình năng động; Thuật toán đệ quy cho tốc độ; Cấu trúc dữ liệu dựa trên nút; Tăng tốc mọi thứ bằng cây tìm kiếm nhị phân; Giữ các ưu tiên của bạn thẳng thắn với hàng đống; Trie không đau; Kết nối mọi thứ bằng đồ thị; Xử lý các hạn chế về không gian; Kỹ thuật tối ưu hóa mã

Khoa học dữ liệu thông minh hơn: Thành công với các dự án AI và dữ liệu cấp doanh nghiệp / 1 st chỉnh sửa

Viết bởi: Neal Fishman, Cole Stryker, và Grady Booch

  • Nhà phát hành: Wiley
  • Ngày xuất bản: 14 tháng 4 năm 2020
  • Ngôn ngữ: ‎Tiếng Anh
  • Số trang: ‎286

Nội dung: Leo Thang AI; Định hình Phần I: Cân nhắc đối với các tổ chức sử dụng AI; Định hình Phần II: Cân nhắc khi làm việc với Dữ liệu và Trí tuệ nhân tạo; Nhìn lại Analytics: Nhiều hơn một cái búa; Nhìn về phía trước trên phân tích: Không phải mọi thứ đều có thể thành công; Giải quyết các Nguyên tắc Hoạt động trên Bậc thang AI; Tối đa hóa việc sử dụng dữ liệu của bạn: Định hướng giá trị; Định giá dữ liệu bằng phân tích thống kê và cho phép truy cập có ý nghĩa; Xây Dựng Lâu Dài; Kết thúc hành trình: IA cho AI.

Machine Learning: A Probabilistic Perspective (Sê-ri Tính toán thích ứng và Machine Learning) Phiên bản minh họa

Được viết bởi: Kevin P. Murphy

  • Nhà xuất bản: The MIT Press
  • Ngày xuất bản: 24 tháng 8 năm 2012
  • Ngôn ngữ: ‎Tiếng Anh
  • Kích thước: 8,25 x 1,79 x 9,27 inch
  • Số trang: ‎1104

Cuốn sách này là tốt cho người mới bắt đầu. Một lần nữa, giống như tất cả các cuốn sách còn lại được quy định trong tài liệu này, cuốn sách này không bao gồm mọi thứ cần thiết cho chương trình đại cương, điều đáng tiếc là nó vẫn chưa được hoàn thiện (các chương trình chuyên biệt cũng vẫn chưa được hoàn thiện). Người mới bắt đầu điển hình ở đây là một học sinh tốt nghiệp trung học với điểm thi môn toán và khoa học máy tính.

Nội dung: Giới thiệu (Học máy: cái gì và tại sao?, Học không giám sát, Một số khái niệm cơ bản trong học máy); Xác suất; Các mô hình tổng quát cho dữ liệu rời rạc; mô hình Gaussian; thống kê Bayesian; thống kê thường xuyên; Hồi quy tuyến tính; Hồi quy logistic; Các mô hình tuyến tính tổng quát và họ hàm mũ; Các mô hình đồ họa có hướng (Bayes nets); Mô hình hỗn hợp và thuật toán EM; Các mô hình tuyến tính tiềm ẩn; Mô hình tuyến tính thưa thớt; Nhân; quy trình Gaussian; Các mô hình hàm cơ sở thích ứng; Markov và mô hình Markov ẩn; Các mô hình không gian trạng thái; Các mô hình đồ họa vô hướng (trường ngẫu nhiên Markov); suy luận chính xác cho các mô hình đồ họa; Suy luận biến thể; Suy luận đa dạng hơn; suy luận Monte Carlo; chuỗi Markov Monte Carlo (MCMC) suy luận; Phân cụm; học cấu trúc mô hình đồ họa; Các mô hình biến tiềm ẩn cho dữ liệu rời rạc; Học kĩ càng.

Khoa học dữ liệu cho doanh nghiệp: Những điều bạn cần biết về khai thác dữ liệu và tư duy phân tích dữ liệu / Ấn bản đầu tiên

Được viết bởi: Tom Fawcett và Foster Provost

  • Nhà xuất bản: O'Reilly Media
  • Ngày xuất bản: 17 tháng 9 năm 2013
  • Ngôn ngữ: ‎Tiếng Anh
  • Kích thước: 7 x 0,9 x 9,19 inch
  • Số trang: ‎413

Nội dung: Tư duy phân tích dữ liệu; Các vấn đề kinh doanh và giải pháp khoa học dữ liệu; Giới thiệu về Mô hình Dự đoán: Từ Tương quan đến Phân đoạn được Giám sát; Gắn Mô hình vào Dữ liệu; Trang bị quá mức và cách tránh nó; Tương tự, Hàng xóm và Cụm; Tư duy phân tích quyết định I: Mô hình tốt là gì?; Trực quan hóa hiệu suất mô hình; Bằng chứng và Xác suất; Biểu diễn và khai thác văn bản; Tư duy Phân tích Quyết định II: Hướng tới Kỹ thuật Phân tích; Các nhiệm vụ và kỹ thuật khoa học dữ liệu khác; Khoa học dữ liệu và Chiến lược kinh doanh; Sự kết luận.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Thống kê thực tế cho các nhà khoa học dữ liệu: Hơn 50 khái niệm cần thiết khi sử dụng R và Python / Phiên bản thứ 2

Được viết bởi: Peter Bruce, Andrew Bruce và Peter Gedeck

  • Nhà xuất bản: O'Reilly Media
  • Ngày xuất bản: 2 tháng 6 năm 2020
  • Ngôn ngữ: ‎Tiếng Anh
  • Kích thước: 7 x 0,9 x 9,1 inch
  • Số trang: ‎368

Nội dung: Phân tích dữ liệu khám phá, phân phối dữ liệu và lấy mẫu, thí nghiệm thống kê và kiểm tra ý nghĩa, hồi quy và dự đoán, phân loại, học máy thống kê, học không giám sát.

Cuốn sách Tại sao: Khoa học mới về nguyên nhân và kết quả

Được viết bởi: Judea Pearl, Dana Mackenzie

  • Nhà xuất bản: Sách cơ bản
  • Ngày xuất bản: 15 tháng 5 năm 2018
  • Ngôn ngữ: ‎Tiếng Anh
  • Kích thước: 6,3 x 1,4 x 9,4 inch
  • Số trang: ‎432

Trong khi nhiều cuốn sách Khoa học dữ liệu sử dụng ngành kinh doanh thuần túy để minh họa, thì cuốn sách này sử dụng ngành y tế và các ngành khác để minh họa.

Nội dung: Giới thiệu: Mind over Data; Nấc Thang Nhân Quả; Từ những tên cướp biển đến những con chuột lang: Nguồn gốc của suy luận nhân quả; Từ bằng chứng đến nguyên nhân: Mục sư Bayes gặp ông Holmes; Gây nhiễu và giải mã: Hoặc, Tiêu diệt biến ẩn nấp; Cuộc tranh luận đầy khói: Làm sạch không khí; Nhiều nghịch lý!; Vượt ra ngoài sự điều chỉnh: Cuộc chinh phục can thiệp núi; Phản thực tế: Khai thác thế giới có thể đã tồn tại; Hòa giải: Tìm kiếm một cơ chế; Dữ liệu lớn, trí tuệ nhân tạo và những câu hỏi lớn.

Xây dựng sự nghiệp trong Khoa học dữ liệu

Được viết bởi: Emily Robinson và Jacqueline Nolis

  • Nhà xuất bản: Manning
  • Ngày xuất bản: 24 tháng 3 năm 2020
  • Ngôn ngữ: ‎Tiếng Anh
  • Kích thước: 7,38 x 0,8 x 9,25 inch
  • Số trang: ‎354

Nội dung: Bắt đầu với Khoa học dữ liệu; Tìm công việc Khoa học dữ liệu của bạn; Giải quyết Khoa học dữ liệu; Phát triển trong vai trò Khoa học dữ liệu của bạn.

https://www.manning.com/books/build-a-career-in-data-science

Khoa học dữ liệu cho người mới bắt đầu / Phiên bản thứ 2

Được viết bởi: Lillian Pierson

  • Nhà xuất bản: Dành cho người giả
  • Ngày xuất bản: 6 tháng 3 năm 2017
  • Ngôn ngữ: Tiếng Anh
  • Kích thước: 7,3 x 1 x 9 inch
  • Số trang: ‎384

Cuốn sách này giả định rằng người đọc đã có kiến ​​thức cần thiết về toán học và lập trình.

Nội dung:  Tìm hiểu về Khoa học dữ liệu; Khám phá cơ sở hạ tầng và đường ống kỹ thuật dữ liệu; Áp dụng thông tin chi tiết dựa trên dữ liệu cho doanh nghiệp và ngành công nghiệp; Học máy: Học từ dữ liệu với máy của bạn; Mô hình Toán học, Xác suất và Thống kê; Sử dụng phân cụm để chia nhỏ dữ liệu; Lập mô hình với Instances; Xây dựng các mô hình vận hành các thiết bị Internet-of-Things; Tuân thủ Nguyên tắc thiết kế trực quan hóa dữ liệu; Sử dụng D3.js để trực quan hóa dữ liệu; Ứng dụng dựa trên web cho thiết kế trực quan hóa; Khám phá các phương pháp hay nhất trong thiết kế bảng điều khiển; Lập bản đồ từ dữ liệu không gian; Sử dụng Python cho Khoa học dữ liệu; Sử dụng Mã nguồn mở R cho Khoa học dữ liệu; Sử dụng SQL trong Khoa học dữ liệu; Làm Khoa học Dữ liệu với Excel và Knime; Khoa học dữ liệu trong báo chí: Xác định năm chữ W (và một chữ H); Đi sâu vào Khoa học Dữ liệu Môi trường; Khoa học dữ liệu để thúc đẩy tăng trưởng trong thương mại điện tử; Sử dụng Khoa học Dữ liệu để Mô tả và Dự đoán Hoạt động Tội phạm; Mười Tài nguyên Hiện tượng cho Dữ liệu Mở; Mười công cụ và ứng dụng khoa học dữ liệu miễn phí.

Khai thác bộ dữ liệu khổng lồ / 3 thứ chỉnh sửa

Được viết bởi: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Nhà xuất bản: Nhà xuất bản Đại học Cambridge
  • Ngày xuất bản: 13 tháng 2 năm 2020
  • Ngôn ngữ: Tiếng Anh
  • Kích thước: 7 x 1 x 9,75 inch
  • Số trang: ‎565

Cuốn sách này cũng giả định rằng người đọc đã có kiến ​​thức cần thiết về toán học và lập trình.

Nội dung: Khai thác dữ liệu; MapReduce và ngăn xếp phần mềm mới; Thuật toán Sử dụng MapReduce; Tìm Đồ Tương Tự; Khai thác các luồng dữ liệu; Phân tích liên kết; Tập mục phổ biến; Phân cụm; Quảng cáo trên Web; Hệ thống khuyến nghị; Khai thác đồ thị mạng xã hội; Giảm kích thước; Học máy quy mô lớn.

Sự kết luận

Sự khác biệt giữa các chương trình chuyên gia vẫn chưa rõ ràng. Sự khác biệt giữa các chương trình tổng quát và chuyên gia cũng chưa rõ ràng. Tuy nhiên, sau khi đọc danh sách sách đã cho, người đọc sẽ có thể đánh giá cao hơn vai trò đặc biệt của nhà phân tích dữ liệu, kỹ thuật dữ liệu và nhà khoa học dữ liệu, từ đó tiến lên phía trước.