Pandas Dataframe Unique

Pandas Dataframe Unique



Thư viện Python phổ biến nhất được sử dụng trong khoa học dữ liệu được gọi là Pandas. Nó cung cấp cho các lập trình viên Python các công cụ phân tích dữ liệu hiệu suất cao, thân thiện với người dùng và. Một khi bạn hiểu các chức năng cơ bản và cách sử dụng chúng, Pandas là một công cụ mạnh mẽ để thay đổi dữ liệu. Trong “gấu trúc”, các phương pháp tiêu chuẩn để lưu trữ dữ liệu dưới dạng bảng là DataFrames. Chúng tôi có thể sử dụng một số phương pháp 'gấu trúc' để nhận các giá trị duy nhất trong cột DataFrame của 'gấu trúc'. Khi chúng tôi cần nhận các giá trị duy nhất trong các cột của DataFrame và không muốn trùng lặp các giá trị trong cột DataFrame của “gấu trúc”, chúng tôi có thể sử dụng các phương pháp mà “pandas” cung cấp để thực hiện việc này. Hãy xem xét các phương pháp như vậy trong hướng dẫn này, cùng với một số ví dụ và kết quả để nhận các giá trị duy nhất trong cột “gấu trúc” của DataFrame.

Các phương pháp để có được các giá trị duy nhất trong các cột của DataFrame của “gấu trúc”

Chúng tôi có thể sử dụng hai phương pháp để nhận các giá trị duy nhất trong các cột của DataFrame “gấu trúc”. Chúng tôi loại bỏ các giá trị trùng lặp và chỉ lấy các giá trị duy nhất trong các cột của DataFrames. Các phương pháp mà 'gấu trúc' cung cấp để thực hiện nhiệm vụ này là:







  • Bằng cách sử dụng phương thức unique ().
  • Bằng cách sử dụng phương thức drop_dupliactes ().

Bây giờ, chúng tôi sẽ sử dụng cả hai phương pháp trong mã 'gấu trúc' để nhận các giá trị duy nhất trong các cột của DataFrame 'gấu trúc'.



Ví dụ # 01

Ứng dụng “Spyder” được sử dụng ở đây để tạo các mã “gấu trúc” này nhằm sử dụng các phương pháp đó giúp chúng tôi nhận được các giá trị duy nhất trong các cột của DataFrame “gấu trúc”. Chúng ta phải nhập các mô-đun “gấu trúc”, cần thiết cho mã “gấu trúc”, trước khi tạo DataFrame. Bằng cách sử dụng thuật ngữ “nhập” và đặt “gấu trúc làm pd”, chúng tôi nhập các mô-đun này.



Giờ đây, với sự hỗ trợ của “pd”, chúng ta có thể nhanh chóng có được các hàm hoặc phương thức “pandas”. Sau đó, chúng tôi đặt “Subject_data”, trong đó chúng tôi thêm “Name” và trong “Name”, chúng tôi sẽ thêm dữ liệu của tên là “Roman, William, Peter, Smith, John, Milli, Thomas và James”. Sau đó, chúng tôi thêm dữ liệu chủ đề vào “Subj” là “Maths, Economics, Science, Maths, Statistics, Statistics, Statistics, and Computer”. Sau đó, chúng tôi chuyển đổi “Subject_data” này thành DataFrame “Subject_df” bằng cách sử dụng phương thức “pd.DataFrame ()”. Chúng tôi đặt “Subject_df” trong phương thức “print ()” để nó sẽ hiển thị trên thiết bị đầu cuối.





Bây giờ, chúng tôi muốn nhận các giá trị duy nhất trong cột DataFrame của “gấu trúc” “Subj”. Với mục đích này, chúng tôi đang sử dụng phương thức “unique ()” ở đây và chúng tôi thêm tên của cột và cả tên của DataFrame như được hiển thị bên dưới. Chúng tôi thêm phương thức này trong “print ()” để kết quả cũng sẽ hiển thị trên thiết bị đầu cuối.



Bây giờ, chúng tôi đang nhấn “Shift + Enter” để nhận kết quả của mã này và nó hiển thị trên thiết bị đầu cuối và cũng được hiển thị ở đây, chứa DataFrame với tất cả các giá trị. Đây là DataFrame ban đầu mà chúng tôi đã thêm vào mã và bên dưới nó hiển thị các giá trị duy nhất của cột “Subj”. Nó loại bỏ các giá trị trùng lặp và hiển thị các giá trị duy nhất của cột “Con” của DataFrame.

Ví dụ # 02

Chúng tôi tạo “Sample_list” chứa một số thông tin. Chúng tôi chèn “Layla, 21, 28, 31, 14 và 39” sẽ xuất hiện dưới dạng cột đầu tiên khi chúng tôi chuyển đổi danh sách này thành DataFrame. Sau đó, chúng tôi thêm “Lusy, 31, 25, 34, 26 và 21” làm hàng thứ hai của DataFrame. Sau đó, chúng ta có “Peter, 38, 20, 20, 35 và 24” và “Layla 38, 23, 39 24, 23” sẽ là hàng thứ ba và thứ tư của DataFrame. Chúng tôi cũng chèn thêm ba dữ liệu nữa là “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” và cả “Peter, 21, 21, 31, 21, 29” .

Bây giờ, chúng tôi đang chuyển đổi “Sample_list” thành “DF_Sample” là tên của DataFrame ở đây bằng cách đặt hàm “pd.DataFrame ()”. Ngoài ra, chúng tôi đặt tên cho các cột của DataFrame này và những tên này là “Tên, Ass_1, Ass_2, Ass_3, Ass_4 và Ass_5”. Sau đó, chúng tôi sử dụng “print ()” giúp hiển thị DataFrame “DF_Sample”. Bây giờ, chúng tôi đang sử dụng một phương pháp khác trong ví dụ này để nhận các giá trị duy nhất trong cột DataFrame. Phương thức này là phương thức “drop_duplicates ()” của “pandas”.

Trong phương thức “drop_duplicates ()”, chúng tôi đặt tên của cột mà chúng tôi muốn nhận các giá trị duy nhất trong cột của DataFrame. Chúng tôi đang nhận các giá trị duy nhất của cột “Tên” bằng cách loại bỏ các giá trị trùng lặp trong cột này với sự trợ giúp của phương thức “drop_duplicates ()” và cũng hiển thị các giá trị duy nhất này bằng cách sử dụng hàm “print ()” tại đây.

Các tên trùng lặp sẽ bị loại bỏ và các giá trị duy nhất được hiển thị sau khi áp dụng phương thức “drop_duplicates ()”. Bạn có thể lưu ý rằng tên 'Layla' xuất hiện trong ba ô của cột 'Tên'. Nhưng khi phương thức “drop_duplicates ()” được áp dụng cho cột này, tất cả các giá trị trùng lặp sẽ bị loại bỏ và một tên “Layla” đã xuất hiện trên màn hình. Sau khi loại bỏ các giá trị trùng lặp, DataFrame mới xuất hiện chứa các giá trị duy nhất trong cột 'Tên' này. Bằng cách này, chúng tôi có thể loại bỏ các giá trị trùng lặp và nhận giá trị duy nhất trong cột của DataFrame với sự trợ giúp của phương thức “drop_duplicates ()”.

Ví dụ # 03

DataFrame tương tự lại được sử dụng và bây giờ chúng tôi đang áp dụng phương thức “unique ()” ở đây. Với phương thức “unique ()”, chúng tôi đặt tên của cột cũng như tên của DataFrame mà chúng tôi muốn áp dụng phương thức “unique ()” này để nhận các giá trị duy nhất. Điều này sẽ chỉ hiển thị các giá trị duy nhất của cột đó và sẽ không hiển thị các giá trị này ở dạng DataFrame.

Ở đây, DataFrame chứa bảy giá trị trong cột 'Tên' nhưng khi chúng tôi áp dụng phương thức 'unique ()' cho cột này, chỉ có bốn giá trị xuất hiện và đây là những giá trị duy nhất của cột đó. Nó không hiển thị các giá trị trùng lặp.

Ví dụ # 04

DataFrame mà chúng tôi tạo trong ví dụ này là “F_G_df”. Chúng tôi chèn “My_fruits” và “my_Vegs” trong DataFrame này. Cột “My_fruits” chứa “Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear và Apple”. Tiếp theo, chúng ta có “My_Vegs” chứa tên của các loại rau là “Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic, and Ginger”. DataFrame này chỉ chứa hai cột.

Bây giờ, chúng tôi đang nhận các giá trị duy nhất trong cả hai cột với sự trợ giúp của phương thức “unique ()”. Chúng tôi đề cập đến tên của DataFrame. Sau đó, đặt tên cột đầu tiên. Sau đó, chúng tôi sử dụng phương thức append (). Trong phần phụ này, chúng ta lại đặt tên của DataFrame và tên cột thứ hai và đặt phương thức “unique ()”. Thao tác này sẽ nhận các giá trị duy nhất của cả hai cột và sau đó nối các giá trị duy nhất của cả hai cột và xuất hiện chúng trên màn hình.

DataFrame được hiển thị đầu tiên chứa tất cả các giá trị. Sau đó, phương thức “unique ()” được áp dụng và các giá trị duy nhất của cả hai cột được hiển thị bên dưới. Trong mã này, chúng tôi nhận các giá trị duy nhất trong nhiều cột của DataFrame bằng cách sử dụng phương thức “unique ()”.

Sự kết luận

Giải thích đầy đủ về việc nhận các giá trị duy nhất trong cột của DataFrame được tìm thấy trong hướng dẫn này. Chúng tôi đã thảo luận về các phương thức “unique ()” và “drop_duplicates ()” giúp chúng tôi nhận được các giá trị duy nhất của cột DataFrame. Chúng tôi đã khám phá cách sử dụng các phương pháp này trong mã 'gấu trúc' bằng cách sử dụng các phương pháp này tại đây trong mã của chúng tôi. Chúng tôi đã minh họa các ví dụ khác nhau trong hướng dẫn này và đã chỉ cho bạn cách nhận các giá trị duy nhất của một cột bằng cách sử dụng phương thức “unique ()” cũng như phương thức “drop_duplicates ()”. Chúng tôi cũng đã khám phá cách lấy các giá trị duy nhất trong nhiều cột bằng cách sử dụng phương thức “unique ()” trong hướng dẫn này.