Pandas Reindex

Pandas Reindex



“Trong“ gấu trúc ”, chúng ta có thể lưu trữ nhiều thông tin dưới dạng bảng, còn được gọi là DataFrame. “Những chú gấu trúc” tạo điều kiện cho chúng tôi sử dụng phương thức “DataFrame ()” để xây dựng DataFrame. DataFrame chứa các chỉ mục và chúng ta cũng có thể thay đổi các chỉ mục của DataFrame bằng cách sử dụng các hàm 'pandas'. Phương pháp mà chúng tôi sử dụng để lập chỉ mục lại DataFrame là phương thức “reindex ()”. Phương pháp này giúp thay đổi giá trị chỉ mục của hàng cũng như giá trị chỉ mục của cột. Bằng cách sử dụng phương pháp này, chúng ta có thể thay đổi chỉ mục mặc định của DataFrame và cũng có thể thay đổi chỉ mục mà chúng ta đã đặt trong khi tạo DataFrame. Chúng tôi sẽ sử dụng phương thức “reindex ()” trong các ví dụ về “gấu trúc” của chúng tôi trong hướng dẫn này và sẽ giải thích sâu về khái niệm này tại đây. ”

Ví dụ # 01

Công cụ “Spyder” giúp chúng tôi phát triển mã “gấu trúc” ở đây trong hướng dẫn này và chúng tôi bắt đầu mã của mình với từ khóa “nhập”, sẽ giúp nhập hàm “gấu trúc”. Chúng tôi đặt “pandas as pd” sau khi nhập “import”. Sau đó, chúng tôi tạo DataFrame bằng cách gõ “pd.DataFrame ()”. Chúng tôi viết “pd” ở đây vì “DataFrame ()” là phương thức của “pandas”. “Value_df” là tên của biến mà DataFrame được lưu. Chúng tôi thêm “RandomName”, là tên cột và “RandomName” chứa “Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander và Samuel”.







Sau đó, chúng tôi có “Value_1”, trong đó chúng tôi đã chèn “16, 29, 24, 35, 44, 50, 69, 74 và 88”. Sau đó đến “Giá trị 2” và chúng tôi đã thêm “25, 38, 42, 56, 54, 65, 78, 89 và 99”. Bây giờ, “Giá trị_3” xuất hiện tiếp theo và chúng tôi đặt “36, 48, 52, 69, 74, 75, 87, 91 và 69” trong đó. Cột 'Value_4' hiện diện sau cột này, nơi chúng tôi đã chèn '52, 64, 72, 88, 82, 95, 97, 21 và 39'. Cột cuối cùng là cột “Giá trị_5” ở đây và trong cột này, các giá trị chúng tôi đã thêm là “66, 78, 82, 99, 34, 45, 57, 61 và 89”. Sau đó, chúng tôi sử dụng hàm “print ()” trong đó “Giá trị_df” được thêm vào. Nó sẽ in trên thiết bị đầu cuối.




Sau khi nhấn “Shift + Enter”, chúng tôi có thể dễ dàng nhận được kết quả của các mã của mình trong ứng dụng “Spyder”. Ở đây, mã này trả về DataFrame với chỉ mục mặc định. Bây giờ, chúng tôi sẽ áp dụng phương thức “reindex ()” để lập chỉ mục lại DataFrame này trong “pandas”.




Ở đây, hàm “reindex ()” được sử dụng để lập chỉ mục lại giá trị chỉ mục của hàng. Trong DataFrame ở trên, bạn có thể thấy rằng các giá trị chỉ mục mặc định của hàng được hiển thị và bây giờ, chúng tôi đang áp dụng phương thức “reindex ()” để lập chỉ mục lại các chỉ mục hàng đó. Chúng tôi đặt tên của DataFrame và sau đó là phương thức “reindex ()”, trong đó chúng tôi đặt các giá trị chỉ mục mà chúng tôi muốn thêm vào DataFrame ở trên. Chúng tôi đặt “ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H và ind_I” trong hàm “reindex ()”. Vì vậy, chỉ mục của các hàng này sẽ được cập nhật trên DataFrame khi chúng tôi thực thi mã này.






Các giá trị của chỉ mục của hàng được hiển thị trong kết quả này và bạn có thể lưu ý rằng các giá trị DataFrame không được hiển thị ở đây và các giá trị “NaN” đã xuất hiện. Điều này là do các giá trị chỉ mục mới không khớp với các giá trị chỉ mục trước đó của DataFrame. Khi chỉ mục mới và chỉ mục cũ không khớp, thì nó sẽ hiển thị “Nan” ở đó. Các giá trị “NaN” này xuất hiện theo mặc định khi chúng tôi thay đổi chỉ mục và nó không khớp với chỉ mục trước đó.



Ví dụ # 02

Bây giờ chúng tôi đang thay đổi các giá trị chỉ mục cột của “Value_df” mà chúng tôi đã tạo trước đó trong ví dụ 1. Sau khi in “Value_df”, chúng tôi đặt biến “column” và thêm một số giá trị vào đó. Chúng tôi thêm “a_1, b_1, c_1, d_1 và e_1”. Bây giờ, chúng tôi muốn điều chỉnh các giá trị này làm chỉ số của cột, vì vậy, đối với điều này, chúng tôi đang sử dụng phương thức “reindex ()” và đặt tên của biến “cột” trong đó các giá trị chỉ mục cột mới được lưu trữ và cũng đặt 'trục' thành 'cột', do đó, nó sẽ cập nhật chỉ mục trục cột. Chúng tôi đặt phương thức “reindex ()” trong “print ()”, vì vậy nó cũng sẽ hiển thị trên thiết bị đầu cuối.


Vì chúng tôi đã sử dụng phương thức “reindex ()”, các giá trị chỉ mục cột có trong DataFrame đầu tiên được cập nhật và các giá trị mới được thêm vào DataFrame đã cập nhật. Bạn cũng có thể lưu ý rằng tất cả các giá trị của DataFrame được chuyển đổi thành “NaN” vì cả hai giá trị chỉ mục của các cột đều khác nhau.

Ví dụ # 03

“Programming_data” trong mã này chứa “P_Languages”, nơi chúng tôi đã thêm “JavaScript, CSS, Web Engineering, OOP, C #, AI, Java và JavaScript”. Sau đó, chúng tôi có “Giờ” trong đó chúng tôi đặt “4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs và 6_hrs”. Sau đó, “P_Code” được nhập và chúng tôi chèn “11523, 12423, 12321, 11456, 11454, 12267, 13106 và 14123”. Chúng tôi thêm biến “p_index” và đặt “Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G và Pro_H”.

Các giá trị này sẽ được sử dụng làm giá trị chỉ mục của các hàng. Chúng tôi thay đổi “Programming_data” trong DataFrame “Programming_df”. Chúng tôi cũng thêm “p_index” vào DataFrame này bằng cách sử dụng phương thức “index”. Chúng tôi đặt “Programming_df” rồi đến phương thức “index” và gán “p_index” cho cái này. Bây giờ, các giá trị chỉ mục trên được thêm vào dưới dạng giá trị chỉ mục hàng vào DataFrame. Chúng tôi cũng in 'Programming_df'.

Sau đó, chúng tôi thêm một số giá trị chỉ mục mới trong biến “new_index” và đây là “P_1, P_2, P_3, P_4, P_5, P_6, P_7 và P_8”. Khi chúng tôi muốn cập nhật giá trị chỉ mục của các hàng, chúng tôi sử dụng phương thức “reindex ()” và đặt “new_index” làm tham số của hàm này và cũng lưu trữ DataFrame đã cập nhật trong “newProgramming_df” và đặt “newProgramming_df” trong “ print () ”để hiển thị.


Các giá trị chỉ mục được cập nhật và chúng tôi cũng có thể nói rằng chúng tôi đã lập chỉ mục lại DataFrame mà chúng tôi đã tạo. Tất cả các giá trị của DataFrame cũng được chuyển đổi thành “NaN” vì cả hai giá trị chỉ mục đều khác nhau.

Ví dụ # 04

Chúng tôi hiện đang thay đổi các giá trị chỉ mục “Programming_df” của các cột, mà chúng tôi đã phát triển trước đó trong ví dụ 3. Chúng tôi đặt biến “column” và chèn các giá trị mới vào đó. “P_Code, P_Languages, Hours và New” được thêm vào biến “column”. Sau đó, chúng tôi lại sử dụng phương thức “reindex ()” trong đó chúng tôi đặt biến “column”, biến này sẽ cập nhật các giá trị chỉ mục cột trước đó và thêm các giá trị chỉ mục cột mới này vào DataFrame.

Ở đây, bạn có thể lưu ý rằng các giá trị mới mà chúng tôi đã thêm vào 'cột' giống như chúng tôi đã thêm trong DataFrame ở trên, nhưng trình tự khác nhau, vì vậy nó sẽ thay đổi trình tự của các cột và điều chỉnh tất cả các cột khi chúng tôi được đề cập trong biến 'cột'. Ngoài ra, chúng tôi thêm một giá trị chỉ mục khác không có trong DataFrame ở trên, ở đây là 'Mới', vì vậy các giá trị 'NaN' sẽ xuất hiện trong cột này.


Trình tự của các cột được thay đổi ở đây và tất cả các giá trị xuất hiện như nó có trong các cột của DataFrame ban đầu và cột “Mới” trong DataFrame đã cập nhật chứa tất cả các giá trị “NaN” vì cột này không có trong DataFrame ban đầu.

Sự kết luận

Chúng tôi đã trình bày hướng dẫn này giúp chúng tôi hiểu chi tiết khái niệm 'lập chỉ mục gấu trúc'. Chúng tôi đã thảo luận về cách chúng tôi có thể lập chỉ mục lại cột của DataFrame cũng như các giá trị chỉ mục của hàng. Chúng tôi đã giải thích rằng hàm “reindex ()” của “pandas” được sử dụng để thực hiện việc này. Chúng tôi đã thực hiện các ví dụ khác nhau, trong đó chúng tôi đã thay đổi giá trị chỉ mục của các hàng trong DataFrame và cả giá trị chỉ mục của chỉ mục cột của DataFrame. Chúng tôi đã hiển thị kết quả của tất cả các mã mà chúng tôi đã thực hiện ở đây trong hướng dẫn này và cũng giải thích sâu về chúng.