Gấu trúc Tham gia vs Hợp nhất

Gau Truc Tham Gia Vs Hop Nhat



“Pandas” là một công cụ hiệu suất cao cho môi trường python. Nó là một mã nguồn 'mở' để phân tích dữ liệu. Phương pháp nối gấu trúc và phương pháp hợp nhất gấu trúc được sử dụng để nối hai khung dữ liệu lại với nhau thành một khung dữ liệu duy nhất. Trong cả hai phương pháp của gấu trúc, sự khác biệt là hàm 'tham gia' của gấu trúc tham gia khung dữ liệu bằng cách sử dụng một chỉ mục. Trong khi hàm 'hợp nhất' của gấu trúc tham gia khung dữ liệu bằng cách sử dụng chỉ mục và phương pháp cột trong đó chúng ta có thể tự chọn cột mong muốn. Phương pháp hợp nhất của gấu trúc được sử dụng hầu hết so với phương pháp nối của gấu trúc. Phần mềm mà chúng tôi sẽ sử dụng để triển khai là phần mềm “spyder”, nằm trong môi trường python sẽ cung cấp cho chúng tôi các lợi ích cho việc triển khai mã của phương thức nối gấu trúc () và hàm phương thức hợp nhất pandas ().

Cú pháp của phương thức Pandas Join ()

“df1. tham gia ( df2 )

“Df” trong cú pháp trên là chữ viết tắt của “dataframe”. Có hai khung dữ liệu trong cú pháp với chức năng 'nối dấu chấm', dùng để gọi phương thức. Đây là phương pháp gấu trúc nối hai khung dữ liệu. Nó hoạt động bằng cách sử dụng chỉ mục để kết hợp các khung dữ liệu trong một khung duy nhất.







Cú pháp của phương thức Pandas Merge ()

“df1. hợp nhất ( df2 , trên = 'tên cột dọc' )

Cú pháp phương pháp hợp nhất gấu trúc có hai khung dữ liệu là “df1” và “df2”. Chức năng 'hợp nhất điểm' đang gọi phương pháp nối cả hai khung dữ liệu với sự xuất hiện của các cột bị đảo ngược.



Chúng tôi sẽ đề cập đến các cách kết hợp hai khung dữ liệu sau đây để sử dụng các phương pháp hợp nhất gấu trúc và nối gấu trúc:



  • Pandas Join phương pháp chồng chéo.
  • Gấu trúc tham gia phương pháp bằng cách đặt lại chỉ mục.
  • Phương pháp hợp nhất gấu trúc (cột “trái và phải”).
  • Phương pháp hợp nhất gấu trúc rõ ràng.

Tạo khung dữ liệu để triển khai phương pháp hợp nhất gấu trúc và kết hợp gấu trúc

Đầu tiên, chúng ta phải tạo một khung dữ liệu. Vì vậy, chúng tôi sẽ sử dụng công cụ 'spyder'. Sau khi mở nó, hãy bắt đầu viết mã. Nhập gấu trúc dưới dạng 'pd' cho hiệp hội thư viện gấu trúc. Chúng ta có các biến khung dữ liệu tương ứng là “x”, “y”, “p”, “q” và “a” với các giá trị “1” và “b” với giá trị được gán là “2”.





Đầu ra là một “df” được tạo với các giá trị được chỉ định. Chúng tôi có thể làm cho nó lớn như dữ liệu.



Tạo một khung dữ liệu khác

Chúng tôi phải tạo một khung dữ liệu khác, để hiểu rõ ràng các phương pháp nối gấu trúc và hợp nhất gấu trúc. Ở đây, chúng ta có “df” được tạo giống như “df” ở trên, chỉ có các giá trị được gán cho các biến là khác nhau. Chúng ta có “h”, “j”, “s” và “d”, trong khi gán các giá trị “b” với giá trị “8” và “Y” với giá trị “3”.

Đầu ra hiển thị một “df” đơn giản được tạo.

Ví dụ # 01: Phương pháp nối gấu trúc (chồng chéo)

Bây giờ, chúng ta sẽ xem cách nối hai khung dữ liệu với phương pháp nối gấu trúc. Đối với phương pháp này, chúng tôi có thể chọn cột tùy chọn của bạn mà chúng tôi muốn làm việc từ khung dữ liệu. Chúng tôi đã lấy ví dụ với cột chồng chéo “bên trái” từ “df”, vì vậy chúng tôi có thể sửa lỗi này bằng “hậu tố” để khắc phục sự chồng chéo dữ liệu. Ở đây, các biến được sử dụng là “x”, “z”, “v”, “d”. “P”, “o”, “l” và “y” với các giá trị được chỉ định là “3”, “6”, “7” và “9”. “.Join” gọi phương thức, với căn chỉnh được đặt thành liên kết bên trái với hậu tố “df” bên phải. ”. 'Hậu tố' được sử dụng trong mã là vì trong khung dữ liệu, có hai cột có cùng tên là 'khóa' và điều đó sẽ không trùng lặp dữ liệu.

Đầu ra không hiển thị dữ liệu chồng chéo với phương pháp nối hai “df” bằng phương pháp nối gấu trúc.

Ví dụ # 02: Phương pháp tham gia gấu trúc bằng cách sử dụng thiết lập lại chỉ mục

Trong ví dụ này, chúng tôi sẽ chỉ định riêng cột có tham số “bật” để sử dụng làm “khóa” trong phép nối phương thức giúp nối hai khung dữ liệu. điều kết hợp được thực hiện với tham số này. Ngoài ra, chỉ mục của một trong hai “df” phải tương tự để kết hợp chúng. Các loại dữ liệu tương tự hoặc dữ liệu được sử dụng cho cùng một mục đích có thể được xử lý cùng nhau. Thao tác này sẽ vẫn sử dụng chỉ mục, sử dụng từ bên phải. Các biến là “s”, “t”, “u”, “v”, “n”, “w”, “k” và “q”. Các giá trị được chỉ định là “3”, “6”, “7” và “9”. “Đặt lại chỉ mục dấu chấm” là một phương pháp của gấu trúc để đặt lại chỉ mục của “df”. Chỉ mục đặt lại đặt tất cả các số nguyên trong danh sách khung dữ liệu của bạn từ 0 cho đến khi dữ liệu khung dữ liệu ở đó được kéo dài thêm.

Đây là kết quả hiển thị với phương thức nối chỉ mục 'key' của gấu trúc.

Ví dụ # 03: Phương pháp hợp nhất gấu trúc (cột “trái và phải”)

Phương thức hợp nhất thực hiện một hoạt động tương tự như phương thức nối gấu trúc. Cả hai phương pháp đều để kết hợp dữ liệu trên một khung dữ liệu giống nhau. Phương thức hợp nhất linh hoạt hơn yêu cầu chỉ định khóa. Chúng tôi cũng có thể chỉ định nó trên các cột bên trái và bên phải tùy thuộc vào công việc của khung dữ liệu của bạn. Các biến trong mã là “s”, “d”, “g”, “f”, “k”, “j”, “b” và “q”. các giá trị được chỉ định là “9”, “5”, “6” và “7”. Việc triển khai “tham gia” bên ngoài được thực hiện trên cả “df” bằng cách sử dụng tham số “how” của hàm phương thức hợp nhất gấu trúc.

Đầu ra chúng ta thấy hiển thị dữ liệu đã hợp nhất của hai khung dữ liệu. “NaN” đại diện cho “không phải số” có nghĩa là không có số nào được gán trong dữ liệu mà “NaN” hiển thị ở đó.

Ví dụ # 04: Phương pháp Hợp nhất rõ ràng

Ở đây, trong ví dụ này, phương pháp hợp nhất là hủy chỉ mục và giá trị chỉ mục không được giả định trên khung dữ liệu. Chúng tôi sẽ thực hiện phương pháp này tùy theo công việc cần làm, trong đó việc xác định rõ ràng là cần theo dõi. Nó sẽ hợp nhất dữ liệu dựa trên chỉ mục bên trái hoặc chỉ số bên phải với tham số. Các biến trong khung dữ liệu này là “t”, “r”, “I”, “u”, “h”, “o”, “e” và “e”. Các giá trị được chỉ định là “2”, “4”, “6” và “4”. Ví dụ ở trên về phương pháp hợp nhất gấu trúc với việc chọn cột theo nhu cầu là phương pháp nối hai khung dữ liệu có giá trị và hữu ích nhất. Kiểm tra ở cuối dòng mã về khóa hợp nhất là duy nhất trong tập dữ liệu.

Trong đầu ra bên dưới, chỉ mục không được hiển thị mà không có chỉ mục nhưng chức năng được thực hiện dựa trên chỉ mục bên phải và bên trái.

Sự kết luận

Phương thức merge () và join () đều là hai phương thức rất tiện lợi và hiệu quả. Cả hai hàm này đều được sử dụng để nối hai khung dữ liệu riêng biệt trên cùng một khung dữ liệu nhưng có cách sử dụng khác nhau tùy từng trường hợp. Trong bài viết này, chúng ta đã tìm hiểu những điểm khác biệt chính giữa phương pháp nối và hợp nhất gấu trúc. Sau khi thực hiện các ví dụ và hiểu phương thức nối gấu trúc, chúng ta sẽ kết luận rằng, nếu chúng ta muốn kết hợp kiểu cơ sở dữ liệu và linh hoạt hơn, thì tốt hơn là sử dụng phương pháp hợp nhất gấu trúc. Mặt khác, nếu chúng ta muốn kết hợp khung dữ liệu với chỉ mục một cách rộng rãi, chúng ta có thể sử dụng hàm phương thức pandas join ().