Pandas Sum Column

Pandas Sum Column



“Bài viết này sẽ trình bày cách tổng hợp tất cả hoặc các cột cụ thể trong Pandas DataFrame bằng Python. Hàm DataFrame.sum () sẽ được sử dụng cùng với một số tham số hữu ích trong nhiều ví dụ của hướng dẫn này. ”

Khi hướng dẫn này kết thúc, bạn có thể biết cách:







    • Tìm tổng của Cột khung dữ liệu trong Pandas.
    • Thêm các cột khung dữ liệu lại với nhau
    • Thêm cột vào Khung dữ liệu gấu trúc đáp ứng Điều kiện được chỉ định.
    • Xác định tổng sau khi nhóm dữ liệu của khung dữ liệu.

Làm thế nào để xác định tổng của các cột khung dữ liệu?

Hàm “dataframe.sum ()” trong Pandas trả về tổng giá trị cho trục được chỉ định. Nếu đầu vào là một trục của chỉ mục, hàm sẽ thêm từng giá trị của từng cột, sau đó thực hiện tương tự đối với từng cột, trả về một chuỗi lưu trữ tổng dữ liệu / giá trị trong mỗi cột. Ngoài ra, nó hỗ trợ tính toán tổng của khung dữ liệu bằng cách bỏ qua các giá trị bị thiếu.



Cú pháp: DataFrame.sum (axis = Không, bỏ qua = Không, cấp = Không, numeric_only = Không, min_count = 0, ** kwargs)



Ở đâu,





trục: {cột (1), chỉ mục (0)}

gọi món: Bỏ qua các giá trị NA / null khi tính toán kết quả.



mức độ: Nếu trục được chỉ định có thứ bậc (nhiều chỉ mục), hãy đếm đến một cấp chỉ mục cụ thể trước khi chuyển đổi thành Chuỗi.

Chỉ số: Chỉ các cột float, int và boolean là có thể chấp nhận được. Nếu Không, hãy cố gắng sử dụng mọi thứ; nếu không, chỉ có dữ liệu số. Đối với Sê-ri, không được triển khai.

min_count: Số lượng giá trị có thể được yêu cầu để hoàn thành hoạt động. Kết quả sẽ là NA nếu có ít giá trị không phải NA hơn min_count.

Lợi nhuận: DataFrame (nếu mức được chỉ định) hoặc Series.

Ví dụ # 01: Xác định tổng của một cột khung dữ liệu và tất cả các cột

Trước tiên, chúng tôi yêu cầu một khung dữ liệu với các kiểu dữ liệu hợp lệ, tức là int, float, v.v., cột hoặc các cột mà chúng tôi có thể tìm thấy tổng dữ liệu. Khung dữ liệu sẽ được tạo bằng cách sử dụng hàm pd.DataFrame ().


Chúng tôi đã tạo khung dữ liệu cần thiết từ một từ điển python bên trong hàm pd.DataFrame (). Trong khung dữ liệu được tạo ở trên, có bốn cột “Tên”, “ngày1”, “ngày 2” và “ngày 3”. Trong số bốn cột, ba cột tức là “ngày1”, “ngày 2” và “ngày 3” là các cột số với các giá trị dữ liệu (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) và (7, 4, 3, 5, 6, 2, 1, 4). Chúng tôi chỉ có thể tìm thấy tổng cho ba cột này. Tổng cho cả chuỗi (tức là một cột) và toàn bộ khung dữ liệu có thể được xác định bằng cách sử dụng phương thức sum (). Hãy bắt đầu bằng cách hướng dẫn cách tính tổng tất cả dữ liệu trong cột Pandas.


Để xác định tổng, chúng tôi đã sử dụng phương thức sum () trên cột 'day2'. Hàm đã trả về giá trị tổng là 28. Tương tự như vậy, chúng ta có thể xác định tổng của mỗi cột Dataframe. Chỉ cần sử dụng phương thức sum () trên toàn bộ khung dữ liệu sẽ thực hiện được điều này.


Như có thể thấy, tổng của cột “day1” là 31; đối với “day2”, giá trị tổng là 28, trong khi đối với cột “day3”, giá trị tổng là 32.

Ví dụ # 02: Sử dụng hàm sum () để tổng hợp giá trị cột khung dữ liệu lại với nhau

Như bạn có thể thấy từ đầu ra của ví dụ trước, hàm không trả về dữ liệu cột khung dữ liệu thực tế tạo nên tổng. Tuy nhiên, bằng cách gán phương thức “DataFrame.sum ()” cho cột DataFrame, bạn có thể truy cập mọi cột trong DataFrame, bao gồm cả cột tổng. Đầu tiên, chúng tôi tạo một khung dữ liệu khác cho ví dụ này.


Sử dụng pd.DataFrame () khung dữ liệu của chúng tôi đã được tạo. Chúng tôi đã tạo khung dữ liệu với ba cột: mặt hàng, giá và thuế. Mục cột chứa các giá trị chuỗi (“bút”, “bút đánh dấu”, “thước kẻ”, “tẩy”, “bút chì”, “khay nhớ tạm”, “kim bấm”, “ghim”), giá cột lưu trữ các giá trị (20, 15, 10, 3, 5, 30, 35, 10) và cột 'thuế' bao gồm các giá trị (8, 5, 3, 3, 4, 10, 5, 2). Bây giờ, hãy cộng các giá trị cột giá và thuế và lưu trữ kết quả trong một cột mới bằng cách giữ nguyên các cột khung dữ liệu ban đầu.


Như có thể nhận thấy cùng với cột mới “tổng”, các cột ban đầu của khung dữ liệu đã cho cũng được hàm trả về. Cột 'tổng' lưu trữ tổng giá trị của các cột 'giá' và 'thuế' dựa trên mỗi dữ liệu 'mặt hàng'.

Ví dụ # 03: Sử dụng hàm sum () để xác định tổng của các cột khung dữ liệu được chỉ định

Để tổng hợp nhiều cột của khung dữ liệu với nhau, chúng ta có thể chỉ định một danh sách với nhãn của các cột và sau đó áp dụng phương thức sum () trên danh sách để tìm tổng. Giống như các ví dụ trước, trước tiên chúng ta sẽ tạo khung dữ liệu.


Chúng tôi đã tạo khung dữ liệu của mình với bốn cột “sinh viên”, “điểm 1”, “điểm 2” và “điểm 3”. Cột “sinh viên” lưu trữ dữ liệu (“Larry”, “James”, “Rob”, “Arya”, “Max”, “Ben”, “Gwen”, “Bill”) và cột “mark1” lưu trữ giá trị (8, 9, 6, 8, 10, 7, 9, 9), trong khi cột “mark2” và “mark3” đang lưu trữ các giá trị số (6, 6, 8, 6, 7, 9, 10, 9 ) và (7, 6, 9, 7, 8, 7, 10, 10) tương ứng.


Đầu tiên, chúng tôi đã tạo một đối tượng danh sách với các nhãn cột “sinh viên”, “điểm 1” và “điểm 3”. Sau đó, phương thức sum () được áp dụng cho danh sách. Hàm đã tính tổng các giá trị của cột mark1 và mark3 chỉ vì cột “sinh viên” không phải là số, do đó, hàm sum () không thể tìm tổng giá trị của cột “sinh viên”. Chúng tôi đã lưu trữ tổng các giá trị của cột “mark1” và “mark3” trong cột “sum”.

Ví dụ # 04: Thêm các cột của khung dữ liệu gấu trúc đáp ứng một điều kiện được chỉ định

Trong ví dụ này, chúng tôi sẽ thêm giá trị của các cột được chỉ định nếu chúng đáp ứng điều kiện đã chỉ định.


Có 5 cột trong khung dữ liệu mới được tạo, tức là “công ty”, “tuần1_sán”, “bán hàng tuần2”, “bán hàng tuần 3” và “chi nhánh”. Bây giờ, giả sử chúng ta không muốn thêm giá trị của cột cuối cùng khi chúng ta đang thêm hoặc tìm tổng giá trị của các hàng khung dữ liệu nhất định. Giả sử chúng tôi chỉ muốn thêm các giá trị cột có từ “tuần” vào nhãn của chúng. Có thể tạo danh sách để xác định xem từ “tuần” có xuất hiện trong nhãn cột hay không.


Bây giờ chúng tôi đã tìm nạp các cột có từ 'tuần' trong nhãn của chúng. Chúng ta có thể tóm tắt các cột chứa từ “tuần” bằng cách sử dụng đối số trục = 1 trong hàm sum ().


Theo cách này, chúng tôi có thể tổng hợp dữ liệu trên các cột theo hàng một cách an toàn mà không bao gồm bất kỳ cột nào chúng tôi không muốn.

Ví dụ # 5: Xác định Tổng sau khi nhóm dữ liệu của khung dữ liệu

Chúng tôi cũng có thể tìm thấy tổng các cột khung dữ liệu sau khi nhóm dữ liệu của một hoặc nhiều cột. Phương thức groupby () sẽ được sử dụng để nhóm dữ liệu thành các danh mục bên trong cột. Hãy tạo khung dữ liệu để chúng ta có thể nhóm dữ liệu của một trong các cột của khung đó.


Bây giờ chúng ta sẽ nhóm dữ liệu trong cột “tuổi” và tính tổng các giá trị của cột “điểm 1” và “điểm 2” cho mỗi loại của nhóm.


Chúng ta có thể thấy rằng việc tổng hợp dữ liệu trong khung dữ liệu sau khi lần đầu tiên nhóm các giá trị dữ liệu theo độ tuổi dẫn đến tổng theo cột tùy thuộc vào các nhóm tuổi.

Sự kết luận

Trong hướng dẫn này, chúng tôi đã cố gắng hướng dẫn bạn cách tính tổng trên các khung dữ liệu bằng phương pháp Pandas sum. Chúng tôi đã thảo luận về việc bổ sung các giá trị theo hàng và theo cột trong các ví dụ của bài đăng này. Ngoài ra, bạn đã học cách thêm cột có điều kiện và cách tính tổng các giá trị sau khi nhóm cột của khung dữ liệu. Bây giờ, bạn có thể tổng hợp các cột của khung dữ liệu với nhau hoặc tự mình tổng hợp các giá trị trong cột khung dữ liệu.