Gấu trúc để từ điển

Gau Truc De Tu Dien



“Trong Python, một cấu trúc dữ liệu được gọi là từ điển được sử dụng để lưu trữ thông tin dưới dạng các cặp khóa-giá trị. Các đối tượng từ điển được tối ưu hóa để trích xuất dữ liệu / giá trị khi khóa hoặc các khóa được biết đến. Hãy nhớ rằng từ điển có thể bao gồm các khóa trùng lặp. Để tìm hiệu quả các giá trị bằng cách sử dụng chỉ mục có liên quan, chúng tôi có thể chuyển đổi một chuỗi gấu trúc hoặc khung dữ liệu có chỉ mục liên quan thành một đối tượng từ điển với các cặp khóa-giá trị “index: value”. Để đạt được nhiệm vụ này, phương thức “to_dict ()” có thể được sử dụng. Chức năng này là một chức năng tích hợp được tìm thấy trong lớp Series của mô-đun gấu trúc. Khung dữ liệu được chuyển đổi thành một từ điển dữ liệu giống như danh sách python của chuỗi bằng cách sử dụng phương thức pandas.to_dict (), tùy thuộc vào giá trị được chỉ định của tham số định hướng. ”

Làm thế nào để chuyển đổi gấu trúc thành từ điển Python?

Có nhiều phương pháp để chuyển đổi gấu trúc sang từ điển. Tuy nhiên, để chuyển đổi khung dữ liệu Pandas thành từ điển Python, chúng tôi sẽ sử dụng phương thức to_dict () trong Pandas. Chúng tôi có thể định hướng các cặp khóa-giá trị của từ điển được trả về theo nhiều cách khác nhau bằng cách sử dụng hàm to_dict (). Cú pháp của hàm như sau:







Cú pháp



pandas.to_dict ( đông = 'dict', vào trong = )



Thông số

định hướng: Loại dữ liệu nào để chuyển đổi cột (chuỗi thành) được chỉ định bởi giá trị chuỗi (“dict”, “danh sách”, “bản ghi”, “chỉ mục”, “chuỗi”, “tách”). Ví dụ: từ khóa “danh sách” sẽ cung cấp một từ điển python gồm các đối tượng danh sách với các khóa “Tên cột” và “Danh sách” (chuỗi được chuyển đổi) làm đầu ra.





vào trong: lớp, có thể được truyền dưới dạng cá thể hoặc lớp thực tế. Ví dụ, một cá thể lớp có thể được chuyển trong trường hợp của một mệnh đề mặc định. Giá trị mặc định của tham số là dict.

Loại trả lại: Từ điển được chuyển đổi từ khung dữ liệu hoặc chuỗi.



Ví dụ # 01: Chuyển đổi khung dữ liệu gấu trúc thành từ điển

Sử dụng bộ danh sách trong hàm pd.DataFrame (), chúng tôi sẽ tạo một khung dữ liệu cơ bản với một số cột và hàng để sau này chúng tôi có thể chuyển đổi nó thành một từ điển python.


Chúng tôi đã tạo khung dữ liệu của mình bằng cách chuyển danh sách vào bên trong hàm pd.DataFrame (). Trong khung dữ liệu trên, chúng ta có ba cột “công ty”, “doanh số” và “doanh thu”. Trong cột công ty, chúng tôi đã lưu trữ tên của các công ty ngẫu nhiên là (“A&B”, “Max_tech”, “XT”, “MJ”, “Quanto”, “Mini_X”, “Zomo”, “AU”, “HL” , “ZMX”, “Earny”), cột “doanh số” thể hiện doanh số của từng công ty là (“217”, “200”, “199”, “150”, “210”, “216”, “185 ”,“ 189 ”,“ 202 ”,“ 159 ”,“ 205 ”) và cột“ doanh thu ”đang lưu trữ các giá trị đại diện cho doanh thu của từng công ty so với doanh số tương ứng (340000 320000 300000 270000 315000 335000 250000 255000 301000 244000 305000). Bây giờ chúng ta sẽ chuyển đổi dataframe “df” thành một từ điển python.


Bằng cách áp dụng phương thức to_dict () cho khung dữ liệu df, chúng tôi đã chuyển đổi khung dữ liệu gấu trúc thành một từ điển.

Ví dụ # 02: Chuyển đổi khung dữ liệu gấu trúc được tạo từ tệp CSV thành từ điển

Trong ví dụ số 1, chúng tôi đã tạo khung dữ liệu bằng cách sử dụng các bộ giá trị bên trong danh sách. Bây giờ chúng ta sẽ tạo một khung dữ liệu với sự trợ giúp của tệp CSV và sau đó chúng ta sẽ chuyển nó thành một từ điển bằng cách sử dụng hàm to_dict ().


Để đọc tệp dưới dạng khung dữ liệu, chúng tôi đã sử dụng hàm pd.read_csv (). Trong khung dữ liệu ở trên, chúng ta có hai cột (Tên và Dấu) và mười bảy hàng (từ 0 đến 16). Bây giờ chúng ta sẽ sử dụng phương thức to_dict ().


Hàm đã chuyển đổi khung dữ liệu “df” của chúng tôi thành một từ điển python.

Ví dụ # 03: Chuyển đổi Khung dữ liệu gấu trúc thành Từ điển chứa danh sách giá trị

Trong các ví dụ trước đó, chúng tôi đã chuyển đổi gấu trúc thành một từ điển python chứa nhiều từ điển. Khi chuyển đổi khung dữ liệu thành đối tượng từ điển, các nhãn cột phải đóng vai trò là khóa của từ điển và tất cả dữ liệu hoặc giá trị của cột phải được thêm vào từ điển kết quả dưới dạng danh sách giá trị cho mỗi khóa.


Chúng tôi đã tạo khung dữ liệu có ba cột “tên”, “quốc gia” và “tuổi”. Trong cột “tên”, chúng tôi đã lưu trữ các giá trị dữ liệu (“Anna”, “Marty”, “Carl”, “Mary”, “Cleb”, “Ali”, “Alexa”, “Becky”, “Ryan”) . Trong khi các cột khác, quốc gia và độ tuổi là các giá trị mạnh như (“Hoa Kỳ”, “Anh”, “Hoa Kỳ”, “Pháp”, “Nga”, “Nga”, “Pháp”, “Anh”, “Hoa Kỳ”) và ( Lần lượt là 34, 32, 30, 27, 31, 33, 35, 25, 30). Chúng tôi sẽ tạo một từ điển chứa các danh sách bằng cách sử dụng tham số 'list' bên trong phương thức to_dict ().


Bằng cách sử dụng tham số list làm đối số bên trong hàm to_list (), chúng ta đã tạo một từ điển chứa nhiều danh sách.

Ví dụ # 03: Chuyển đổi Khung dữ liệu gấu trúc thành Từ điển chứa chuỗi giá trị

Khi một DataFrame cần được chuyển đổi thành một từ điển, tên cột đóng vai trò là các khóa từ điển và chỉ mục hàng và dữ liệu trong cột làm giá trị cho các khóa tương ứng trong từ điển.


Chúng tôi đã tạo khung dữ liệu cần thiết bằng phương thức pd.DataFrame (). Trong khung dữ liệu được tạo gần đây, chúng ta có hai cột. Cột tên lưu trữ các giá trị dữ liệu dưới dạng một chuỗi (“Kim”, “Morris”, “Casper”, “Milli”, “Dave”, “Will”, “Billy”), trong khi các cột dấu bao gồm dữ liệu số là ( 8, 9, 6, 7, 10, 7, 8). Chúng ta sẽ sử dụng tham số “series” như một chuỗi bên trong hàm to_dict ().

Ví dụ # 04: Chuyển đổi Khung dữ liệu gấu trúc thành Từ điển không có chỉ mục và tiêu đề

Tham số 'split' của hàm to_dict () có thể được sử dụng để trích xuất dữ liệu từ DataFrame mà không có tiêu đề của các cột hoặc khi chúng ta cần xóa chỉ mục tiêu đề và hàng khỏi dữ liệu. Nhãn cột, chỉ mục hàng và dữ liệu thực tế được chia thành ba thành phần bằng cách sử dụng tham số này. Hãy tạo khung dữ liệu để chúng ta có thể chia nó thành ba phần trong khi chuyển nó vào từ điển.


Chúng tôi đã tạo hai cột có nhãn “tên” và “tuổi” chứa các giá trị (“Dave”, “Morris”, “Billy”, “Milli”, “Kim”, “Will”, “Casper”) và (19, 19 , 25, 21, 19, 21, 23) tương ứng. Hãy chuyển đổi chúng sang từ điển python.


Sử dụng khóa “dữ liệu”, chúng tôi có thể truy xuất dữ liệu từ từ điển kết quả mà không cần chỉ mục hoặc tiêu đề.

Ví dụ # 05: Chuyển đổi khung dữ liệu Pandas thành từ điển theo hàng và chỉ mục hàng

Tham số “record” có thể được sử dụng bên trong hàm to_dict () để lưu trữ dữ liệu của mỗi hàng khung dữ liệu trong nhiều đối tượng từ điển riêng biệt bên trong một danh sách hoặc khi dữ liệu theo hàng được yêu cầu. Một danh sách chứa các đối tượng từ điển sẽ được trả về. Từ điển có nhãn cột làm khóa và dữ liệu cột làm giá trị cho mọi hàng.


Chúng tôi đã tạo một khung dữ liệu với các cột 'tên' và 'lương'. Cột “tên” chứa các giá trị dữ liệu (“Leo”, “Haris”, “Wanda”, “Mike”, “Kelly”, “Adam”, “Jack”) và cột lương lưu trữ các giá trị (12000, 12500 , 14000, 11000, 12000, 13000, 12500). Bây giờ, hãy tạo một danh sách với nhiều từ điển python chứa dữ liệu của mỗi hàng.


Tham số chỉ mục cũng có thể được sử dụng để chuyển đổi dữ liệu của từng hàng từ khung dữ liệu sang từ điển. Một danh sách chứa các mục từ điển sẽ được trả lại. Mỗi hàng tạo ra một từ điển. Trong đó chỉ mục hàng sẽ là khóa và giá trị sẽ là từ điển dữ liệu và nhãn cột.

Sự kết luận

Trong hướng dẫn này, chúng ta đã thảo luận về cách chúng ta có thể chuyển đổi dataframe hoặc các đối tượng gấu trúc thành một từ điển python. Chúng ta đã xem cú pháp của hàm to_dict () để hiểu các tham số của hàm này và cách bạn có thể sửa đổi đầu ra của hàm bằng cách chỉ định hàm với các tham số khác nhau. Trong các ví dụ của hướng dẫn này, chúng tôi đã sử dụng phương thức to_dict (), một hàm pandas có sẵn, để thay đổi các đối tượng gấu trúc thành từ điển python.