Xóa các bản sao trong Google Trang tính

Xoa Cac Ban Sao Trong Google Trang Tinh



Dữ liệu trùng lặp thường có thể dẫn đến nhầm lẫn, sai sót và hiểu biết sai lệch. May mắn thay, Google Trang tính cung cấp cho chúng ta nhiều công cụ và kỹ thuật để đơn giản hóa công việc xác định và loại bỏ những mục thừa này. Từ so sánh ô cơ bản đến các phương pháp tiếp cận dựa trên công thức nâng cao, bạn sẽ được trang bị để biến các trang tính lộn xộn thành các tài nguyên có giá trị, có tổ chức.
Cho dù bạn đang xử lý danh sách khách hàng, kết quả khảo sát hay bất kỳ tập dữ liệu nào khác, việc loại bỏ các mục nhập trùng lặp là bước cơ bản hướng tới phân tích và ra quyết định đáng tin cậy.
Trong hướng dẫn này, chúng tôi sẽ đi sâu vào hai phương pháp cho phép bạn xác định và xóa các giá trị trùng lặp.

Tạo bảng

Trước tiên, chúng tôi tạo một bảng trong Google Trang tính. Bảng này sẽ được sử dụng trong các ví dụ ở phần sau của bài viết này. Bảng này có 3 cột: Cột A, tiêu đề là “Tên”, lưu trữ tên; Cột B có tiêu đề “Tuổi”, chứa tuổi của mọi người; và cuối cùng, Cột C, tiêu đề “Thành phố” chứa các thành phố. Nếu chúng tôi quan sát thấy một số mục trong bảng này bị trùng lặp, chẳng hạn như các mục dành cho “John” và “Sara”.









Chúng tôi sẽ làm việc trên bảng này để loại bỏ các giá trị trùng lặp này bằng các phương pháp khác nhau.



Phương pháp 1: Sử dụng tính năng “Xóa trùng lặp” trong Google Trang tính

Phương pháp đầu tiên chúng ta thảo luận ở đây là xóa các giá trị trùng lặp bằng cách sử dụng tính năng “Xóa các bản sao” của Google Trang tính. Phương pháp này sẽ loại bỏ vĩnh viễn các mục trùng lặp khỏi phạm vi ô đã chọn.





Để chứng minh phương pháp này, chúng ta sẽ xem xét lại bảng được tạo ở trên.

Để bắt đầu làm việc với phương pháp này, trước tiên, chúng ta cần chọn toàn bộ phạm vi chứa dữ liệu của mình, bao gồm cả các tiêu đề. Trong trường hợp này, chúng tôi đã chọn các ô A1:C11 .



Ở đầu cửa sổ Google Trang tính, bạn sẽ thấy thanh điều hướng với nhiều menu khác nhau. Xác định vị trí và nhấp vào tùy chọn “Dữ liệu” trong thanh điều hướng.

Một menu thả xuống sẽ xuất hiện khi bạn nhấp vào tùy chọn “Dữ liệu”, hiển thị cho bạn nhiều công cụ và chức năng liên quan đến dữ liệu có thể được sử dụng để phân tích, làm sạch và thao tác dữ liệu của bạn.

Trong ví dụ này, chúng ta sẽ cần truy cập vào menu “Dữ liệu” để điều hướng đến tùy chọn “Dọn dẹp dữ liệu”, bao gồm tính năng “Xóa trùng lặp”.

Sau khi truy cập hộp thoại “Xóa trùng lặp”, chúng tôi sẽ thấy danh sách các cột trong tập dữ liệu của mình. Dựa trên các cột này, các cột trùng lặp sẽ được tìm thấy và loại bỏ. Chúng tôi sẽ đánh dấu các hộp kiểm tương ứng trong hộp thoại tùy thuộc vào cột nào chúng tôi muốn sử dụng để xác định các bản sao.

Trong ví dụ của chúng tôi, chúng tôi có ba cột: “Tên”, “Tuổi” và “Thành phố”. Vì chúng tôi muốn xác định các bản sao dựa trên cả ba cột nên chúng tôi đã chọn cả ba hộp kiểm. Ngoài ra, bạn cần chọn hộp kiểm “Dữ liệu có hàng tiêu đề” nếu bảng của bạn có tiêu đề. Vì chúng tôi có các tiêu đề trong bảng được cung cấp ở trên nên chúng tôi đã chọn hộp kiểm 'Dữ liệu có hàng tiêu đề'.

Sau khi chọn các cột để xác định các cột trùng lặp, chúng tôi có thể tiến hành xóa những cột trùng lặp đó khỏi tập dữ liệu của mình.

Bạn sẽ tìm thấy một nút ở cuối hộp thoại “Xóa các bản sao” có nhãn “Xóa các bản sao”. Bấm vào nút này.

Sau khi nhấp vào “Xóa trùng lặp”, Google Trang tính sẽ xử lý yêu cầu của bạn. Các cột sẽ được quét và mọi hàng có giá trị trùng lặp trong các cột đó sẽ bị xóa, loại bỏ trùng lặp thành công.

Màn hình bật lên xác nhận các giá trị trùng lặp đã bị xóa khỏi bảng. Nó cho thấy hai hàng trùng lặp đã được tìm thấy và xóa, để lại bảng có tám mục duy nhất.

Sau khi sử dụng tính năng “Remove Duplicates”, bảng của chúng ta được cập nhật như sau:

Một lưu ý quan trọng cần xem xét ở đây là việc loại bỏ các bản sao bằng tính năng này là một hành động vĩnh viễn. Các hàng trùng lặp sẽ bị xóa khỏi tập dữ liệu của bạn và bạn sẽ không thể hoàn tác hành động này trừ khi bạn có bản sao lưu dữ liệu. Vì vậy, hãy đảm bảo bạn đã chọn đúng cột để tìm các cột trùng lặp bằng cách kiểm tra kỹ lựa chọn của mình.

Phương pháp 2: Sử dụng hàm UNIQUE để loại bỏ các bản sao

Phương pháp thứ hai chúng ta sẽ thảo luận ở đây là sử dụng ĐỘC NHẤT chức năng trong Google Trang tính. Các ĐỘC NHẤT hàm truy xuất các giá trị riêng biệt từ một phạm vi hoặc cột dữ liệu được chỉ định. Mặc dù nó không trực tiếp loại bỏ các bản sao khỏi dữ liệu gốc nhưng nó tạo ra một danh sách các giá trị duy nhất mà bạn có thể sử dụng để chuyển đổi hoặc phân tích dữ liệu mà không bị trùng lặp.

Hãy tạo một ví dụ để hiểu phương pháp này.
Chúng ta sẽ sử dụng bảng đã được tạo trong phần đầu của hướng dẫn này. Như chúng ta đã biết, bảng chứa một số dữ liệu nhất định bị trùng lặp. Vì vậy, chúng tôi đã chọn ô “E2” để viết ĐỘC NHẤT công thức vào. Công thức chúng tôi đã viết như sau:

= ĐỘC ĐÁO(A2:A11)

Khi được sử dụng trong Google Trang tính, công thức UNIQUE truy xuất các giá trị duy nhất trong một cột riêng biệt. Vì vậy, chúng tôi đã cung cấp cho công thức này một phạm vi từ ô A2 ĐẾN A11 , sẽ được áp dụng trong cột A. Do đó, công thức này trích xuất các giá trị duy nhất từ ​​cột MỘT và hiển thị chúng trong cột nơi công thức đã được viết.

Công thức sẽ được áp dụng cho phạm vi được chỉ định khi bạn nhấn phím Enter.

Trong ảnh chụp nhanh này, chúng ta có thể thấy hai ô trống. Điều này là do hai giá trị đã được nhân đôi trong bảng, đó là John và Emily. Các ĐỘC NHẤT hàm chỉ hiển thị một phiên bản duy nhất của mỗi giá trị.

Phương pháp này không loại bỏ các giá trị trùng lặp trực tiếp khỏi cột được chỉ định mà tạo một cột khác để cung cấp cho chúng tôi các mục nhập duy nhất của cột đó, loại bỏ các giá trị trùng lặp.

Phần kết luận

Loại bỏ các bản sao trong Google Trang tính là một phương pháp hữu ích để phân tích dữ liệu. Hướng dẫn này đã trình bày hai phương pháp cho phép bạn dễ dàng xóa các mục nhập trùng lặp khỏi dữ liệu của mình. Phương pháp đầu tiên giải thích việc sử dụng Google Trang tính để loại bỏ tính năng trùng lặp. Phương pháp này quét phạm vi ô được chỉ định và loại bỏ các ô trùng lặp. Phương pháp khác mà chúng ta đã thảo luận là sử dụng công thức để truy xuất các giá trị trùng lặp. Mặc dù nó không trực tiếp loại bỏ các bản sao khỏi phạm vi nhưng thay vào đó nó hiển thị các giá trị duy nhất trong một cột mới.