Kiến trúc hệ thống kho dữ liệu Amazon Redshift là gì?

Kien Truc He Thong Kho Du Lieu Amazon Redshift La Gi



Lưu trữ và quản lý dữ liệu trong cơ sở dữ liệu và kho dữ liệu luôn là một công việc bận rộn và rắc rối. Nó đòi hỏi rất nhiều tài nguyên và sức mạnh tính toán để hiểu được dữ liệu. Amazon Web Services có giải pháp toàn diện cho mục đích này. Nó có một dịch vụ tên là Amazon Redshift quản lý hoàn toàn kho dữ liệu của người dùng.

Bài viết này sẽ giải thích chi tiết về Amazon Redshift cùng với kiến ​​trúc kho dữ liệu của nó. Tất cả các thành phần trong kiến ​​trúc hệ thống kho dữ liệu của Redshift sẽ được giải thích chi tiết.







Amazon Redshift là gì?

CNTT là dịch vụ lưu trữ dữ liệu được cung cấp bởi Amazon. Nó quản lý và phân tích hiệu quả các tập dữ liệu lớn để phân tích và báo cáo. Nó được xây dựng trên mô hình lưu trữ cột. Nó sử dụng các cụm nút điện toán do nút chính kiểm soát để cung cấp khả năng xử lý dữ liệu hiệu suất cao.



Nó lấy dữ liệu từ nhiều nguồn khác nhau và gộp lại để tạo thành kho dữ liệu. Nó cung cấp các tính năng khác nhau, chẳng hạn như chia sẻ dữ liệu và phân tích thời gian thực. Xem hình ảnh bên dưới để hiểu các tính năng và khả năng của Amazon Redshift:







Bây giờ chúng ta hãy đi đến kiến ​​trúc hệ thống kho dữ liệu của nó.

Kiến trúc hệ thống kho dữ liệu Amazon Redshift là gì?

Kiến trúc hệ thống này có ba phần cốt lõi. Những phần này là:



  • Kho
  • Sự tăng tốc
  • tính toán

Hãy để chúng tôi hiểu mục đích của họ:

Kho
Phần lưu trữ đề cập đến các dịch vụ lưu trữ mà Redshift có. Nó có tùy chọn dịch vụ lưu trữ được quản lý riêng cũng như tùy chọn nhóm S3.

Sự tăng tốc
Phần tăng tốc phụ thuộc vào dịch vụ lưu trữ đang sử dụng và sức mạnh tính toán được sử dụng. Bộ nhớ do Redshift quản lý nhanh hơn so với các tùy chọn bộ nhớ khác

tính toán
Phần tính toán hoàn toàn đề cập đến sức mạnh tính toán đang được sử dụng. Việc tính toán được thực hiện với các cụm và cụm có các nút. Các nút lần lượt có các lát cắt.

Để hiểu rõ hơn tất cả các thành phần và thành phần của kiến ​​trúc này, hãy xem hình ảnh bên dưới:

Hãy để chúng tôi hiểu từng thành phần của nó.

Thành phần kiến ​​trúc của Amazon Redshift là gì?

Sau đây là các thành phần kiến ​​trúc của Amazon Redshift:

  • Cụm
  • Điểm giao
  • Lát nút
  • Kho
  • Mạng nội bộ
  • Cơ sở dữ liệu

Chúng ta hãy thảo luận từng điều một:

Cụm
Cụm là đơn vị cơ bản và cốt lõi. Nó bao gồm một số nút. Nếu một cụm bao gồm nhiều nút điện toán thì nút lãnh đạo bổ sung sẽ tham gia điều phối hoạt động của các nút điện toán này và quản lý giao tiếp bên ngoài.

Điểm giao

Các nút trong cụm có hai loại. Đó là:

  • Nút lãnh đạo
  • Nút tính toán

Chúng ta hãy hiểu những điều này một:

Nút lãnh đạo
Nó quản lý giao tiếp với các chương trình máy khách và điều phối các tương tác với các nút điện toán. Nút dẫn đầu đóng một vai trò quan trọng trong việc thực hiện các truy vấn phức tạp. Nó biên dịch mã dựa trên kế hoạch thực thi được phân phối đến các nút điện toán và gán các phần dữ liệu cho từng nút điện toán riêng lẻ.

Nút tính toán
Nút điện toán là xương sống của kiến ​​trúc Amazon Redshift. Họ thực hiện cả việc lưu trữ và xử lý dữ liệu. Chúng có các tài nguyên chuyên dụng, chẳng hạn như bộ nhớ và CPU.

Lát nút
Các nút tính toán được chia thành các lát. Các lát này hoạt động cùng nhau để xử lý khối lượng công việc được chỉ định và đạt được tính song song nhằm nâng cao khả năng xử lý truy vấn.

Kho
Việc lưu trữ dữ liệu trong Amazon Redshift được quản lý bởi “Redshift Managed Storage (RMS)”. Nó có khả năng mở rộng quy mô lưu trữ một cách độc lập bằng cách sử dụng bộ lưu trữ “Amazon S3”. RMS sử dụng bộ nhớ cục bộ dựa trên SSD hiệu suất cao làm bộ đệm cấp 1 giúp tối ưu hóa hiệu suất.

Mạng nội bộ
Mạng nội bộ này trong Amazon Redshift giúp liên lạc nhanh chóng và an toàn giữa các nút chính và nút điện toán. Mạng này không thể truy cập trực tiếp vào các ứng dụng khách.

Cơ sở dữ liệu
Các cụm có một hoặc nhiều cơ sở dữ liệu. Dữ liệu từ các cơ sở dữ liệu này nằm trên các nút điện toán. Các ứng dụng khách giao tiếp với nút dẫn đầu. Nút điện toán quản lý việc thực hiện truy vấn trên các nút điện toán.

Đây là tất cả về Amazon Redshift và các thành phần kiến ​​trúc của nó. Bài viết này đã giải thích toàn diện các thành phần hoạt động của Amazon Redshift

Phần kết luận

Kiến trúc của Amazon Redshift là lý do tạo nên khả năng của nó. Nút dẫn đầu kiểm soát và quản lý các nút điện toán và các lát nút giúp xử lý song song. Redshift Managed Storage sử dụng bộ lưu trữ dựa trên SSD để nâng cao hiệu suất. Bài viết này đã giải thích Kiến trúc hệ thống kho dữ liệu Amazon Redshift.