Cách làm việc với phân phối chuẩn trong MATLAB bằng fitdist

Cach Lam Viec Voi Phan Phoi Chuan Trong Matlab Bang Fitdist



Phân phối bình thường là một kỹ thuật thống kê được sử dụng rộng rãi trong trí tuệ nhân tạo, khoa học dữ liệu, học máy và nhiều lĩnh vực khác. Đây là phân bố xác suất đối xứng ở mức trung bình và còn được gọi là phân bố Gaussian do hình dạng mà nó tạo ra trên biểu đồ. Nó cho thấy rằng các giá trị dữ liệu gần với giá trị trung bình xảy ra thường xuyên hơn các giá trị dữ liệu ở xa giá trị trung bình. Trên đồ thị, phân phối chuẩn tạo thành một đường cong hình chuông.

Tìm phân phối chuẩn của tập dữ liệu không phải là một nhiệm vụ dễ dàng; tuy nhiên, chúng ta có thể thực hiện nó trong MATLAB bằng cách sử dụng fitdist() chức năng. Hãy đọc hướng dẫn này để tìm hiểu chi tiết về cách làm việc với phân phối bình thường trong MATLAB bằng cách sử dụng fitdist() chức năng.

Phân phối bình thường là gì

MỘT phân phối bình thường còn được gọi là phân phối Gaussian được xác định bằng hai tham số; giá trị trung bình và độ lệch chuẩn của các điểm dữ liệu. Giá trị trung bình đo lường mức trung bình của các giá trị dữ liệu, trong khi độ lệch chuẩn đo lường mức độ phân bổ các giá trị dữ liệu xung quanh giá trị trung bình. Với sự kết hợp của cả độ lệch trung bình và độ lệch chuẩn, chúng ta có thể tính được phân phối bình thường từ công thức sau:









Ở đâu:



  • x đại diện cho các giá trị tập dữ liệu.
  • f(x) đại diện cho hàm xác suất.
  • tôi biểu thị
  • P biểu thị độ lệch chuẩn.

Cách thực hiện phân phối chuẩn trong MATLAB bằng hàm fitdist()

MATLAB cho phép chúng ta tính toán phân phối bình thường của các biến ngẫu nhiên bằng cách sử dụng tích hợp fitdist() chức năng. Chức năng này tạo ra một phân bố xác suất chuẩn đối tượng bằng cách khớp phân phối đã cho với dữ liệu đầu vào. Các phân phối bình thường chấp nhận hai tham số làm đầu vào: độ lệch chuẩn cũng như giá trị trung bình. Phân phối chuẩn chuẩn có giá trị trung bình bằng 0 cũng như độ lệch chuẩn đơn vị là 1. Điều này có nghĩa là phân phối bình thường có tâm ở mức 0 và các giá trị của phân phối được trải đều ở cả hai phía của giá trị trung bình.





Cú pháp

Các fitdist() trong MATLAB có thể được sử dụng theo nhiều cách khác nhau:



pd = người thích hợp ( x , tên khác )
pd = người thích hợp ( x , tên khác , Tên , Giá trị )
pdca , gn , kính ] = người thích hợp ( x , tên khác , 'Qua' , nhómvar )

Đây:

  • Chức năng pd = fitdist(x,distname) chịu trách nhiệm khớp phân phối được cung cấp bởi distname với dữ liệu chứa trong vectơ cột x để tạo ra đối tượng phân phối xác suất.
  • Chức năng pd = fitdist(x,distname,Name,Value) chịu trách nhiệm xây dựng đối tượng phân phối xác suất với một hoặc nhiều đối số cặp tên-giá trị chỉ định các tham số bổ sung.
  • Chức năng [pdca,gn,gl] = fitdist(x,distname,’By’,groupvar) có nhiệm vụ khớp phân phối xác suất được xác định bởi distname với dữ liệu trong vectơ cột x dựa trên biến nhóm groupvar để tạo ra các đối tượng phân phối xác suất. Nó trả về một mảng ô chứa các đối tượng phân bố xác suất phù hợp, ký hiệu là pdca, một mảng ô gồm các nhãn nhóm, ký hiệu là gn, và một mảng ô chứa các mức biến nhóm, ký hiệu là gl.

Ví dụ 1: Cách tìm phân phối chuẩn bằng hàm fitdist(x,distname)

Ví dụ này phù hợp với một phân phối bình thường đến dữ liệu mẫu z bằng cách sử dụng fitdist() chức năng.

tải bệnh nhân
Với = Cân nặng ;
pd = người thích hợp ( Với , 'Bình thường' )

Ví dụ 2: Cách tìm phân phối chuẩn bằng fitdist(x,distname,Name,Value) Chức năng

Trong ví dụ này, chúng ta sẽ điều chỉnh phân phối Kernel cho dữ liệu mẫu bằng cách sử dụng fitdist() hàm trong MATLAB.

tải bệnh nhân
Với = Cân nặng ;
pd = người thích hợp ( Với , 'Hạt nhân' , 'Hạt nhân' , 'epanechnikov' )

Ví dụ 3: Cách tìm phân phối chuẩn bằng hàm fitdist(x,distname,’By’,groupvar)

Mã MATLAB được đưa ra dưới đây phù hợp phân phối bình thường đối với dữ liệu được nhóm, tính toán và vẽ biểu đồ pdf của cả hai nhóm dữ liệu.

tải bệnh nhân
Với = Cân nặng ;
[ pdca , gn , kính ] = người thích hợp ( Với , 'Bình thường' , 'Qua' , Giới tính )
nữ giới = pdca { 1 }
nam giới = pdca { 2 }
giá trị z_ = 80 : 1 : 220 ;
nữpdf = pdf ( nữ giới , giá trị z_ ) ;
nampdf = pdf ( nam giới , giá trị z_ ) ;
nhân vật
kịch bản ( giá trị z_ , nữpdf , 'Chiều rộng dòng' , 2 )
giữ lấy
kịch bản ( giá trị z_ , nampdf , 'Màu sắc' , 'r' , 'LineStyle' , ':' , 'Chiều rộng dòng' , 2 )
huyền thoại ( gn , 'Vị trí' , 'Đông Bắc' )
giữ lại

Phần kết luận

Tìm kiếm phân phối bình thường của tập dữ liệu là một kỹ thuật thống kê được sử dụng rộng rãi trong học máy, trí tuệ nhân tạo, khoa học dữ liệu và nhiều lĩnh vực khác. Nó có thể được xác định bằng hai tham số; giá trị trung bình cũng như độ lệch chuẩn của các điểm dữ liệu. Chúng ta có thể điều chỉnh tập dữ liệu trong phân phối bình thường đối tượng sử dụng fitdist() chức năng. Hướng dẫn này đã cung cấp những kiến ​​thức cơ bản về phân phối bình thường và cách làm việc với nó trong MATLAB bằng cách sử dụng fitdist() chức năng.