Cách tạo khung dữ liệu trống R

Cach Tao Khung Du Lieu Trong R



Việc tạo một DataFrame trống trong R có thể thuận lợi khi chúng ta muốn điền dữ liệu vào nó sau này. Trong R, một DataFrame trống thường có 0 hàng và 0 cột. Tuy nhiên, một DataFrame trống đôi khi có thể là một DataFrame không có hàng nhưng có các cột đã được xác định. Chúng ta có thể sử dụng hàm data.frame() để tạo một DataFrame trống với các cột được chỉ định trong R. Có nhiều cách tiếp cận khác nhau để tạo một khung dữ liệu trống trong R. Trong bài viết này, chúng ta sẽ khám phá các cách tiếp cận để tạo một DataFrame trống trong R.

Ví dụ 1: Tạo DataFrame trống trong R

Cách tiếp cận cơ bản nhất để tạo DataFrame trống trong R là sử dụng phương thức data.frame().

trống_df < - khung dữ liệu ( )
in ( trống_df )
lờ mờ ( trống_df )

Trong mã đã cho của R, chúng ta tạo một hàm data.frame() bên trong empty_df. Hàm data.frame() không nhận đối số để tạo một khung dữ liệu không có hàng và không có cột. Khi chúng ta in empty_df bằng hàm print(), chúng ta sẽ nhận được đầu ra của DataFrame trống. Sau đó, chúng ta chuyển empty_df trong hàm dim() để lấy kích thước của khung dữ liệu dưới dạng một vectơ có hai giá trị: số hàng và số cột tương ứng.







Do đó, kết quả đầu tiên hiển thị thông báo rằng DataFrame có cột “0” và hàng “0”. Ngoài ra, chúng tôi nhận được một vectơ gồm hai số không vì DataFrame không có hàng và không có cột.





Ví dụ 2: Tạo một Khung dữ liệu trống với Cột và Hàng “0” trong R

Một cách khác để tạo DataFrame trống là sử dụng hàm matrix() rồi chuyển đổi nó thành DataFrame. Như vậy, cả hàm ma trận và DataFrame đều có thể chuyển đổi lẫn nhau.





m1 = ma trận ( ncol = 0 , nrow = 0 )
m1 = ma trận ( ncol = 0 , nrow = 0 )
df =data.frame ( m1 )
in ( 'Khung dữ liệu trống' )
in ( df )
in ( 'Kích thước khung dữ liệu' )
lờ mờ ( df )

Trong mã đã cho của R, trước tiên chúng ta gọi hàm matrix() trong “m1” và sau đó xác định matrix() bằng cách chuyển các tham số “ncol” và “nrow”. Giá trị được gán cho các tham số này là “0”. Sau đó, chúng tôi sử dụng hàm data.frame() để chuyển đổi “m1” thành DataFrame. Kết quả của DataFrame đã chuyển đổi được in bằng chức năng in. Kích thước cũng được hiển thị cho DataFrame bằng hàm dim().

Do đó, đầu ra biểu thị thông báo của khung dữ liệu trống và kích thước vectơ bằng 0 cho Khung dữ liệu do ma trận trống.



Ví dụ 3: Tạo một Khung dữ liệu trống với N Cột trong R

Hơn nữa, chúng ta có thể tạo một DataFrame trống bằng cách chỉ định tên của cột bằng hàm c(). Xét đoạn mã sau của R:

cols = c ( 'tên' , 'tuổi' , 'điểm' )
df = data.frame ( ma trận ( thu hẹp lại = 0 , ncol = chiều dài ( cols ) ) )
colnames ( df ) = cols
in ( df )

Chúng tôi gọi hàm c() trong vectơ ký tự “cols”. Ở đây, hàm c() được chỉ định với ba tên cột. Sau đó, chúng ta tạo một ma trận trống có 0 hàng và cùng số cột với độ dài của vectơ cols trong hàm matrix() được gọi bên trong hàm data.frame().

Chúng tôi chuyển 'nrow' với giá trị 0 để tạo một ma trận trống. “ncol” được chỉ định với độ dài (cols) để tạo ma trận có cùng số cột với độ dài của vectơ “cols”. Sau đó, chúng tôi gán tên cột cho khung dữ liệu bằng cách sử dụng hàm “colnames()” và vectơ “cols”.

Như chúng ta có thể thấy, khung dữ liệu trống với ba tên cột như sau:

Ví dụ 4: Tạo một khung dữ liệu trống với một vectơ trống được gán cho các cột trong R

Ngoài các phương pháp trước đó, chúng ta có thể tạo một DataFrame trống bằng cách chỉ định các vectơ trống cho các cột và loại trừ các hàng. Hãy tập trung vào mã R sau để thực hiện điều này:

df < - khung dữ liệu ( c1 = gấp đôi ( ) ,
c2 = số nguyên ( ) ,
c3 = thừa số ( ) ,
c4 = logic ( ) ,
c5 = ký tự ( ) ,
chuỗiAsFactors = FALSE )
str ( df )

Chúng ta khai báo hàm data.frame() trước. Sau đó, chúng tôi xác định các loại dữ liệu khác nhau cho các cột khác nhau bên trong nó. Lưu ý rằng chúng tôi không chuyển đối số nào cho các hàm kiểu dữ liệu này để tạo các cột trống không có giá trị.

Hơn nữa, “stringsAsFactors” được đặt thành FALSE để ngăn R tự động chuyển đổi các cột ký tự thành các yếu tố. Sau đó, với hàm str(), cấu trúc của khung dữ liệu “df” được in bao gồm các loại dữ liệu của từng cột và số lượng hàng trong khung dữ liệu.

Đầu ra kết quả được hiển thị bên dưới khung dữ liệu trống với năm cột thuộc các loại dữ liệu khác nhau và không có hàng.

Ví dụ 5: Tạo một DataFrame trống từ một DataFrame hiện có trong R

Ngược lại, nếu chúng tôi có một DataFrame hiện có, chúng tôi có thể làm trống nó để tạo DataFrame trống. Chúng tôi cung cấp đoạn mã sau trong R cho việc này:

df < - khung dữ liệu (
ngáy ngủ = c ( 1 , 2 , 3 , 4 ) ,
tên =c ( 'Alex' , 'Candice' , 'Jimmy' , 'Tối tăm' ) ,
tuổi =c ( hai mươi mốt , 24 , 25 , 26 )
)
emp_df = df [ SAI, ]
emp_df

Chúng tôi xác định DataFrame lấy các tên cột khác nhau với các loại giá trị khác nhau. Đáng chú ý, khung dữ liệu “df” chứa bốn hàng dữ liệu ở đây. Sau đó, chúng tôi khai báo một khung dữ liệu mới là “emp_df” bằng cách sử dụng chỉ mục logic, FALSE. Chỉ mục này không chọn hàng nào từ “df”. Do đó, Khung dữ liệu “emp_df” có cùng tên cột và kiểu dữ liệu với “df”.

Đầu ra sau hiển thị các cột, kiểu dữ liệu, cũng như số lượng hàng của khung dữ liệu. Vì khung dữ liệu không có hàng nào nên nó hiển thị các hàng có giá trị bằng không:

Ví dụ 6: Tạo một khung dữ liệu trống bằng phương thức Structure() trong R

Chúng ta có thể sử dụng hiệu quả phương thức structure() để tạo một khung dữ liệu trống. Chức năng này cung cấp thông tin chi tiết về một đối tượng nhất định với các tính năng cụ thể. Xem đoạn mã sau của R để tạo một khung dữ liệu trống bằng cách sử dụng hàm structure():

df < - kết cấu ( danh sách ( tên = ký tự ( ) ,
vị trí = nhân vật ( ) ,
ngày = as.Date ( tính cách ( ) ) ) ,
lớp = 'khung dữ liệu' )
str ( df )

Chúng tôi chỉ định tên của các cột chứa ký tự() và as.Date(character()) để tạo ký tự trống và vectơ ngày tương ứng. Các cột này được chuyển vào bên trong hàm list() chỉ định các giá trị ban đầu của các cột. Hàm structure() ở đây được sử dụng để tạo khung dữ liệu và gán nó với lớp 'data.frame'.

Đầu ra sau đây biểu thị khung dữ liệu có 0 quan sát và 3 biến, đồng thời cung cấp tên và kiểu dữ liệu của từng biến:

Phần kết luận

Hàm data.frame() được sử dụng để tạo DataFrame trống trong tất cả các ví dụ đã cho. Lần đầu tiên chúng tôi sử dụng hàm data.frame() không có tham số cho một DataFrame trống. Sau đó, chúng tôi đã tạo một DataFrame trống bằng cách chỉ định các hàng và cột có giá trị bằng không. Chúng tôi cũng đã chỉ định các cột có giá trị và hàng bằng 0, chỉ chỉ định các cột có giá trị và hàng bằng 0, đồng thời sử dụng vectơ trống. Cuối cùng, chúng tôi đã tạo DataFrame trống bằng cách sử dụng hàm structure().