Trắc nghiệm Tin học KHMT 12 cánh diềuTrắc nghiệm Khoa học máy tính 12 Cánh diều bài 4: Thực hành phân tích dữ liệu Đăng vào 3 Tháng 5, 2026 bởi admin Trắc nghiệm Khoa học máy tính 12 Cánh diều bài 4: Thực hành phân tích dữ liệu Trắc nghiệm Khoa học máy tính 12 Cánh diều bài 4: Thực hành phân tích dữ liệu Số câu25Quiz ID43977 Làm bài Câu 1 Biểu đồ nào sau đây thường được sử dụng nhất để quan sát sự thay đổi của một đại lượng theo thời gian? A Biểu đồ tròn (Pie chart) B Biểu đồ đường (Line chart) C Biểu đồ hộp (Box plot) D Biểu đồ nhiệt (Heatmap) Câu 2 Biểu đồ hình cột (Bar chart) phù hợp nhất cho loại dữ liệu nào sau đây? A Dữ liệu liên tục theo thời gian B Mối tương quan giữa hai biến số C So sánh các giá trị giữa các danh mục khác nhau D Tỷ lệ phần trăm của các thành phần trong một tổng thể Câu 3 Để xem 5 hàng cuối cùng của một DataFrame, ta sử dụng phương thức nào? A head() B end() C last() D tail() Câu 4 Để tính giá trị trung bình cộng của một cột dữ liệu số trong DataFrame, ta sử dụng phương thức nào? A average() B mean() C median() D sum() Câu 5 Trong pandas, lệnh 'df['TenCot'].isnull().sum()' dùng để làm gì? A Đếm số lượng giá trị duy nhất trong cột 'TenCot' B Tính tổng các giá trị trong cột 'TenCot' C Đếm số lượng giá trị bị trống trong cột 'TenCot' D Xóa các giá trị trống trong cột 'TenCot' Câu 6 Thư viện nào trong ngôn ngữ lập trình Python thường được sử dụng nhất để xử lý và phân tích dữ liệu dạng bảng? A math B turtle C pandas D random Câu 7 Để lọc ra những học sinh có điểm trung bình lớn hơn 8.0 từ một DataFrame 'df' có cột 'DiemTB', cú pháp nào sau đây là đúng? A df[DiemTB > 8.0] B df.filter(DiemTB > 8.0) C df[df['DiemTB'] > 8.0] D df.where('DiemTB' > 8.0) Câu 8 Dữ liệu dị biệt (outliers) trong phân tích dữ liệu là gì? A Những giá trị nằm rất xa so với phần còn lại của tập dữ liệu B Những giá trị bị thiếu trong bảng C Những giá trị xuất hiện nhiều nhất trong cột D Những giá trị trùng lặp giữa các hàng Câu 9 Lệnh 'df.shape' trong pandas trả về thông tin gì? A Tổng số ô dữ liệu có trong bảng B Kích thước của bảng dữ liệu (số hàng, số cột) C Dung lượng bộ nhớ mà bảng dữ liệu chiếm dụng D Danh sách tên của tất cả các cột Câu 10 Khi muốn lưu DataFrame đã xử lý xong ra một tệp CSV mới để sử dụng sau này, lệnh nào được sử dụng? A save_csv() B export_csv() C to_csv() D write_csv() Câu 11 Trong bài thực hành phân tích dữ liệu, việc đổi tên cột (rename) thường được thực hiện nhằm mục đích gì? A Làm cho mã nguồn chạy nhanh hơn B Giúp tên cột rõ nghĩa, dễ hiểu và thuận tiện cho việc truy xuất trong mã lập trình C Để bảo mật thông tin dữ liệu gốc D Để tự động sắp xếp lại thứ tự các cột Câu 12 Khi phân tích dữ liệu, mục đích của việc sử dụng phương thức 'describe()' trong pandas là gì? A Xóa các hàng có giá trị trống B Đổi tên các cột trong bảng C Xem tóm tắt các thông số thống kê mô tả của các cột số D Vẽ biểu đồ phân tán giữa hai biến Câu 13 Để xác định các giá trị dị biệt một cách trực quan, loại biểu đồ nào sau đây là hữu ích nhất? A Biểu đồ đường (Line chart) B Biểu đồ tròn (Pie chart) C Biểu đồ hộp (Box plot) D Biểu đồ cột chồng (Stacked bar chart) Câu 14 Khái niệm 'Exploratory Data Analysis' (EDA) có nghĩa là gì? A Phân tích dữ liệu để dự báo tương lai B Phân tích dữ liệu khám phá để hiểu cấu trúc và đặc điểm cơ bản C Lưu trữ dữ liệu vào các máy chủ từ xa D Mã hóa dữ liệu để bảo mật Câu 15 Biểu đồ phân tán (Scatter plot) được sử dụng để làm gì? A Để xem phân bổ tần suất của một biến duy nhất B Để so sánh tỷ trọng của các nhóm C Để tìm hiểu mối quan hệ hoặc sự tương quan giữa hai biến số D Để liệt kê danh sách các giá trị duy nhất trong cột Câu 16 Trong quy trình thực hành phân tích dữ liệu, bước nào được thực hiện ngay sau khi dữ liệu đã được thu thập và nạp vào hệ thống? A Báo cáo kết quả B Làm sạch và chuẩn hóa dữ liệu C Trực quan hóa dữ liệu bằng biểu đồ D Xây dựng mô hình dự báo Câu 17 Trong bài thực hành, thao tác 'df.drop_duplicates()' có tác dụng gì đối với DataFrame 'df'? A Xóa toàn bộ dữ liệu trong bảng B Loại bỏ các hàng có dữ liệu trùng lặp hoàn toàn C Sắp xếp lại thứ tự các hàng D Tạo ra một bản sao của bảng dữ liệu Câu 18 Mục đích chính của việc 'nhóm dữ liệu' (grouping) trong thực hành phân tích dữ liệu là gì? A Để vẽ biểu đồ phân tán nhanh hơn B Để chia nhỏ tập dữ liệu thành các phần riêng biệt C Để tính toán các đại lượng thống kê trên từng phân lớp dữ liệu cụ thể D Để giảm dung lượng lưu trữ của tệp dữ liệu Câu 19 Phương thức nào trong thư viện pandas được sử dụng để hiển thị một số hàng đầu tiên của DataFrame nhằm kiểm tra dữ liệu? A head() B tail() C show() D display() Câu 20 Nếu một cột dữ liệu chứa các giá trị như 'Nam', 'nam', 'NAM', bước làm sạch dữ liệu cần thực hiện điều gì? A Xóa tất cả các hàng này vì dữ liệu bị lỗi B Giữ nguyên vì chúng đều có nghĩa giống nhau C Chuẩn hóa về cùng một định dạng nhất quán (ví dụ: 'Nam') D Chuyển đổi chúng sang dạng số ngẫu nhiên Câu 21 Mục đích chính của việc trực quan hóa dữ liệu trong quá trình phân tích là gì? A Để trang trí cho báo cáo thêm đẹp mắt B Để giúp người dùng dễ dàng nhận ra các xu hướng, quy luật và điểm bất thường C Để thay thế hoàn toàn cho các phép tính thống kê D Để giảm kích thước tệp dữ liệu gốc Câu 22 Phương thức nào dùng để lấy thông tin tổng quan về số lượng hàng, cột và kiểu dữ liệu của mỗi cột trong DataFrame? A describe() B info() C structure() D shape() Câu 23 Trong pandas, phương thức nào được dùng để sắp xếp dữ liệu theo giá trị của một hoặc nhiều cột? A arrange() B order_by() C sort_values() D reorder() Câu 24 Tại sao việc kiểm tra kiểu dữ liệu (data types) của các cột lại quan trọng trong bước làm sạch dữ liệu? A Để tiết kiệm bộ nhớ RAM khi chạy chương trình B Để đảm bảo các cột chứa số không bị nhầm thành chuỗi ký tự dẫn đến sai lệch khi tính toán C Để tự động xóa bỏ các hàng có dữ liệu lạ D Để chuyển đổi toàn bộ dữ liệu về dạng chữ in hoa Câu 25 Để xử lý các giá trị bị thiếu (NaN) trong DataFrame bằng cách thay thế chúng bằng một giá trị cụ thể, ta dùng phương thức nào? A dropna() B fillna() C replace_nan() D fix_missing() Trắc nghiệm Khoa học máy tính 12 Cánh diều bài 3: Giới thiệu về khoa học dữ liệu (tiếp theo) Trắc nghiệm Khoa học máy tính 12 Cánh diều bài 1: Mô phỏng được sử dụng trong nhiều lĩnh vực