Trắc nghiệm Tin học KHMT 12 chân trời sáng tạoTrắc nghiệm Khoa học máy tính 12 Chân trời bài F15: Khoa học dữ liệu Đăng vào 3 Tháng 5, 2026 bởi admin Trắc nghiệm Khoa học máy tính 12 Chân trời bài F15: Khoa học dữ liệu Trắc nghiệm Khoa học máy tính 12 Chân trời bài F15: Khoa học dữ liệu Số câu25Quiz ID43941 Làm bài Câu 1 Lý do nào khiến dữ liệu phi cấu trúc ngày càng trở nên quan trọng? A Nó dễ xử lý hơn dữ liệu cấu trúc B Nó chiếm phần lớn lượng dữ liệu được tạo ra trên mạng xã hội và internet C Nó yêu cầu máy tính cấu hình thấp để chạy D Nó không cần phải lưu trữ Câu 2 Công việc nào sau đây là ứng dụng cụ thể của khoa học dữ liệu trong y tế? A Dự đoán xác suất bệnh dựa trên dữ liệu bệnh nhân B Thiết kế giường bệnh C Sửa chữa các máy siêu âm D Quản lý lương cho nhân viên y tế Câu 3 Khái niệm 'Feature Engineering' trong khoa học dữ liệu là gì? A Xây dựng các tính năng cho phần mềm ứng dụng B Quá trình tạo, lựa chọn và biến đổi các đặc trưng từ dữ liệu thô C Thiết kế phần cứng cho máy tính chạy mô hình D Việc quảng cáo tính năng sản phẩm Câu 4 Đâu là ngôn ngữ lập trình phổ biến nhất trong khoa học dữ liệu hiện nay? A HTML B Python C CSS D Assembly Câu 5 Trong khoa học dữ liệu, việc 'huấn luyện mô hình' là quá trình gì? A Nhập dữ liệu vào máy tính bằng tay B Điều chỉnh các tham số để mô hình khớp với dữ liệu huấn luyện C Việc xóa bỏ toàn bộ dữ liệu cũ D Tạo giao diện người dùng cho ứng dụng Câu 6 Dữ liệu cấu trúc khác với dữ liệu phi cấu trúc ở đặc điểm nào chính yếu? A Dữ liệu cấu trúc có định dạng xác định như bảng, hàng, cột B Dữ liệu cấu trúc khó lưu trữ hơn dữ liệu phi cấu trúc C Dữ liệu phi cấu trúc luôn có độ chính xác cao hơn D Dữ liệu phi cấu trúc chỉ tồn tại dưới dạng văn bản Câu 7 Tại sao việc chia tách tập dữ liệu thành huấn luyện và kiểm thử là bắt buộc? A Để làm cho chương trình chạy nhanh hơn B Để tránh hiện tượng quá khớp (overfitting) và đánh giá độ chính xác thực tế C Để giảm bớt dung lượng bộ nhớ sử dụng D Để làm cho quá trình huấn luyện đơn giản hơn Câu 8 Trong khoa học dữ liệu, tập dữ liệu được dùng để đánh giá mô hình sau khi huấn luyện thường được gọi là gì? A Tập huấn luyện B Tập dữ liệu thô C Tập kiểm thử D Tập dữ liệu giả định Câu 9 Phân tích dữ liệu mô tả (Descriptive Analysis) nhằm mục đích gì? A Dự báo tương lai xa B Tổng hợp và tóm tắt những gì đã xảy ra trong quá khứ C Đưa ra lời khuyên cho quyết định tương lai D Viết mã cho ứng dụng di động Câu 10 Tại sao việc trực quan hóa dữ liệu quan trọng đối với các nhà quản lý? A Vì nó giúp trang trí báo cáo thêm đẹp B Vì nó giúp đưa ra quyết định nhanh dựa trên thông tin tóm tắt trực quan C Vì nó giúp giảm số lượng dữ liệu cần quản lý D Vì nó bắt buộc phải thực hiện trong luật kinh doanh Câu 11 Phát biểu nào sau đây mô tả đúng về vai trò của Nhà khoa học dữ liệu? A Chỉ tập trung vào việc bảo trì phần cứng máy tính B Sử dụng các phương pháp thống kê và thuật toán để trích xuất tri thức từ dữ liệu C Chỉ thực hiện việc nhập liệu thủ công vào cơ sở dữ liệu D Chỉ làm nhiệm vụ thiết kế giao diện ứng dụng Câu 12 Việc chuẩn hóa dữ liệu (Data Normalization) có ý nghĩa gì? A Để làm cho dữ liệu có cùng thang đo, tránh sự áp đảo của các biến có giá trị lớn B Để xóa bỏ các dữ liệu trùng lặp C Để tăng tốc độ tải dữ liệu từ internet D Để thay đổi định dạng tệp từ Excel sang Word Câu 13 Mục đích chính của việc làm sạch dữ liệu trong khoa học dữ liệu là gì? A Tăng dung lượng lưu trữ cho hệ thống B Loại bỏ các nhiễu, giá trị sai lệch và dữ liệu thiếu C Tự động hóa việc phân loại khách hàng D Rút ngắn thời gian truy vấn dữ liệu Câu 14 Trong bối cảnh khoa học dữ liệu, 'nhiễu' (noise) là gì? A Thông tin hữu ích giúp phân tích B Các dữ liệu sai lệch hoặc không liên quan làm giảm chất lượng mô hình C Kết quả dự báo của mô hình D Tốc độ xử lý của máy tính Câu 15 Đâu là một ứng dụng phổ biến của khoa học dữ liệu trong thương mại điện tử? A Tự động thiết kế logo cho công ty B Hệ thống gợi ý sản phẩm phù hợp với sở thích khách hàng C Sửa chữa các lỗi phần cứng của máy chủ D Quản lý việc tuyển dụng nhân sự thủ công Câu 16 Trong lĩnh vực khoa học dữ liệu, hoạt động nào sau đây thường được thực hiện đầu tiên trong quy trình xử lý dữ liệu? A Thu thập dữ liệu B Trực quan hóa dữ liệu C Xây dựng mô hình dự báo D Đánh giá hiệu năng thuật toán Câu 17 Yếu tố nào sau đây là thách thức lớn nhất của dữ liệu lớn (Big Data)? A Sự đơn giản trong định dạng B Khối lượng, tốc độ tăng trưởng và sự đa dạng của dữ liệu C Tất cả dữ liệu đều nằm ở dạng văn bản đơn giản D Máy tính hiện nay đã xử lý tức thời mọi loại dữ liệu Câu 18 Một 'tập dữ liệu' (dataset) thường được coi là tốt khi nào? A Khi nó có kích thước càng nhỏ càng tốt B Khi nó có tính đại diện cao và chất lượng tin cậy C Khi nó hoàn toàn không chứa các con số D Khi nó chỉ gồm các hình ảnh Câu 19 Thông tin nào sau đây được coi là một ví dụ về dữ liệu cấu trúc? A Một tệp video ghi lại sự kiện B Danh sách nhân viên trong bảng tính với các cột: Họ tên, Tuổi, Chức vụ C Một bài đăng trên Facebook chưa có khuôn mẫu D Ghi âm giọng nói của khách hàng Câu 20 Thuật toán học máy (Machine Learning) chủ yếu hoạt động dựa trên cơ sở nào? A Hệ thống quy tắc do con người viết tay hoàn toàn B Khả năng học hỏi từ dữ liệu để tự cải thiện hiệu năng C Việc copy dữ liệu từ các máy tính khác D Ngẫu nhiên tạo ra các phản ứng dựa trên đầu vào Câu 21 Tại sao đạo đức dữ liệu lại quan trọng trong khoa học dữ liệu? A Để ngăn chặn việc máy tính bị hỏng hóc B Để đảm bảo quyền riêng tư và tránh sai lệch (bias) trong phân tích C Để làm cho phần mềm chạy nhanh hơn D Để tăng dung lượng ổ cứng Câu 22 Trong các mô hình khoa học dữ liệu, 'dự báo' (prediction) chủ yếu dựa vào yếu tố nào? A Ý kiến chủ quan của người lập trình B Các mẫu hình và xu hướng rút ra từ dữ liệu quá khứ C Sự ngẫu nhiên hoàn toàn của các con số D Việc giả định các tình huống không có cơ sở Câu 23 Khai phá dữ liệu (Data Mining) là quá trình gì? A Chỉ là việc xóa bỏ dữ liệu rác B Việc tìm kiếm các quy luật, tri thức ẩn giấu trong tập dữ liệu lớn C Quá trình nén dữ liệu để tiết kiệm bộ nhớ D Việc cập nhật hệ điều hành cho máy chủ Câu 24 Khái niệm nào mô tả việc chuyển đổi dữ liệu từ dạng thô sang dạng dễ hiểu hơn thông qua biểu đồ hoặc sơ đồ? A Khai phá dữ liệu B Trực quan hóa dữ liệu C Lưu trữ dữ liệu đám mây D Mã hóa dữ liệu Câu 25 Khi phân tích dữ liệu, việc xác định giá trị ngoại lệ (outlier) có ý nghĩa gì? A Để tăng độ phức tạp của bài toán B Để làm cho biểu đồ đẹp hơn C Để phát hiện các sai sót đo lường hoặc các trường hợp đặc biệt D Để giảm bớt số lượng dữ liệu phải xử lý Trắc nghiệm Khoa học máy tính 12 Chân trời bài F14: Học máy Trắc nghiệm Khoa học máy tính 12 Chân trời bài F16: Máy tính, thuật toán và Khoa học dữ liệu