Đề thi, bài tập trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanhĐề 6 – Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh Đăng vào 2 Tháng 5, 2026 bởi admin Đề 6 – Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh Đề 6 – Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh Số câu30Quiz ID12481 Làm bài Câu 1 1. Chỉ số đánh giá mô hình phân loại nào đo lường tỷ lệ dự đoán đúng các trường hợp dương tính thực sự trên tổng số trường hợp được dự đoán là dương tính? A A. Độ chính xác (Accuracy) B B. Độ thu hồi (Recall) C C. Độ chuẩn xác (Precision) D D. F1-score Câu 2 2. Khái niệm 'feature engineering' (kỹ thuật tạo đặc trưng) trong Khoa học dữ liệu đề cập đến điều gì? A A. Quá trình chọn lựa thuật toán học máy phù hợp nhất. B B. Quá trình làm sạch dữ liệu bị thiếu hoặc nhiễu. C C. Quá trình tạo ra các biến mới hoặc biến đổi các biến hiện có để cải thiện hiệu suất mô hình. D D. Quá trình trực quan hóa dữ liệu để trình bày kết quả phân tích. Câu 3 3. Mô hình học máy nào sau đây phù hợp nhất cho bài toán dự đoán giá nhà dựa trên các đặc điểm như diện tích, vị trí và số phòng ngủ? A A. Phân loại Logistic B B. Cây quyết định phân loại C C. Hồi quy tuyến tính D D. K-Means Clustering Câu 4 4. Công cụ lập trình nào phổ biến nhất trong cộng đồng Khoa học dữ liệu kinh tế và kinh doanh? A A. Java B B. C++ C C. Python D D. Assembly Câu 5 5. Đâu là một thách thức đạo đức quan trọng liên quan đến việc sử dụng thuật toán AI trong tuyển dụng nhân sự? A A. Tăng tốc độ quá trình tuyển dụng. B B. Giảm chi phí tuyển dụng. C C. Thuật toán có thể vô tình duy trì hoặc khuếch đại sự thiên vị giới tính hoặc chủng tộc. D D. Cải thiện tính khách quan tuyệt đối trong quá trình đánh giá ứng viên. Câu 6 6. Ưu điểm chính của việc sử dụng Khoa học dữ liệu trong kinh doanh là gì? A A. Giảm chi phí nhân công B B. Tăng cường khả năng ra quyết định dựa trên dữ liệu C C. Loại bỏ hoàn toàn sự cần thiết của kinh nghiệm và trực giác D D. Đơn giản hóa mọi quy trình kinh doanh Câu 7 7. Trong kinh doanh, 'churn rate' (tỷ lệ khách hàng rời bỏ) thường được dự đoán bằng kỹ thuật học máy nào? A A. Phân tích hồi quy B B. Phân loại (Classification) C C. Phân tích chuỗi thời gian D D. Giảm chiều dữ liệu Câu 8 8. Phương pháp nào sau đây có thể giúp giảm thiểu vấn đề 'đa cộng tuyến' (multicollinearity) trong mô hình hồi quy? A A. Tăng kích thước mẫu dữ liệu. B B. Loại bỏ một trong các biến độc lập có tương quan cao. C C. Sử dụng mô hình cây quyết định. D D. Chuẩn hóa dữ liệu (data normalization). Câu 9 9. Trong các giai đoạn của quy trình Khoa học dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và tích hợp dữ liệu thô? A A. Thu thập dữ liệu B B. Chuẩn bị dữ liệu C C. Phân tích dữ liệu D D. Triển khai mô hình Câu 10 10. Công cụ nào thường được sử dụng để trực quan hóa dữ liệu trong Python? A A. Pandas B B. NumPy C C. Matplotlib và Seaborn D D. Scikit-learn Câu 11 11. Trong bối cảnh đạo đức của Khoa học dữ liệu, 'bias' (thiên vị) trong thuật toán có thể dẫn đến hậu quả gì trong kinh doanh? A A. Tăng cường sự công bằng và minh bạch trong quyết định kinh doanh. B B. Cải thiện hiệu suất mô hình và độ chính xác dự đoán. C C. Đưa ra các quyết định phân biệt đối xử hoặc không công bằng đối với một số nhóm người. D D. Giảm chi phí vận hành hệ thống Khoa học dữ liệu. Câu 12 12. Trong mô hình hóa dữ liệu, 'validation set' (tập kiểm chứng) được sử dụng để làm gì? A A. Huấn luyện mô hình học máy. B B. Đánh giá hiệu suất cuối cùng của mô hình sau khi huấn luyện. C C. Tinh chỉnh siêu tham số (hyperparameters) của mô hình. D D. Thu thập dữ liệu mới. Câu 13 13. Loại hình phân tích dữ liệu nào tập trung vào việc tìm hiểu 'điều gì đã xảy ra' trong quá khứ? A A. Phân tích mô tả (Descriptive Analytics) B B. Phân tích dự đoán (Predictive Analytics) C C. Phân tích quy định (Prescriptive Analytics) D D. Phân tích chẩn đoán (Diagnostic Analytics) Câu 14 14. Trong lĩnh vực Marketing, Khoa học dữ liệu được sử dụng để cá nhân hóa trải nghiệm khách hàng bằng cách nào? A A. Tăng giá sản phẩm cho tất cả khách hàng. B B. Gửi email marketing hàng loạt giống nhau cho tất cả khách hàng. C C. Phân tích hành vi và sở thích của khách hàng để cung cấp sản phẩm và thông điệp phù hợp. D D. Giảm ngân sách marketing tổng thể. Câu 15 15. Đâu KHÔNG phải là một ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực tài chính? A A. Phát hiện gian lận giao dịch B B. Định giá tài sản và quản lý rủi ro C C. Tối ưu hóa chuỗi cung ứng sản xuất D D. Phân tích danh mục đầu tư Câu 16 16. Đâu là một ví dụ về dữ liệu 'phi cấu trúc' (unstructured data) thường được sử dụng trong Khoa học dữ liệu kinh doanh? A A. Dữ liệu giao dịch bán hàng trong cơ sở dữ liệu quan hệ. B B. Bảng thống kê kinh tế vĩ mô. C C. Bài đăng trên mạng xã hội và đánh giá sản phẩm trực tuyến. D D. Dữ liệu nhân khẩu học khách hàng trong file CSV. Câu 17 17. Trong lĩnh vực quản lý chuỗi cung ứng, Khoa học dữ liệu có thể được sử dụng để làm gì? A A. Tăng chi phí vận chuyển hàng hóa. B B. Dự đoán nhu cầu và tối ưu hóa tồn kho. C C. Làm chậm quá trình sản xuất. D D. Giảm chất lượng sản phẩm. Câu 18 18. Phương pháp thống kê nào thường được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập trong kinh tế lượng và Khoa học dữ liệu? A A. Phân tích phương sai (ANOVA) B B. Phân tích hồi quy (Regression Analysis) C C. Kiểm định t-test D D. Phân tích thành phần chính (PCA) Câu 19 19. Trong Khoa học dữ liệu, 'ensemble methods' (phương pháp kết hợp) như Random Forest và Gradient Boosting hoạt động dựa trên nguyên tắc nào? A A. Sử dụng một mô hình học máy duy nhất rất mạnh. B B. Kết hợp dự đoán của nhiều mô hình học máy yếu hơn để tạo ra mô hình mạnh hơn. C C. Giảm chiều dữ liệu trước khi huấn luyện mô hình. D D. Tăng cường tính giải thích của mô hình học máy. Câu 20 20. Phương pháp nào sau đây KHÔNG thuộc về học máy có giám sát (supervised learning)? A A. Hồi quy tuyến tính B B. Cây quyết định phân loại C C. Phân cụm K-Means D D. Mạng nơ-ron (Neural Networks) cho phân loại Câu 21 21. Đâu là thách thức chính khi làm việc với dữ liệu lớn (Big Data) trong kinh tế và kinh doanh? A A. Sự thiếu hụt các công cụ phần mềm phân tích dữ liệu. B B. Đảm bảo chất lượng dữ liệu và xử lý độ phức tạp của dữ liệu. C C. Chi phí thu thập dữ liệu quá thấp. D D. Khó khăn trong việc tìm kiếm nhân sự có kỹ năng thống kê cơ bản. Câu 22 22. Trong phân tích chuỗi thời gian (time series analysis), thành phần nào KHÔNG phải là thành phần chính của chuỗi thời gian? A A. Xu hướng (Trend) B B. Tính mùa vụ (Seasonality) C C. Tính ngẫu nhiên (Randomness) D D. Tính chủ quan (Subjectivity) Câu 23 23. Kỹ thuật học máy nào phù hợp để phát hiện các giao dịch gian lận thẻ tín dụng? A A. Phân tích thành phần chính (PCA) B B. Phát hiện dị thường (Anomaly Detection) C C. Phân tích hồi quy tuyến tính D D. Phân cụm K-Means Câu 24 24. Kỹ thuật phân tích dữ liệu nào thường được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm của họ? A A. Hồi quy tuyến tính B B. Phân cụm (Clustering) C C. Phân tích chuỗi thời gian D D. Kiểm định giả thuyết Câu 25 25. Trong ngữ cảnh Khoa học dữ liệu kinh doanh, 'A/B testing' (thử nghiệm A/B) được sử dụng chủ yếu cho mục đích gì? A A. Dự báo xu hướng thị trường tổng thể. B B. Đánh giá hiệu quả của hai phiên bản khác nhau của một yếu tố kinh doanh (ví dụ: trang web, quảng cáo). C C. Phân tích cấu trúc chi phí của doanh nghiệp. D D. Xác định rủi ro tín dụng của khách hàng. Câu 26 26. Phương pháp nào sau đây được sử dụng để xử lý dữ liệu bị thiếu (missing data)? A A. Phân tích tương quan B B. Điền giá trị trung bình (Mean Imputation) C C. Phân tích hồi quy D D. Phân tích thành phần chính Câu 27 27. Đâu là một ví dụ về ứng dụng của xử lý ngôn ngữ tự nhiên (NLP) trong kinh doanh? A A. Dự đoán giá cổ phiếu. B B. Phân tích cảm xúc từ phản hồi của khách hàng. C C. Phân cụm khách hàng theo nhân khẩu học. D D. Phát hiện gian lận thẻ tín dụng. Câu 28 28. Mục tiêu của việc giảm chiều dữ liệu (dimensionality reduction) trong Khoa học dữ liệu là gì? A A. Tăng số lượng biến trong tập dữ liệu. B B. Giảm số lượng biến trong tập dữ liệu trong khi vẫn giữ được thông tin quan trọng. C C. Tăng tốc độ thu thập dữ liệu. D D. Cải thiện độ chính xác của dữ liệu đầu vào. Câu 29 29. Đâu là định nghĩa chính xác nhất về Khoa học dữ liệu trong bối cảnh kinh tế và kinh doanh? A A. Một lĩnh vực chỉ tập trung vào việc thu thập và lưu trữ dữ liệu lớn. B B. Một ngành khoa học nghiên cứu về lập trình máy tính và phát triển phần mềm. C C. Một lĩnh vực liên ngành sử dụng các phương pháp khoa học để trích xuất kiến thức và insights giá trị từ dữ liệu nhằm hỗ trợ quyết định kinh tế và kinh doanh. D D. Một tập hợp các công cụ phần mềm để tạo báo cáo và trực quan hóa dữ liệu. Câu 30 30. Trong Khoa học dữ liệu, khái niệm 'overfitting' (quá khớp) mô tả tình huống nào? A A. Mô hình học máy hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra. B B. Mô hình học máy hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra mới. C C. Mô hình học máy hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra. D D. Mô hình học máy không thể học được từ dữ liệu huấn luyện. Đề 5 – Bài tập, đề thi trắc nghiệm online Định giá bất động sản Đề 7 – Bài tập, đề thi trắc nghiệm online Kế toán tài chính 2