Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)Đề 10 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData) Đăng vào 2 Tháng 5, 2026 bởi admin Đề 10 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData) Đề 10 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData) Số câu30Quiz ID13250 Làm bài Câu 1 1. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý lượng lớn dữ liệu phi cấu trúc trong môi trường Big Data? A A. Hệ quản trị cơ sở dữ liệu quan hệ (RDBMS). B B. Data Warehouse truyền thống. C C. Hadoop và HDFS. D D. Excel. Câu 2 2. Trong bối cảnh Big Data, thuật ngữ 'Schema-on-read' liên quan đến loại kho lưu trữ dữ liệu nào? A A. Data Warehouse. B B. Data Mart. C C. Data Lake. D D. Cơ sở dữ liệu quan hệ. Câu 3 3. Yếu tố 'Veracity' trong Big Data nhấn mạnh khía cạnh nào của dữ liệu? A A. Tính bảo mật của dữ liệu. B B. Tính biến động của dữ liệu. C C. Độ tin cậy và chất lượng của dữ liệu. D D. Giá trị kinh tế tiềm ẩn của dữ liệu. Câu 4 4. Data mining (khai phá dữ liệu) trong Big Data chủ yếu tập trung vào việc gì? A A. Thu thập và lưu trữ dữ liệu. B B. Trực quan hóa dữ liệu. C C. Tìm kiếm các mẫu, xu hướng và tri thức ẩn trong dữ liệu. D D. Đảm bảo chất lượng dữ liệu. Câu 5 5. Khái niệm 'Data wrangling' (chuẩn bị dữ liệu) trong Big Data bao gồm những công việc nào? A A. Phân tích dữ liệu và xây dựng mô hình. B B. Thu thập, làm sạch, chuyển đổi và định hình dữ liệu để phân tích. C C. Lưu trữ và quản lý cơ sở dữ liệu. D D. Bảo mật dữ liệu và kiểm soát truy cập. Câu 6 6. Lợi ích chính của việc sử dụng điện toán đám mây (cloud computing) trong Big Data là gì? A A. Tăng cường bảo mật dữ liệu. B B. Giảm chi phí đầu tư ban đầu vào hạ tầng phần cứng và phần mềm. C C. Tăng tốc độ xử lý dữ liệu cục bộ. D D. Đơn giản hóa việc quản lý cơ sở dữ liệu. Câu 7 7. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Big Data? A A. Phân tích hành vi khách hàng trong bán lẻ. B B. Dự báo thời tiết. C C. Quản lý cơ sở dữ liệu cá nhân trên máy tính đơn lẻ. D D. Phát hiện gian lận trong lĩnh vực tài chính. Câu 8 8. Yếu tố nào sau đây KHÔNG phải là một trong các thành phần chính của hệ sinh thái Hadoop? A A. HDFS (Hadoop Distributed File System). B B. MapReduce. C C. Spark. D D. MySQL. Câu 9 9. Công nghệ nào sau đây thường được sử dụng để trực quan hóa dữ liệu Big Data? A A. Hadoop. B B. Spark. C C. Tableau, Power BI. D D. Java. Câu 10 10. Phân tích 'Batch processing' và 'Stream processing' khác nhau như thế nào trong Big Data? A A. Batch processing xử lý dữ liệu theo thời gian thực, stream processing xử lý dữ liệu theo lô. B B. Batch processing xử lý dữ liệu lịch sử theo lô lớn, stream processing xử lý dữ liệu liên tục theo thời gian thực. C C. Batch processing nhanh hơn stream processing. D D. Stream processing chỉ áp dụng cho dữ liệu có cấu trúc, batch processing cho dữ liệu phi cấu trúc. Câu 11 11. Kiến trúc Lambda trong Big Data được thiết kế để giải quyết vấn đề nào? A A. Bảo mật dữ liệu. B B. Tốc độ và độ trễ trong xử lý dữ liệu. C C. Khả năng mở rộng lưu trữ. D D. Đa dạng hóa nguồn dữ liệu. Câu 12 12. Một thách thức về kỹ thuật khi xử lý Big Data là gì? A A. Sự thiếu hụt nhân lực có kỹ năng phân tích dữ liệu. B B. Khả năng mở rộng hệ thống để xử lý lượng dữ liệu ngày càng tăng. C C. Chi phí đầu tư vào phần mềm phân tích dữ liệu. D D. Quy định về bảo mật dữ liệu. Câu 13 13. Trong bối cảnh Big Data, 'Variety' ám chỉ điều gì? A A. Độ chính xác của dữ liệu. B B. Khả năng mở rộng của hệ thống. C C. Sự khác biệt về nguồn gốc dữ liệu. D D. Tính đa dạng của các loại dữ liệu (cấu trúc, bán cấu trúc, phi cấu trúc). Câu 14 14. Công cụ lập trình nào phổ biến cho việc xử lý và phân tích dữ liệu trong hệ sinh thái Hadoop? A A. SQL. B B. Java. C C. Python. D D. C++. Câu 15 15. Đặc điểm 'Volume' trong Big Data đề cập đến yếu tố nào? A A. Sự đa dạng của các loại dữ liệu. B B. Tốc độ tạo ra và xử lý dữ liệu. C C. Kích thước khổng lồ của dữ liệu. D D. Tính xác thực và đáng tin cậy của dữ liệu. Câu 16 16. Data Lake (hồ dữ liệu) khác với Data Warehouse (kho dữ liệu) ở điểm nào? A A. Data Lake lưu trữ dữ liệu đã được làm sạch và chuyển đổi (transformed), trong khi Data Warehouse lưu trữ dữ liệu thô. B B. Data Lake lưu trữ dữ liệu theo lược đồ (schema-on-write), trong khi Data Warehouse lưu trữ dữ liệu theo lược đồ khi đọc (schema-on-read). C C. Data Lake lưu trữ dữ liệu thô ở định dạng gốc, trong khi Data Warehouse lưu trữ dữ liệu đã được cấu trúc và làm sạch. D D. Data Lake chỉ dành cho dữ liệu có cấu trúc, còn Data Warehouse dành cho dữ liệu phi cấu trúc. Câu 17 17. Thách thức lớn nhất khi làm việc với Big Data thường là gì? A A. Sự thiếu hụt phần cứng máy tính. B B. Đảm bảo chất lượng và tính nhất quán của dữ liệu. C C. Chi phí mua phần mềm phân tích dữ liệu. D D. Sự phức tạp của việc cài đặt hệ điều hành. Câu 18 18. Một thách thức về mặt đạo đức khi sử dụng Big Data là gì? A A. Khả năng lưu trữ lượng lớn dữ liệu cá nhân. B B. Nguy cơ vi phạm quyền riêng tư và sử dụng dữ liệu cá nhân không đúng mục đích. C C. Sự phức tạp của các thuật toán phân tích dữ liệu. D D. Chi phí cao để thu thập dữ liệu. Câu 19 19. Thuật ngữ 'Velocity' trong Big Data liên quan mật thiết đến khái niệm nào sau đây? A A. Dữ liệu phi cấu trúc. B B. Xử lý dữ liệu theo thời gian thực. C C. Kho lưu trữ dữ liệu phân tán. D D. Phân tích dự đoán. Câu 20 20. Thuật ngữ 'Data Governance' trong Big Data đề cập đến điều gì? A A. Công nghệ lưu trữ dữ liệu. B B. Quy trình và chính sách quản lý dữ liệu, bao gồm chất lượng, bảo mật và tuân thủ. C C. Các phương pháp phân tích dữ liệu nâng cao. D D. Giao diện người dùng để truy vấn dữ liệu. Câu 21 21. Quy trình ETL (Extract, Transform, Load) thường được sử dụng trong bối cảnh nào của Big Data? A A. Phân tích dữ liệu thời gian thực. B B. Xây dựng mô hình học máy. C C. Di chuyển dữ liệu từ nhiều nguồn vào Data Warehouse. D D. Trực quan hóa dữ liệu. Câu 22 22. NoSQL (Not Only SQL) khác biệt với cơ sở dữ liệu quan hệ truyền thống (RDBMS) chủ yếu ở điểm nào? A A. Khả năng xử lý giao dịch ACID. B B. Mô hình dữ liệu linh hoạt, không theo lược đồ cố định. C C. Tính nhất quán dữ liệu mạnh mẽ. D D. Khả năng truy vấn dữ liệu phức tạp bằng SQL. Câu 23 23. Giá trị (Value) trong 5V của Big Data thể hiện điều gì? A A. Độ phức tạp của dữ liệu. B B. Khả năng trực quan hóa dữ liệu. C C. Lợi ích và thông tin hữu ích có thể khai thác từ dữ liệu. D D. Quy trình thu thập và lưu trữ dữ liệu. Câu 24 24. Khi nào thì nên sử dụng Data Warehouse thay vì Data Lake trong dự án Big Data? A A. Khi cần lưu trữ dữ liệu thô ở định dạng gốc. B B. Khi cần phân tích dữ liệu phi cấu trúc. C C. Khi yêu cầu báo cáo và phân tích có cấu trúc, tập trung vào dữ liệu đã được làm sạch và chuyển đổi. D D. Khi cần xử lý dữ liệu theo thời gian thực. Câu 25 25. Spark khác biệt với Hadoop MapReduce chủ yếu ở điểm nào? A A. Khả năng xử lý dữ liệu theo lô (batch processing). B B. Khả năng xử lý dữ liệu trong bộ nhớ (in-memory processing). C C. Khả năng lưu trữ dữ liệu phân tán. D D. Khả năng quản lý cụm máy tính. Câu 26 26. Một ví dụ về dữ liệu 'phi cấu trúc' trong Big Data là gì? A A. Dữ liệu trong bảng cơ sở dữ liệu quan hệ. B B. Dữ liệu JSON. C C. Hình ảnh và video. D D. Dữ liệu XML. Câu 27 27. Machine learning (học máy) được ứng dụng trong Big Data để làm gì? A A. Quản lý cơ sở dữ liệu. B B. Tối ưu hóa truy vấn SQL. C C. Xây dựng mô hình dự đoán và tự động hóa quyết định dựa trên dữ liệu. D D. Sao lưu và phục hồi dữ liệu. Câu 28 28. Trong lĩnh vực tài chính, Big Data thường được sử dụng để... A A. Quản lý giao dịch ngân hàng hàng ngày. B B. Phát hiện giao dịch gian lận và đánh giá rủi ro tín dụng. C C. In sao kê tài khoản. D D. Gửi thông báo SMS cho khách hàng. Câu 29 29. Phân tích 'Predictive analytics' (phân tích dự đoán) trong Big Data nhằm mục đích gì? A A. Mô tả dữ liệu hiện tại. B B. Dự đoán các sự kiện hoặc xu hướng trong tương lai. C C. Làm sạch và chuẩn hóa dữ liệu. D D. Trực quan hóa dữ liệu lịch sử. Câu 30 30. Trong lĩnh vực y tế, Big Data được ứng dụng để làm gì? A A. Quản lý hồ sơ bệnh án điện tử. B B. Phân tích dữ liệu di truyền để phát triển phương pháp điều trị cá nhân hóa. C C. Đặt lịch hẹn khám bệnh trực tuyến. D D. In hóa đơn thanh toán viện phí. Đề 9 – Bài tập, đề thi trắc nghiệm online WTO và các hiệp định thương mại song và đa phương Đề 11 – Bài tập, đề thi trắc nghiệm online Quản trị mạng