Đề thi, bài tập trắc nghiệm online Nguyên lý thống kêĐề 8 – Bài tập, đề thi trắc nghiệm online Nguyên lý thống kê Đăng vào 2 Tháng 5, 2026 bởi admin Đề 8 – Bài tập, đề thi trắc nghiệm online Nguyên lý thống kê Đề 8 – Bài tập, đề thi trắc nghiệm online Nguyên lý thống kê Số câu30Quiz ID15618 Làm bài Câu 1 1. Trong phân tích dữ liệu lớn (Big Data), thách thức 'tính biến đổi' (variability) đề cập đến điều gì? A A. Số lượng dữ liệu khổng lồ. B B. Tốc độ tạo ra dữ liệu rất nhanh. C C. Sự đa dạng về loại và nguồn dữ liệu. D D. Sự không nhất quán và thay đổi của dữ liệu theo thời gian hoặc giữa các nguồn. Câu 2 2. Kiểm định Chi-bình phương (Chi-squared test) thường được sử dụng để kiểm định điều gì? A A. Trung bình của một tổng thể. B B. Phương sai của một tổng thể. C C. Sự độc lập giữa hai biến định tính hoặc sự phù hợp của dữ liệu với một phân phối lý thuyết. D D. Mối quan hệ tuyến tính giữa hai biến định lượng. Câu 3 3. 'Hồi quy tuyến tính đa biến' (multiple linear regression) khác với 'hồi quy tuyến tính đơn biến' (simple linear regression) ở điểm nào? A A. Hồi quy đa biến chỉ sử dụng dữ liệu định tính. B B. Hồi quy đa biến có nhiều biến phụ thuộc. C C. Hồi quy đa biến có nhiều biến độc lập. D D. Hồi quy đơn biến không sử dụng phương trình đường thẳng. Câu 4 4. Loại thang đo nào cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm 0 tuyệt đối? A A. Định danh (Nominal). B B. Thứ bậc (Ordinal). C C. Khoảng (Interval). D D. Tỷ lệ (Ratio). Câu 5 5. Mục tiêu chính của 'khai phá dữ liệu' (data mining) là gì? A A. Thu thập dữ liệu từ nhiều nguồn khác nhau. B B. Làm sạch và chuẩn hóa dữ liệu. C C. Phát hiện các mẫu, quy luật, và thông tin hữu ích ẩn chứa trong dữ liệu lớn. D D. Trình bày dữ liệu một cách trực quan. Câu 6 6. Giá trị trung bình cộng (mean) bị ảnh hưởng nhiều nhất bởi: A A. Số lượng quan sát. B B. Độ lệch chuẩn. C C. Giá trị ngoại lai (outliers). D D. Vị trí trung tâm của dữ liệu. Câu 7 7. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì? A A. Mỗi phần tử trong tổng thể có cơ hội được chọn vào mẫu như nhau. B B. Mẫu thu được chắc chắn đại diện cho tổng thể. C C. Giảm thiểu sai số lấy mẫu hoàn toàn. D D. Chỉ chọn những phần tử dễ tiếp cận nhất. Câu 8 8. Phương pháp 'bootstrap' trong thống kê được sử dụng để làm gì? A A. Tăng kích thước mẫu ban đầu. B B. Ước tính phân phối lấy mẫu của một thống kê bằng cách lấy mẫu lại có hoàn lại từ mẫu ban đầu. C C. Kiểm định giả thuyết về trung bình tổng thể. D D. Phân tích phương sai giữa các nhóm. Câu 9 9. Histogram thường được sử dụng để biểu diễn loại dữ liệu nào? A A. Dữ liệu định tính (qualitative). B B. Dữ liệu định lượng liên tục (continuous quantitative). C C. Dữ liệu định lượng rời rạc (discrete quantitative) với ít giá trị. D D. Dữ liệu thứ bậc (ordinal). Câu 10 10. Phân phối nhị thức (binomial distribution) mô tả điều gì? A A. Xác suất của các sự kiện liên tục. B B. Số lần thành công trong một số lượng cố định các phép thử độc lập Bernoulli. C C. Thời gian giữa các sự kiện. D D. Phân phối của trung bình mẫu. Câu 11 11. Thống kê mô tả tập trung vào việc: A A. Đưa ra kết luận về tổng thể dựa trên mẫu. B B. Trình bày và tóm tắt dữ liệu. C C. Dự đoán các giá trị tương lai. D D. Xây dựng mô hình toán học cho dữ liệu. Câu 12 12. Trong thống kê Bayes, 'xác suất tiên nghiệm' (prior probability) là gì? A A. Xác suất được tính toán từ dữ liệu mẫu. B B. Xác suất ban đầu về một giả thuyết hoặc tham số trước khi xem xét dữ liệu. C C. Xác suất sau khi đã cập nhật thông tin từ dữ liệu mẫu. D D. Xác suất của dữ liệu mẫu. Câu 13 13. Mức ý nghĩa (significance level) alpha (α) trong kiểm định giả thuyết thể hiện điều gì? A A. Xác suất mắc lỗi loại II. B B. Xác suất bác bỏ giả thuyết không khi nó thực sự đúng (lỗi loại I). C C. Xác suất chấp nhận giả thuyết không khi nó thực sự sai (lỗi loại II). D D. Xác suất giả thuyết không là đúng. Câu 14 14. Phân phối Poisson mô tả điều gì? A A. Xác suất của các sự kiện liên tục. B B. Số lần thành công trong một số lượng cố định các phép thử. C C. Số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định. D D. Phân phối của trung bình mẫu. Câu 15 15. Hệ số tương quan (correlation coefficient) đo lường điều gì? A A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng. B B. Mức độ phân tán của dữ liệu. C C. Giá trị trung bình của hai biến. D D. Sự khác biệt giữa hai biến. Câu 16 16. Phân tích ANOVA (Analysis of Variance) được sử dụng để làm gì? A A. Đo lường mối quan hệ giữa hai biến định lượng. B B. So sánh trung bình của hai nhóm. C C. So sánh trung bình của ba hoặc nhiều nhóm. D D. Dự đoán giá trị của một biến dựa trên biến khác. Câu 17 17. Trong kiểm định giả thuyết, 'giả thuyết không' (null hypothesis) thường biểu thị điều gì? A A. Điều mà nhà nghiên cứu mong muốn chứng minh. B B. Một tuyên bố mặc định hoặc không có hiệu ứng/khác biệt. C C. Một giả thuyết luôn đúng. D D. Một giả thuyết chỉ áp dụng cho mẫu chứ không phải tổng thể. Câu 18 18. Giá trị p (p-value) trong kiểm định giả thuyết là gì? A A. Xác suất giả thuyết không là đúng. B B. Xác suất quan sát được kết quả cực đoan như kết quả mẫu (hoặc cực đoan hơn) nếu giả thuyết không là đúng. C C. Xác suất mắc lỗi loại I. D D. Xác suất mắc lỗi loại II. Câu 19 19. Khoảng tin cậy (confidence interval) cung cấp thông tin gì? A A. Giá trị chính xác của tham số tổng thể. B B. Một khoảng giá trị mà chúng ta tin rằng tham số tổng thể có khả năng nằm trong đó, với một mức độ tin cậy nhất định. C C. Xác suất tham số tổng thể nằm trong khoảng ước lượng. D D. Độ lệch chuẩn của mẫu. Câu 20 20. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì? A A. Trung bình mẫu luôn bằng trung bình tổng thể. B B. Với kích thước mẫu đủ lớn, phân phối lấy mẫu của trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể hình dạng phân phối của tổng thể. C C. Độ lệch chuẩn của mẫu luôn bằng độ lệch chuẩn của tổng thể. D D. Mẫu lớn luôn tốt hơn mẫu nhỏ trong mọi trường hợp. Câu 21 21. Độ lệch chuẩn của mẫu (sample standard deviation) được sử dụng để ước tính điều gì? A A. Giá trị trung bình của tổng thể. B B. Độ lệch chuẩn của tổng thể. C C. Phương sai của mẫu. D D. Kích thước mẫu cần thiết. Câu 22 22. Phân phối chuẩn (normal distribution) có những đặc điểm chính nào? A A. Lệch trái, một đỉnh. B B. Đối xứng, hình chuông, một đỉnh, trung bình = trung vị = mốt. C C. Hai đỉnh, đối xứng. D D. Phẳng, đều. Câu 23 23. Khi nào nên sử dụng trung vị (median) thay vì trung bình cộng (mean) để đo lường xu hướng trung tâm? A A. Khi dữ liệu phân phối chuẩn. B B. Khi dữ liệu có giá trị ngoại lai. C C. Khi muốn tính tổng các giá trị. D D. Khi dữ liệu là định lượng liên tục. Câu 24 24. Phương sai (variance) đo lường điều gì? A A. Giá trị trung tâm của dữ liệu. B B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình. C C. Hình dạng phân phối của dữ liệu. D D. Mối quan hệ giữa hai biến số. Câu 25 25. Sai số chuẩn của trung bình mẫu (standard error of the mean) đo lường điều gì? A A. Độ lệch chuẩn của mẫu. B B. Độ biến động của trung bình mẫu giữa các mẫu khác nhau. C C. Sai số do đo lường không chính xác. D D. Kích thước mẫu cần thiết để đạt độ chính xác mong muốn. Câu 26 26. Lấy mẫu phân tầng (stratified sampling) phù hợp nhất khi nào? A A. Tổng thể đồng nhất. B B. Tổng thể có các nhóm con (strata) khác biệt rõ rệt. C C. Không cần tính đại diện của mẫu. D D. Chi phí lấy mẫu là yếu tố duy nhất cần xem xét. Câu 27 27. Sai số loại II (Type II error) xảy ra khi nào? A A. Bác bỏ giả thuyết không khi nó thực sự đúng. B B. Chấp nhận giả thuyết không khi nó thực sự sai. C C. Không đưa ra quyết định về giả thuyết không. D D. Chọn sai mức ý nghĩa alpha. Câu 28 28. Phân tích hồi quy (regression analysis) được sử dụng để: A A. Tóm tắt dữ liệu bằng đồ thị. B B. Dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập. C C. Kiểm định sự khác biệt giữa các nhóm. D D. Tính toán độ phân tán của dữ liệu. Câu 29 29. Biểu đồ hộp (boxplot) chủ yếu thể hiện thông tin gì về phân phối dữ liệu? A A. Tần số xuất hiện của mỗi giá trị. B B. Hình dạng phân phối (ví dụ: đối xứng, lệch). C C. Giá trị trung bình và độ lệch chuẩn. D D. Mối quan hệ giữa hai biến. Câu 30 30. Khi nào thì kiểm định phi tham số (non-parametric test) phù hợp hơn kiểm định tham số (parametric test)? A A. Khi dữ liệu tuân theo phân phối chuẩn. B B. Khi kích thước mẫu rất lớn. C C. Khi các giả định của kiểm định tham số (ví dụ: phân phối chuẩn) không được đáp ứng hoặc khi dữ liệu là thứ bậc (ordinal). D D. Khi muốn tăng độ mạnh của kiểm định. Đề 7 – Bài tập, đề thi trắc nghiệm online Thủ tục hải quan Đề 9 – Bài tập, đề thi trắc nghiệm online Phương pháp nghiên cứu khoa học