Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiênĐề 2 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên Đăng vào 2 Tháng 5, 2026 bởi admin Đề 2 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên Đề 2 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên Số câu30Quiz ID13287 Làm bài Câu 1 1. Trong NLP, 'overfitting' (quá khớp) có thể xảy ra khi nào? A A. Mô hình được huấn luyện trên dữ liệu quá lớn. B B. Mô hình học quá kỹ dữ liệu huấn luyện, dẫn đến hiệu suất kém trên dữ liệu mới. C C. Mô hình quá đơn giản và không đủ khả năng học các mẫu phức tạp. D D. Dữ liệu huấn luyện không đủ đa dạng. Câu 2 2. Trong NLP, 'perplexity' là một thước đo đánh giá điều gì? A A. Độ chính xác của việc phân loại văn bản. B B. Khả năng dự đoán từ tiếp theo của một mô hình ngôn ngữ (perplexity thấp hơn thì mô hình tốt hơn). C C. Tốc độ xử lý văn bản của mô hình. D D. Mức độ phức tạp của mô hình. Câu 3 3. Mục đích của việc sử dụng 'n-grams' trong NLP là gì? A A. Giảm kích thước dữ liệu văn bản. B B. Nắm bắt thông tin về trình tự từ bằng cách xem xét chuỗi n từ liên tiếp. C C. Phân tích cảm xúc của từng từ riêng lẻ. D D. Dịch văn bản theo từng từ. Câu 4 4. Điều gì KHÔNG phải là một phương pháp đánh giá hiệu suất của mô hình dịch máy? A A. BLEU (Bilingual Evaluation Understudy). B B. ROUGE (Recall-Oriented Understudy for Gisting Evaluation). C C. Perplexity. D D. METEOR (Metric for Evaluation of Translation with Explicit Ordering). Câu 5 5. Phương pháp 'Bag of Words' biểu diễn văn bản như thế nào? A A. Theo thứ tự xuất hiện của các từ trong văn bản. B B. Như một tập hợp các từ, bỏ qua thứ tự và chỉ đếm tần suất xuất hiện của mỗi từ. C C. Theo cấu trúc ngữ pháp của câu. D D. Dựa trên mối quan hệ ngữ nghĩa giữa các từ. Câu 6 6. Khó khăn chính khi xử lý ngôn ngữ tự nhiên là gì? A A. Tốc độ tính toán của máy tính quá chậm. B B. Sự mơ hồ và đa dạng của ngôn ngữ loài người (ví dụ: từ đồng âm, nghĩa bóng, ngữ cảnh). C C. Thiếu dữ liệu văn bản để huấn luyện mô hình. D D. Giao diện người dùng của các công cụ NLP quá phức tạp. Câu 7 7. Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực khoa học máy tính tập trung vào điều gì? A A. Phát triển phần cứng máy tính nhanh hơn. B B. Tương tác giữa máy tính và ngôn ngữ loài người. C C. Thiết kế cơ sở dữ liệu lớn. D D. Xây dựng hệ thống mạng phức tạp. Câu 8 8. Trong NLP, 'tokenization' đề cập đến quá trình nào? A A. Chuyển đổi văn bản thành giọng nói. B B. Phân chia văn bản thành các đơn vị nhỏ hơn như từ hoặc cụm từ. C C. Loại bỏ các từ dừng (stop words) khỏi văn bản. D D. Gán nhãn ngữ pháp cho các từ trong câu. Câu 9 9. Điều gì KHÔNG phải là một ứng dụng của chatbot? A A. Hỗ trợ khách hàng trực tuyến. B B. Điều khiển robot phẫu thuật. C C. Cung cấp thông tin và trả lời câu hỏi. D D. Thu thập phản hồi của người dùng. Câu 10 10. Kỹ thuật 'Topic Modeling' (ví dụ: LDA) trong NLP được sử dụng để làm gì? A A. Dự đoán từ tiếp theo trong câu. B B. Phát hiện các chủ đề ẩn trong một tập hợp văn bản. C C. Phân tích cảm xúc của văn bản. D D. Dịch văn bản sang ngôn ngữ khác. Câu 11 11. Mô hình 'Transformer' đã cách mạng hóa NLP như thế nào? A A. Giảm độ phức tạp tính toán của các mô hình NLP. B B. Cải thiện đáng kể hiệu suất trong nhiều tác vụ NLP, đặc biệt là dịch máy và sinh văn bản, nhờ cơ chế 'attention'. C C. Đơn giản hóa quá trình tiền xử lý dữ liệu. D D. Tăng cường khả năng nhận dạng hình ảnh trong NLP. Câu 12 12. Mô hình 'Recurrent Neural Network' (RNN) thường được sử dụng trong NLP cho các tác vụ nào? A A. Nhận dạng hình ảnh. B B. Xử lý dữ liệu chuỗi tuần tự như ngôn ngữ (ví dụ: dịch máy, sinh văn bản, phân tích cảm xúc). C C. Phân loại dữ liệu dạng bảng. D D. Dự báo thời tiết. Câu 13 13. Mô hình ngôn ngữ (Language Model) trong NLP được sử dụng để làm gì? A A. Phân loại hình ảnh. B B. Dự đoán xác suất xuất hiện của một chuỗi từ hoặc từ tiếp theo trong một câu. C C. Nhận dạng khuôn mặt. D D. Kiểm tra chính tả. Câu 14 14. Mục tiêu chính của 'Named Entity Recognition' (NER) là gì? A A. Phân tích cảm xúc của văn bản. B B. Xác định và phân loại các thực thể có tên trong văn bản (ví dụ: tên người, tổ chức, địa điểm). C C. Dịch văn bản sang ngôn ngữ khác. D D. Tóm tắt văn bản. Câu 15 15. Phương pháp 'TF-IDF' được sử dụng để làm gì trong NLP? A A. Phân tích cú pháp câu. B B. Đánh giá tầm quan trọng của từ trong một văn bản so với một tập hợp văn bản. C C. Dịch văn bản sang ngôn ngữ khác. D D. Tóm tắt văn bản. Câu 16 16. Mục tiêu của 'Word Sense Disambiguation' (WSD) là gì? A A. Dịch từ sang ngôn ngữ khác. B B. Xác định nghĩa đúng của một từ trong ngữ cảnh cụ thể, đặc biệt khi từ đó có nhiều nghĩa. C C. Loại bỏ các từ không quan trọng khỏi văn bản. D D. Tìm từ đồng nghĩa và trái nghĩa. Câu 17 17. Trong ngữ cảnh của NLP, 'parsing' (phân tích cú pháp) là quá trình nào? A A. Chuyển đổi văn bản thành âm thanh. B B. Phân tích cấu trúc ngữ pháp của câu để hiểu mối quan hệ giữa các từ. C C. Loại bỏ các từ không quan trọng khỏi văn bản. D D. Tìm kiếm các từ khóa trong văn bản. Câu 18 18. Kỹ thuật 'Backpropagation' được sử dụng để làm gì trong huấn luyện mạng nơ-ron cho NLP? A A. Tăng tốc độ xử lý dữ liệu. B B. Tính toán gradient của hàm mất mát (loss function) để cập nhật trọng số của mạng. C C. Làm sạch dữ liệu văn bản. D D. Chọn kiến trúc mạng nơ-ron phù hợp. Câu 19 19. Ứng dụng nào sau đây thể hiện việc sử dụng NLP trong lĩnh vực chăm sóc sức khỏe? A A. Tự động hóa dây chuyền sản xuất. B B. Phân tích bệnh án điện tử để cải thiện chẩn đoán và điều trị. C C. Quản lý kho hàng. D D. Dự báo thời tiết. Câu 20 20. Ưu điểm chính của phương pháp 'Word Embeddings' (ví dụ: Word2Vec, GloVe) so với 'Bag of Words' là gì? A A. Word Embeddings đơn giản và dễ tính toán hơn. B B. Word Embeddings nắm bắt được ý nghĩa ngữ nghĩa và mối quan hệ giữa các từ. C C. Bag of Words hiệu quả hơn trong việc xử lý văn bản dài. D D. Bag of Words giữ lại thứ tự của từ trong câu. Câu 21 21. Kỹ thuật 'Sentiment Analysis' (phân tích cảm xúc) trong NLP nhằm mục đích gì? A A. Dịch văn bản sang ngôn ngữ khác. B B. Xác định cảm xúc hoặc thái độ được thể hiện trong văn bản (ví dụ: tích cực, tiêu cực, trung lập). C C. Tóm tắt nội dung chính của văn bản. D D. Kiểm tra lỗi chính tả và ngữ pháp. Câu 22 22. Công nghệ 'Speech Recognition' (nhận dạng giọng nói) liên quan mật thiết đến NLP như thế nào? A A. Speech Recognition không liên quan đến NLP. B B. Speech Recognition sử dụng NLP để chuyển đổi giọng nói thành văn bản, sau đó văn bản có thể được xử lý bằng các kỹ thuật NLP khác. C C. Speech Recognition là một phần của Thị giác máy tính. D D. Speech Recognition chỉ tập trung vào âm thanh, không phải ngôn ngữ. Câu 23 23. Phương pháp 'stemming' trong NLP có mục đích chính là gì? A A. Tìm gốc của từ bằng cách loại bỏ hậu tố. B B. Phân tích ý nghĩa ngữ nghĩa của từ. C C. Dịch văn bản sang ngôn ngữ khác. D D. Tạo ra các từ đồng nghĩa. Câu 24 24. Phương pháp 'Lemmatization' khác với 'Stemming' như thế nào? A A. Lemmatization nhanh hơn Stemming. B B. Lemmatization đưa từ về dạng gốc có nghĩa (lemma), trong khi Stemming có thể tạo ra gốc từ không có nghĩa. C C. Stemming sử dụng từ điển, còn Lemmatization thì không. D D. Stemming chính xác hơn Lemmatization. Câu 25 25. Trong bối cảnh NLP, 'context window' (cửa sổ ngữ cảnh) đề cập đến điều gì? A A. Kích thước màn hình hiển thị văn bản. B B. Số lượng từ xung quanh từ mục tiêu được xem xét để hiểu ngữ cảnh của từ đó. C C. Thời gian cần thiết để xử lý một đoạn văn bản. D D. Kích thước bộ nhớ cần thiết để lưu trữ mô hình ngôn ngữ. Câu 26 26. Thuật ngữ 'stop words' trong NLP dùng để chỉ điều gì? A A. Các từ mang thông tin quan trọng nhất trong văn bản. B B. Các từ phổ biến nhưng thường ít mang lại giá trị thông tin ngữ nghĩa trong nhiều ngữ cảnh. C C. Các từ được sử dụng để dừng quá trình xử lý văn bản. D D. Các từ chỉ cảm xúc tiêu cực. Câu 27 27. Ứng dụng của NLP trong lĩnh vực pháp lý bao gồm: A A. Dự báo giá cổ phiếu. B B. Phân tích và tóm tắt văn bản pháp luật, hợp đồng, và bằng chứng. C C. Thiết kế giao diện người dùng. D D. Kiểm soát chất lượng sản phẩm. Câu 28 28. Điều gì KHÔNG phải là một bước tiền xử lý văn bản phổ biến trong NLP? A A. Tokenization. B B. Stemming/Lemmatization. C C. Nhận dạng khuôn mặt. D D. Loại bỏ stop words. Câu 29 29. Công nghệ nào sau đây KHÔNG phải là một ứng dụng phổ biến của NLP? A A. Chatbot. B B. Phân tích cảm xúc (Sentiment Analysis). C C. Nhận dạng hình ảnh (Image Recognition). D D. Dịch máy (Machine Translation). Câu 30 30. Thách thức lớn nhất trong dịch máy (Machine Translation) là gì? A A. Tốc độ xử lý của máy tính. B B. Duy trì ý nghĩa và sắc thái của ngôn ngữ gốc trong bản dịch. C C. Lưu trữ dữ liệu văn bản lớn. D D. Hiển thị văn bản trên màn hình. Đề 1 – Bài tập, đề thi trắc nghiệm online Bảo hiểm trong thương mại quốc tế Đề 3 – Bài tập, đề thi trắc nghiệm online Quản trị chất lượng