Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiênĐề 5 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên Đăng vào 2 Tháng 5, 2026 bởi admin Đề 5 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên Đề 5 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên Số câu30Quiz ID13290 Làm bài Câu 1 1. Transformer networks, kiến trúc nền tảng của BERT và GPT, nổi bật nhờ cơ chế: A A. Convolutional Neural Network (CNN). B B. Recurrent Neural Network (RNN). C C. Attention mechanism (cơ chế chú ý). D D. Support Vector Machine (SVM). Câu 2 2. Vấn đề 'ambiguity' (đa nghĩa) trong NLP đề cập đến: A A. Khả năng của ngôn ngữ tự nhiên có nhiều cách diễn đạt cùng một ý. B B. Việc máy tính không thể hiểu được ngôn ngữ của con người. C C. Việc một từ hoặc cụm từ có thể có nhiều hơn một nghĩa. D D. Sự khác biệt giữa ngôn ngữ nói và ngôn ngữ viết. Câu 3 3. Phương pháp 'backpropagation' (lan truyền ngược) được sử dụng trong huấn luyện mạng nơ-ron cho NLP để: A A. Tiền xử lý dữ liệu văn bản. B B. Tính toán và cập nhật trọng số của mạng để giảm thiểu lỗi dự đoán. C C. Tối ưu hóa tốc độ xử lý của mạng. D D. Trực quan hóa kết quả của mô hình. Câu 4 4. Trong NLP, 'n-gram' là gì? A A. Một loại mô hình mạng nơ-ron. B B. Một chuỗi gồm n từ liên tiếp trong văn bản. C C. Một phương pháp đánh giá chất lượng bản dịch. D D. Một thuật toán phân tích cảm xúc. Câu 5 5. Để xử lý văn bản tiếng Việt hiệu quả, một bước tiền xử lý quan trọng thường được thực hiện là: A A. Loại bỏ dấu thanh. B B. Tách từ tiếng Việt (word segmentation). C C. Chuyển đổi chữ hoa thành chữ thường. D D. Loại bỏ số và ký tự đặc biệt. Câu 6 6. Kỹ thuật 'Part-of-Speech tagging' (POS tagging) gán nhãn cho mỗi từ trong câu dựa trên: A A. Ý nghĩa của từ trong ngữ cảnh. B B. Chức năng ngữ pháp của từ (ví dụ: danh từ, động từ, tính từ). C C. Tần suất xuất hiện của từ trong văn bản. D D. Cảm xúc mà từ đó thể hiện. Câu 7 7. Khái niệm 'zero-shot learning' trong NLP đề cập đến khả năng của mô hình: A A. Học từ dữ liệu không có nhãn. B B. Thực hiện nhiệm vụ mà không cần được huấn luyện trực tiếp trên nhiệm vụ đó. C C. Học nhanh chóng từ một lượng nhỏ dữ liệu. D D. Hoạt động hiệu quả trên các thiết bị có tài nguyên hạn chế. Câu 8 8. Thách thức lớn nhất khi áp dụng NLP cho ngôn ngữ tiếng Việt là: A A. Tiếng Việt không có bảng chữ cái. B B. Tiếng Việt là ngôn ngữ đơn âm tiết và giàu biến tố. C C. Tiếng Việt là ngôn ngữ phân tích tính, có nhiều từ ghép và biến thể ngữ pháp phức tạp. D D. Thiếu dữ liệu huấn luyện và tài nguyên ngôn ngữ tiếng Việt quy mô lớn. Câu 9 9. Trong lĩnh vực chatbot, 'dialogue management' (quản lý hội thoại) đảm nhiệm vai trò: A A. Nhận dạng giọng nói của người dùng. B B. Xác định ý định của người dùng. C C. Theo dõi trạng thái hội thoại và quyết định phản hồi phù hợp tiếp theo. D D. Tạo ra văn bản phản hồi tự nhiên. Câu 10 10. Công nghệ 'speech recognition' (nhận dạng giọng nói) là một phần quan trọng của NLP, tập trung vào: A A. Chuyển đổi văn bản thành giọng nói. B B. Phân tích ý nghĩa của văn bản. C C. Chuyển đổi giọng nói của con người thành văn bản. D D. Dịch giọng nói từ ngôn ngữ này sang ngôn ngữ khác. Câu 11 11. Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực khoa học máy tính tập trung vào: A A. Xây dựng các hệ thống cơ khí tự động hóa quy trình sản xuất. B B. Phát triển các thuật toán khai thác dữ liệu từ cơ sở dữ liệu quan hệ. C C. Giúp máy tính hiểu, diễn giải và tạo ra ngôn ngữ của con người. D D. Thiết kế giao diện người dùng trực quan cho các ứng dụng web. Câu 12 12. Ứng dụng nào sau đây KHÔNG phải là ứng dụng chính của NLP? A A. Chatbot hỗ trợ khách hàng. B B. Hệ thống nhận diện khuôn mặt. C C. Công cụ dịch máy. D D. Phần mềm kiểm tra chính tả và ngữ pháp. Câu 13 13. Nhiệm vụ 'Named Entity Recognition' (NER) trong NLP là: A A. Phân tích cảm xúc của văn bản. B B. Nhận diện và phân loại các thực thể có tên trong văn bản (ví dụ: tên người, tổ chức, địa điểm). C C. Tóm tắt nội dung chính của văn bản. D D. Dịch văn bản sang ngôn ngữ khác. Câu 14 14. Đánh giá 'Perplexity' thường được sử dụng để đo lường hiệu suất của: A A. Mô hình phân loại văn bản. B B. Mô hình ngôn ngữ. C C. Mô hình nhận dạng thực thể có tên. D D. Mô hình dịch máy. Câu 15 15. Phương pháp nào sau đây thường được sử dụng để xử lý 'out-of-vocabulary' (OOV) words (từ không có trong từ vựng) trong NLP? A A. Stemming. B B. Lemmatization. C C. Subword tokenization (ví dụ: Byte-Pair Encoding). D D. Stop word removal. Câu 16 16. Trong ngữ cảnh của chatbot, 'intent recognition' (nhận diện ý định) là quá trình: A A. Tạo ra phản hồi tự nhiên và phù hợp. B B. Xác định mục đích hoặc ý định của người dùng thông qua câu hỏi hoặc lệnh của họ. C C. Chuyển đổi văn bản thành giọng nói. D D. Phân tích cảm xúc của người dùng. Câu 17 17. Trong đánh giá hệ thống sinh văn bản (text generation), 'ROUGE score' tập trung vào đo lường: A A. Tính mạch lạc của văn bản sinh ra. B B. Độ đa dạng của từ vựng sử dụng. C C. Mức độ trùng lặp của n-gram giữa văn bản sinh ra và văn bản tham khảo. D D. Tính chính xác ngữ pháp của văn bản sinh ra. Câu 18 18. Trong lĩnh vực đạo đức NLP, vấn đề 'bias' (thiên kiến) trong dữ liệu huấn luyện có thể dẫn đến: A A. Mô hình hoạt động kém hiệu quả hơn. B B. Mô hình đưa ra các dự đoán không công bằng hoặc phân biệt đối xử với một số nhóm người. C C. Mô hình khó diễn giải kết quả hơn. D D. Mô hình yêu cầu nhiều tài nguyên tính toán hơn. Câu 19 19. Mô hình ngôn ngữ (language model) trong NLP được sử dụng để: A A. Phân tích cấu trúc ngữ pháp của câu. B B. Dự đoán xác suất xuất hiện của một chuỗi từ trong ngôn ngữ. C C. Biên dịch mã chương trình. D D. Tạo ra hình ảnh từ mô tả văn bản. Câu 20 20. Phương pháp 'back-translation' (dịch ngược) thường được sử dụng để: A A. Cải thiện tốc độ dịch máy. B B. Tăng cường dữ liệu huấn luyện cho dịch máy, đặc biệt là khi dữ liệu song ngữ hạn chế. C C. Đánh giá chất lượng bản dịch máy. D D. Tạo ra giao diện người dùng đa ngôn ngữ. Câu 21 21. Kỹ thuật 'lemmatization' khác với 'stemming' ở điểm nào? A A. Lemmatization nhanh hơn stemming. B B. Lemmatization cho ra gốc từ có nghĩa (lemma), trong khi stemming có thể tạo ra gốc từ không có nghĩa. C C. Stemming sử dụng từ điển, còn lemmatization sử dụng quy tắc. D D. Stemming chính xác hơn lemmatization. Câu 22 22. Kỹ thuật 'stemming' trong NLP nhằm mục đích: A A. Tìm ra gốc từ của một từ bằng cách loại bỏ các hậu tố và tiền tố. B B. Thay thế từ bằng từ đồng nghĩa. C C. Phân loại văn bản theo chủ đề. D D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác. Câu 23 23. Trong NLP, 'tokenization' là quá trình: A A. Biến đổi văn bản thành giọng nói. B B. Phân chia văn bản thành các đơn vị nhỏ hơn, ví dụ như từ hoặc cụm từ. C C. Gán nhãn ngữ pháp cho từng từ trong câu. D D. Loại bỏ các từ dừng (stop words) khỏi văn bản. Câu 24 24. Trong dịch máy, 'BLEU score' là một độ đo đánh giá: A A. Tốc độ dịch. B B. Độ trôi chảy của bản dịch. C C. Độ tương đồng giữa bản dịch máy và bản dịch tham khảo của con người. D D. Khả năng hiểu ngữ cảnh của mô hình dịch. Câu 25 25. Trong ngữ cảnh của hệ thống hỏi đáp (Question Answering - QA), 'context window' (cửa sổ ngữ cảnh) đề cập đến: A A. Thời gian phản hồi của hệ thống. B B. Số lượng câu hỏi được xử lý đồng thời. C C. Phần văn bản xung quanh vị trí câu trả lời tiềm năng mà mô hình xem xét. D D. Giao diện người dùng của hệ thống QA. Câu 26 26. Trong phân tích cảm xúc (sentiment analysis), mục tiêu chính là: A A. Xác định chủ đề chính của văn bản. B B. Đánh giá mức độ tích cực, tiêu cực hoặc trung lập của văn bản đối với một chủ đề cụ thể. C C. Phân loại văn bản theo thể loại (ví dụ: tin tức, bài đánh giá, blog). D D. Tìm kiếm thông tin liên quan trong văn bản. Câu 27 27. Phương pháp 'word embeddings' (ví dụ Word2Vec, GloVe) biểu diễn từ ngữ dưới dạng: A A. Các quy tắc ngữ pháp. B B. Các vector số trong không gian nhiều chiều. C C. Các cây cú pháp. D D. Các biểu đồ quan hệ giữa các từ. Câu 28 28. Mục tiêu của 'topic modeling' (mô hình hóa chủ đề) trong NLP là: A A. Phân loại văn bản theo cảm xúc. B B. Khám phá các chủ đề ẩn chứa trong một tập hợp văn bản. C C. Tóm tắt nội dung chính của văn bản. D D. Dịch văn bản sang ngôn ngữ khác. Câu 29 29. Ưu điểm chính của việc sử dụng 'stop word removal' (loại bỏ từ dừng) trong tiền xử lý văn bản là: A A. Tăng độ chính xác của phân tích cú pháp. B B. Giảm kích thước dữ liệu và tăng tốc độ xử lý. C C. Cải thiện khả năng dịch máy. D D. Làm cho văn bản dễ đọc hơn đối với con người. Câu 30 30. Thuật toán 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để: A A. Phân tích cú pháp của câu. B B. Tính toán tầm quan trọng của một từ trong một tài liệu so với một tập hợp tài liệu. C C. Tạo ra word embeddings. D D. Phân loại văn bản theo chủ đề. Đề 4 – Bài tập, đề thi trắc nghiệm online Bảo hiểm trong thương mại quốc tế Đề 6 – Bài tập, đề thi trắc nghiệm online Quản trị chất lượng