Đề 2 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Số câu30

Quiz ID13287

Câu 1

1. Trong NLP, 'overfitting' (quá khớp) có thể xảy ra khi nào?

A A. Mô hình được huấn luyện trên dữ liệu quá lớn. B B. Mô hình học quá kỹ dữ liệu huấn luyện, dẫn đến hiệu suất kém trên dữ liệu mới. C C. Mô hình quá đơn giản và không đủ khả năng học các mẫu phức tạp. D D. Dữ liệu huấn luyện không đủ đa dạng.

Câu 2

2. Trong NLP, 'perplexity' là một thước đo đánh giá điều gì?

A A. Độ chính xác của việc phân loại văn bản. B B. Khả năng dự đoán từ tiếp theo của một mô hình ngôn ngữ (perplexity thấp hơn thì mô hình tốt hơn). C C. Tốc độ xử lý văn bản của mô hình. D D. Mức độ phức tạp của mô hình.

Câu 3

3. Mục đích của việc sử dụng 'n-grams' trong NLP là gì?

A A. Giảm kích thước dữ liệu văn bản. B B. Nắm bắt thông tin về trình tự từ bằng cách xem xét chuỗi n từ liên tiếp. C C. Phân tích cảm xúc của từng từ riêng lẻ. D D. Dịch văn bản theo từng từ.

Câu 4

4. Điều gì KHÔNG phải là một phương pháp đánh giá hiệu suất của mô hình dịch máy?

A A. BLEU (Bilingual Evaluation Understudy). B B. ROUGE (Recall-Oriented Understudy for Gisting Evaluation). C C. Perplexity. D D. METEOR (Metric for Evaluation of Translation with Explicit Ordering).

Câu 5

5. Phương pháp 'Bag of Words' biểu diễn văn bản như thế nào?

A A. Theo thứ tự xuất hiện của các từ trong văn bản. B B. Như một tập hợp các từ, bỏ qua thứ tự và chỉ đếm tần suất xuất hiện của mỗi từ. C C. Theo cấu trúc ngữ pháp của câu. D D. Dựa trên mối quan hệ ngữ nghĩa giữa các từ.

Câu 6

6. Khó khăn chính khi xử lý ngôn ngữ tự nhiên là gì?

A A. Tốc độ tính toán của máy tính quá chậm. B B. Sự mơ hồ và đa dạng của ngôn ngữ loài người (ví dụ: từ đồng âm, nghĩa bóng, ngữ cảnh). C C. Thiếu dữ liệu văn bản để huấn luyện mô hình. D D. Giao diện người dùng của các công cụ NLP quá phức tạp.

Câu 7

7. Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực khoa học máy tính tập trung vào điều gì?

A A. Phát triển phần cứng máy tính nhanh hơn. B B. Tương tác giữa máy tính và ngôn ngữ loài người. C C. Thiết kế cơ sở dữ liệu lớn. D D. Xây dựng hệ thống mạng phức tạp.

Câu 8

8. Trong NLP, 'tokenization' đề cập đến quá trình nào?

A A. Chuyển đổi văn bản thành giọng nói. B B. Phân chia văn bản thành các đơn vị nhỏ hơn như từ hoặc cụm từ. C C. Loại bỏ các từ dừng (stop words) khỏi văn bản. D D. Gán nhãn ngữ pháp cho các từ trong câu.

Câu 9

9. Điều gì KHÔNG phải là một ứng dụng của chatbot?

A A. Hỗ trợ khách hàng trực tuyến. B B. Điều khiển robot phẫu thuật. C C. Cung cấp thông tin và trả lời câu hỏi. D D. Thu thập phản hồi của người dùng.

Câu 10

10. Kỹ thuật 'Topic Modeling' (ví dụ: LDA) trong NLP được sử dụng để làm gì?

A A. Dự đoán từ tiếp theo trong câu. B B. Phát hiện các chủ đề ẩn trong một tập hợp văn bản. C C. Phân tích cảm xúc của văn bản. D D. Dịch văn bản sang ngôn ngữ khác.

Câu 11

11. Mô hình 'Transformer' đã cách mạng hóa NLP như thế nào?

A A. Giảm độ phức tạp tính toán của các mô hình NLP. B B. Cải thiện đáng kể hiệu suất trong nhiều tác vụ NLP, đặc biệt là dịch máy và sinh văn bản, nhờ cơ chế 'attention'. C C. Đơn giản hóa quá trình tiền xử lý dữ liệu. D D. Tăng cường khả năng nhận dạng hình ảnh trong NLP.

Câu 12

12. Mô hình 'Recurrent Neural Network' (RNN) thường được sử dụng trong NLP cho các tác vụ nào?

A A. Nhận dạng hình ảnh. B B. Xử lý dữ liệu chuỗi tuần tự như ngôn ngữ (ví dụ: dịch máy, sinh văn bản, phân tích cảm xúc). C C. Phân loại dữ liệu dạng bảng. D D. Dự báo thời tiết.

Câu 13

13. Mô hình ngôn ngữ (Language Model) trong NLP được sử dụng để làm gì?

A A. Phân loại hình ảnh. B B. Dự đoán xác suất xuất hiện của một chuỗi từ hoặc từ tiếp theo trong một câu. C C. Nhận dạng khuôn mặt. D D. Kiểm tra chính tả.

Câu 14

14. Mục tiêu chính của 'Named Entity Recognition' (NER) là gì?

A A. Phân tích cảm xúc của văn bản. B B. Xác định và phân loại các thực thể có tên trong văn bản (ví dụ: tên người, tổ chức, địa điểm). C C. Dịch văn bản sang ngôn ngữ khác. D D. Tóm tắt văn bản.

Câu 15

15. Phương pháp 'TF-IDF' được sử dụng để làm gì trong NLP?

A A. Phân tích cú pháp câu. B B. Đánh giá tầm quan trọng của từ trong một văn bản so với một tập hợp văn bản. C C. Dịch văn bản sang ngôn ngữ khác. D D. Tóm tắt văn bản.

Câu 16

16. Mục tiêu của 'Word Sense Disambiguation' (WSD) là gì?

A A. Dịch từ sang ngôn ngữ khác. B B. Xác định nghĩa đúng của một từ trong ngữ cảnh cụ thể, đặc biệt khi từ đó có nhiều nghĩa. C C. Loại bỏ các từ không quan trọng khỏi văn bản. D D. Tìm từ đồng nghĩa và trái nghĩa.

Câu 17

17. Trong ngữ cảnh của NLP, 'parsing' (phân tích cú pháp) là quá trình nào?

A A. Chuyển đổi văn bản thành âm thanh. B B. Phân tích cấu trúc ngữ pháp của câu để hiểu mối quan hệ giữa các từ. C C. Loại bỏ các từ không quan trọng khỏi văn bản. D D. Tìm kiếm các từ khóa trong văn bản.

Câu 18

18. Kỹ thuật 'Backpropagation' được sử dụng để làm gì trong huấn luyện mạng nơ-ron cho NLP?

A A. Tăng tốc độ xử lý dữ liệu. B B. Tính toán gradient của hàm mất mát (loss function) để cập nhật trọng số của mạng. C C. Làm sạch dữ liệu văn bản. D D. Chọn kiến trúc mạng nơ-ron phù hợp.

Câu 19

19. Ứng dụng nào sau đây thể hiện việc sử dụng NLP trong lĩnh vực chăm sóc sức khỏe?

A A. Tự động hóa dây chuyền sản xuất. B B. Phân tích bệnh án điện tử để cải thiện chẩn đoán và điều trị. C C. Quản lý kho hàng. D D. Dự báo thời tiết.

Câu 20

20. Ưu điểm chính của phương pháp 'Word Embeddings' (ví dụ: Word2Vec, GloVe) so với 'Bag of Words' là gì?

A A. Word Embeddings đơn giản và dễ tính toán hơn. B B. Word Embeddings nắm bắt được ý nghĩa ngữ nghĩa và mối quan hệ giữa các từ. C C. Bag of Words hiệu quả hơn trong việc xử lý văn bản dài. D D. Bag of Words giữ lại thứ tự của từ trong câu.

Câu 21

21. Kỹ thuật 'Sentiment Analysis' (phân tích cảm xúc) trong NLP nhằm mục đích gì?

A A. Dịch văn bản sang ngôn ngữ khác. B B. Xác định cảm xúc hoặc thái độ được thể hiện trong văn bản (ví dụ: tích cực, tiêu cực, trung lập). C C. Tóm tắt nội dung chính của văn bản. D D. Kiểm tra lỗi chính tả và ngữ pháp.

Câu 22

22. Công nghệ 'Speech Recognition' (nhận dạng giọng nói) liên quan mật thiết đến NLP như thế nào?

A A. Speech Recognition không liên quan đến NLP. B B. Speech Recognition sử dụng NLP để chuyển đổi giọng nói thành văn bản, sau đó văn bản có thể được xử lý bằng các kỹ thuật NLP khác. C C. Speech Recognition là một phần của Thị giác máy tính. D D. Speech Recognition chỉ tập trung vào âm thanh, không phải ngôn ngữ.

Câu 23

23. Phương pháp 'stemming' trong NLP có mục đích chính là gì?

A A. Tìm gốc của từ bằng cách loại bỏ hậu tố. B B. Phân tích ý nghĩa ngữ nghĩa của từ. C C. Dịch văn bản sang ngôn ngữ khác. D D. Tạo ra các từ đồng nghĩa.

Câu 24

24. Phương pháp 'Lemmatization' khác với 'Stemming' như thế nào?

A A. Lemmatization nhanh hơn Stemming. B B. Lemmatization đưa từ về dạng gốc có nghĩa (lemma), trong khi Stemming có thể tạo ra gốc từ không có nghĩa. C C. Stemming sử dụng từ điển, còn Lemmatization thì không. D D. Stemming chính xác hơn Lemmatization.

Câu 25

25. Trong bối cảnh NLP, 'context window' (cửa sổ ngữ cảnh) đề cập đến điều gì?

A A. Kích thước màn hình hiển thị văn bản. B B. Số lượng từ xung quanh từ mục tiêu được xem xét để hiểu ngữ cảnh của từ đó. C C. Thời gian cần thiết để xử lý một đoạn văn bản. D D. Kích thước bộ nhớ cần thiết để lưu trữ mô hình ngôn ngữ.

Câu 26

26. Thuật ngữ 'stop words' trong NLP dùng để chỉ điều gì?

A A. Các từ mang thông tin quan trọng nhất trong văn bản. B B. Các từ phổ biến nhưng thường ít mang lại giá trị thông tin ngữ nghĩa trong nhiều ngữ cảnh. C C. Các từ được sử dụng để dừng quá trình xử lý văn bản. D D. Các từ chỉ cảm xúc tiêu cực.

Câu 27

27. Ứng dụng của NLP trong lĩnh vực pháp lý bao gồm:

A A. Dự báo giá cổ phiếu. B B. Phân tích và tóm tắt văn bản pháp luật, hợp đồng, và bằng chứng. C C. Thiết kế giao diện người dùng. D D. Kiểm soát chất lượng sản phẩm.

Câu 28

28. Điều gì KHÔNG phải là một bước tiền xử lý văn bản phổ biến trong NLP?

A A. Tokenization. B B. Stemming/Lemmatization. C C. Nhận dạng khuôn mặt. D D. Loại bỏ stop words.

Câu 29

29. Công nghệ nào sau đây KHÔNG phải là một ứng dụng phổ biến của NLP?

A A. Chatbot. B B. Phân tích cảm xúc (Sentiment Analysis). C C. Nhận dạng hình ảnh (Image Recognition). D D. Dịch máy (Machine Translation).

Câu 30

30. Thách thức lớn nhất trong dịch máy (Machine Translation) là gì?

A A. Tốc độ xử lý của máy tính. B B. Duy trì ý nghĩa và sắc thái của ngôn ngữ gốc trong bản dịch. C C. Lưu trữ dữ liệu văn bản lớn. D D. Hiển thị văn bản trên màn hình.

Thời gian00:00

0/30 câu

Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Đề 2 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Đề 2 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Để lại một bình luận Hủy

Đề 2 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Để lại một bình luận Hủy

Lấy MÃ GIẢM GIÁ (Làm theo yêu cầu phía dưới và nhập câu trả lời để lấy Pass)