Mô hình học sâu hiệu quả trong nhận dạng thực thể từ văn bản tiếng Việt

: 08h30, ngày 10/06/2020 (Thứ Tư)

: P104 D3

: Machine Learning và Data Mining

: Nguyễn Ngọc Yến

: K60 Toán Tin

Tóm tắt báo cáo

Nghiên cứu này đưa ra một mô hình học sâu sử dụng mạng nơ ron để tiến hành nhận diện thực thể trong văn bản Tiếng Việt – một bài toán quan trọng trong lĩnh vực xử lý ngôn ngữ tự nhiên. Phương pháp thực hiện sử dụng mô hình Bi-LSTM (Bidirectional Long Short-Term Memory – Bộ nhớ chiều dài thay đổi hai chiều) kết hợp với CRF (Conditional Random Field – Trường ngẫu nhiên có điều kiện) tại đầu ra. Ngoài ra, việc biểu diễn véc tơ của các từ làm đầu vào cho các mô hình mạng Neural học sâu kể trên được thực hiện dựa vào mô hình Word2Vec kết hợp với đặc trưng về hình thái từ được trích ra từ Véc tơ đặc trưng (Character Embedding) bằng mạng Bi-LSTM, đồng thời là đặc trưng về ngữ nghĩa gồm POS-Tag (Part of Speech Tag) và Chunk-Tag. Kết quả cao nhất mô hình đạt được trên tập dữ liệu test từ cuộc thi VLSP 2016 là F1 bằng 95.61%. Qua nghiên cứu này, ta hiểu được cách thức vận hành của mạng nơ ron học sâu trong bài toán NER, đồng thời đưa ra được phương pháp mới cải thiện và nâng cao kết quả mô hình. Kết quả này sẽ được sử dụng làm đầu vào cho các bài toán lớn khác của Xử lý ngôn ngữ tự nhiên như Trích rút thông tin (IE),…


Đánh giá bài viết


Xem thêm