Full metadata record
DC FieldValueLanguage
dc.contributor.authorNguyễn, Ngọc Khương-
dc.date.accessioned2016-04-13T03:14:07Z-
dc.date.available2016-04-13T03:14:07Z-
dc.date.issued201-
dc.identifier.citation7 tr.en_US
dc.identifier.urihttp://repository.vnu.edu.vn/handle/VNU_123/8164-
dc.description.abstractLuận văn đề xuất một phương pháp cải tiến cho việc gán nhãn từ loại dựa trên việc phân tích các đặc trưng quan hệ của một số phương pháp học máy và đánh giá tính hiệu quả của các phương pháp này đối với bài toán gán nhãn từ loại. Trong phương pháp đề xuất thay vì việc sử dụng các phương pháp học máy đơn lẻ, chúng tôi sử dụng kết hợp các thuật toán học máy có xu hướng kế thừa nhau để hạn chế các lỗi gán nhãn ngoại lệ. Trước hết chúng tôi sử dụng một trong số những phương pháp học máy tốt nhất cho bài toán gán nhãn từ loại, phương pháp học máy thống kê cực đại hóa Entropy để xây dựng mô hình cơ sở, sau đó sử dụng mô hình học luật chuyển đổi để sửa sai lỗi từ loại. - Dựa trên công cụ Stanford Tagger và vnTagger, chúng tôi đã cài đặt công cụ gán nhãn từ loại cải tiến (CBTagger) để làm thành phần gán nhãn cơ sở. Sau đó cài đặt module sửa sai dựa trên phương pháp học luật chuyển đổi để được công cụ gán nhãn từ loại (CTagger) dựa trên mô hình kết hợp. Chúng tôi sử dụng bộ công cụ này để kiểm tra trên hai loại ngôn ngữ điển hình của hai loại ngôn ngữ biến hình và không biến hình để chỉ ra tính hiệu quả của mô hình đề xuất đối với bài toán gán nhãn từ loại. Kết quả thực nghiệm trên công cụ CTagger với các bộ ngữ liệu khác nhau cho thấy độ chính xác cao hơn đáng kể so với mô hình cơ sở và với các bộ gán nhãn từ loại khác.en_US
dc.language.isootheren_US
dc.publisherĐại học Quốc gia Hà Nộien_US
dc.subjectPhương pháp tin học đặc biệten_US
dc.subjectTrích chọn thông tinen_US
dc.subjectDịch máyen_US
dc.subjectBài toán gán nhãn từ loạien_US
dc.subjectXử lý ngôn ngữ tự nhiênen_US
dc.titleKết hợp mô hình cực đại entropy và học luật chuyển đổi cho bài toán gán nhãn từ loạien_US
dc.typeThesisen_US
Appears in Collections:Luận văn - Luận án (LIC)


  • 00050004212.pdf
    • Size : 102,77 kB

    • Format : Adobe PDF

    • View : 
    • Download : 
  • Full metadata record
    DC FieldValueLanguage
    dc.contributor.authorNguyễn, Ngọc Khương-
    dc.date.accessioned2016-04-13T03:14:07Z-
    dc.date.available2016-04-13T03:14:07Z-
    dc.date.issued201-
    dc.identifier.citation7 tr.en_US
    dc.identifier.urihttp://repository.vnu.edu.vn/handle/VNU_123/8164-
    dc.description.abstractLuận văn đề xuất một phương pháp cải tiến cho việc gán nhãn từ loại dựa trên việc phân tích các đặc trưng quan hệ của một số phương pháp học máy và đánh giá tính hiệu quả của các phương pháp này đối với bài toán gán nhãn từ loại. Trong phương pháp đề xuất thay vì việc sử dụng các phương pháp học máy đơn lẻ, chúng tôi sử dụng kết hợp các thuật toán học máy có xu hướng kế thừa nhau để hạn chế các lỗi gán nhãn ngoại lệ. Trước hết chúng tôi sử dụng một trong số những phương pháp học máy tốt nhất cho bài toán gán nhãn từ loại, phương pháp học máy thống kê cực đại hóa Entropy để xây dựng mô hình cơ sở, sau đó sử dụng mô hình học luật chuyển đổi để sửa sai lỗi từ loại. - Dựa trên công cụ Stanford Tagger và vnTagger, chúng tôi đã cài đặt công cụ gán nhãn từ loại cải tiến (CBTagger) để làm thành phần gán nhãn cơ sở. Sau đó cài đặt module sửa sai dựa trên phương pháp học luật chuyển đổi để được công cụ gán nhãn từ loại (CTagger) dựa trên mô hình kết hợp. Chúng tôi sử dụng bộ công cụ này để kiểm tra trên hai loại ngôn ngữ điển hình của hai loại ngôn ngữ biến hình và không biến hình để chỉ ra tính hiệu quả của mô hình đề xuất đối với bài toán gán nhãn từ loại. Kết quả thực nghiệm trên công cụ CTagger với các bộ ngữ liệu khác nhau cho thấy độ chính xác cao hơn đáng kể so với mô hình cơ sở và với các bộ gán nhãn từ loại khác.en_US
    dc.language.isootheren_US
    dc.publisherĐại học Quốc gia Hà Nộien_US
    dc.subjectPhương pháp tin học đặc biệten_US
    dc.subjectTrích chọn thông tinen_US
    dc.subjectDịch máyen_US
    dc.subjectBài toán gán nhãn từ loạien_US
    dc.subjectXử lý ngôn ngữ tự nhiênen_US
    dc.titleKết hợp mô hình cực đại entropy và học luật chuyển đổi cho bài toán gán nhãn từ loạien_US
    dc.typeThesisen_US
    Appears in Collections:Luận văn - Luận án (LIC)


  • 00050004212.pdf
    • Size : 102,77 kB

    • Format : Adobe PDF

    • View : 
    • Download :