Công cụ khai thác văn bản TMS
Công cụ khai thác văn bản TMS của Big data Suite thực hiện tìm kiếm dựa trên ngữ nghĩa, tái cấu trúc thông tin và phân tích đa chiều bằng cách nắm bắt các đặc điểm, ý nghĩa và mức độ liên quan của dữ liệu phi cấu trúc quy mô lớn bên trong và bên ngoài. Đồng thời, cung cấp các chức năng phân tích dữ liệu không có cấu trúc để khám phá và bổ sung giá trị cho kiến thức ẩn. Từ đó, người dùng có thể đưa ra các quyết định như sử dụng kiến thức, quản lý khách hàng, quản lý rủi ro, nghiên cứu và phát triển. Công cụ cũng có thể trích xuất thông tin chất lượng cao, trích xuất mối quan hệ, phân loại thông tin tự động cụm thông tin dưới dạng tài liệu, tóm tắt thông tin tự động, phân tích dữ liệu phi cấu trúc thông minh từ tài liệu và thông tin dung lượng lớn. TMS là công cụ phân tích dữ liệu phi cấu trúc thông minh có khả năng giảm thiểu thời gian tìm kiếm và phân tích thông tin.
<Sơ đồ khái niệm công cụ khai thác văn bản>
Chức năng chính
- Tích hợp tính năng khai thác văn bản tối tân
- Phân tích hình thái chất lượng cao tích hợp dựa trên machine learning và deep learning
- Phân tích cú pháp hiệu năng cao tích hợp dựa trên machine learning và deep learning
- Nhận dạng tên đối tượng dựa trên machine learnign và deep learning
- Trích xuất danh tiếng (cảm xúc) chất lượng cao tích hợp dựa trên machine learning và deep learning
- Tích hợp bộ trích xuất thông tin kiểu hybrid chất lượng cao
- Bộ nhận dạng, phân loại thông tin tự động dựa trên công nghệ machine learning
- Tự động tích hợp trình biên dịch thông tin (tài liệu)
Chức năng chính và thông số kỹ thuật
Chức năng xử lí ngôn ngữ tự nhiên
Các máy phân tích ngôn ngữ có độ chính xác cao đều được trang bị công nghệ machine learning và AI giúp tối ưu hóa chất lượng cho từng nghiệp vụ thông qua từ điển và quy tắc.
<Các chức năng xử lý ngôn ngữ tự nhiên>
Chức năng tự động phân loại thông tin (tài liệu)
Đây là chức năng tự động phân loại theo cấp bậc thời gian thực bằng hệ thống phân loại (danh mục) được xác định trước cho lượng lớn big data phi cấu trúc (thông tin và văn bản). Chức năng phân loại này sử dụng đồng thời cơ sở học tập và cơ sở quy tắc để phân loại tài liệu.
- Chức năng tự động phân tích cụm thông tin (tài liệu)
- Chức năng phân tích xu hướng kiến thức
- Chức năng phân tích từ liên quan – Xếp hạng chủ đề
- Chức năng phân tích xu hướng chủ đề
- Chức năng phân tích từ khóa nhanh – TopN
- Chức năng phân tích không gian