Công cụ khai thác văn bản

BIGDATA SUITE

Công cụ khai thác văn bản TMS

Công cụ khai thác văn bản thực hiện tìm kiếm dựa trên ngữ nghĩa, tái cấu trúc thông tin và phân tích đa chiều bằng cách nắm bắt các đặc điểm, ý nghĩa và mức độ liên quan của dữ liệu phi cấu trúc bên trong và bên ngoài quy mô lớn. Công cụ được bao gồm trích xuất thông tin chất lượng cao, trích xuất mối quan hệ, phân loại thông tin tự động cụm thông tin dưới dạng tài liệu, tóm tắt thông tin từ động và phân tích dữ liệu phi cấu trúc thông minh từ tài liệu và thông tin dung lượng lớn. TMS một công cụ phân tích dữ liệu lớn phi cấu trúc thông minh có khả năng giảm thiểu thời gian sử dụng cho việc tìm kiếm, phân tích.

15

<Sơ đồ khái niệm công cụ khai thác văn bản >

Chức năng chính

  • Tích hợp tính năng khai thác văn bản tối tân
  • Phân tích hình thái chất lượng cao tích hợp dựa trên machine learning và deep learning
  • Phân tích cú pháp hiệu năng cao tích hợp dựa trên machine learning và deep learning
  • Nhận dạng tên đối tượng dựa trên machine learnign và deep learning
  • Trích xuất danh tiếng (cảm xúc) chất lượng cao tích hợp dựa trên machine learning và deep learning
  • Tích hợp bộ trích xuất thông tin kiểu hybrid chất lượng cao
  • Bộ nhận dạng, phân loại thông tin tự động dựa trên công nghệ machine learning
  • Tự động tích hợp trình biên dịch thông tin (tài liệu)

Chức năng chính và thông số kỹ thuật 

Chức năng xử lí ngôn ngữ tự nhiên

Tất cả các máy phân tích ngôn ngữ có độ chính xác cao để xử lý dữ liệu phi cấu trúc đều được trang bị công nghệ machine learning và AI và đó chính là những chức năng tối ưu hóa chất lượng cho từng miền thông qua từ điển và quy tắc.

16

< Các chức năng xử lí ngôn ngữ tự nhiên >

Chức năng tự động phân loại thông tin (tài liệu)


Đây là một chức năng tự động phân loại theo cấp bậc thời gian thực bằng hệ thống phân loại (danh mục) được xác định trước cho một lượng lớn dữ liệu lớn không có cấu trúc (thông tin và văn bản). Chức năng phân loại này có thể sử dụng đồng thời cơ sở học tập và cơ sở quy tắc để phân loại tài liệu.

  • Chức năng tự động phân tích cụm thông tin(tài liệu)
  • Chức năng phân tích xu hướng kiến ​​thức
  • Chức năng phân tích từ liên quan – Xếp hạng chủ đề
  • Chức năng phân tích xu hướng chủ đề
  • Chức năng phân tích từ khóa nhanh – TopN
  • Chức năng phân tích không gian “

Màn hình công cụ chính

1
2
3