Dịch vụ khoa học dữ liệu đám mây (DataMixi.com)

Cloud Service

Data Science Cloud Service (DataMixi.com)

Data Science Cloud Service (Dịch vụ đám mây khoa học dữ liệu) – DataMixi là dịch vụ giúp các nhà khoa học dữ liệu phân tích nhận thức kết hợp tầm nhìn sâu rộng (phân tích dữ liệu thông minh) và trí tuệ nhân tạo để phân tích chuyên sâu và trực quan hóa dữ liệu từ các quan điểm khác nhau. Đồng thời cũng là dịch vụ cổng thông tin duy nhất cho các nhà khoa học tại Hàn Quốc có thể khai phá mô hình bị ẩn giữa các dữ liệu và dự đoán tương lai bằng cách tổng hợp, phân tích chuyên sâu dữ liệu và trực quan hóa từ các góc độ khác nhau. Đây là dịch vụ tư vấn khoa học dữ liệu được thiết kế cho các kỹ sư và các nhà phát triển IT muốn tích hợp dịch vụ phân tích dữ liệu dựa trên trí tuệ nhân tạo vào dự án dưới dạng tổng hợp (mashup).

208

< Dịch vụ dữ liệu khoa học đám mây – DATAMIXI >

Data Science Cloud Service (Dịch vụ đám mây khoa học dữ liệu) – DATAMIXI bao gồm dịch vụ khoa học dữ liệu, quản lý dữ liệu và phân tích dữ liệu. Khoa học dữ liệu là tên của một dịch vụ đám mây hỗ trợ toàn bộ quá trình từ thiết lập đến phân tích, ứng dụng dữ liệu lớn. Quản lý dữ liệu là tên gọi chung cho cấu trúc cho phép người thiết lập dữ liệu và hệ thống phần mềm hợp tác với nhau thông qua <Human-in-the-loop> – đặc trưng của quá trình xây dựng – phân tích dữ liệu tại Saltlux. Dịch vụ phân tích nhận thức bao gồm dịch vụ phân tích xu hướng, phân tích cảm xúc và trực quan hóa, trong đó dịch vụ phân tích và trực quan hóa là dịch vụ dựa trên bộ dữ liệu được thực hiện bời hàng chục tỷ đơn vị thực thể

Đặc điểm chính

DATAMIX – Cổng khoa học dữ liệu duy nhất cho trí tuệ nhân tạo và các nhà khoa học dữ liệu tại Hàn Quốc có thể khám phá mô hình bị ẩn giữa các dữ liệu và dự đoán tương lai bằng cách tích hợp, phân tích chuyên sâu dữ liệu và trực quan hóa từ các góc độ khác nhau thông qua phân tích nhận thức kết hợp tầm nhìn và trí tuệ nhân tạo để phân tích dữ liệu.

  • Cộng đồng Big Data và AI duy nhất tại Hàn Quốc

Đây là cộng đồng Big Data và AI có các nhà khoa học dữ liệu duy nhất tại Hàn Quốc giúp người dùng có thể giao tiếp với các chuyên gia và nắm bắt thông tin mới nhất. Các chuyên gia giỏi nhất trong từng lĩnh vực bao gồm kiến trúc sư dữ liệu, kỹ sư dữ liệu và nhà khoa học dữ liệu đang làm việc với DATAMIX.

  • Tận dụng nền tảng dữ liệu lớn thông minh với quy mô lớn nhất tại Hàn Quốc

Cho phép áp dụng nền tảng thông minh có quy mô lớn nhất trong nước kết hợp các giải pháp tốt nhất trong từng lĩnh vực bao gồm thu thập, lưu trữ, Machine Learning và lập luận

  • Cung cấp dịch vụ xử lý dữ liệu theo tiêu chuẩn tốt nhất thế giới

Cung cấp dịch vụ dữ liệu (Data as a Service) theo tiêu chuẩn tốt nhất thế giới cho phép thiết bị có thể đọc, học tập và hiểu ý nghĩa thông qua hỗ trợ công nghệ của trung tâm quản lý chuyên môn viện nghiên cứu thông minh trong và ngoài nước, ‘TORNADO’ – công nghệ thu thập dữ liệu lớn có tính năng tốt nhất thế giới mà Saltlux sở hữu.

  • Công khai công nghệ phân tích Big Data thông qua Open API thông minh

Cung cấp dịch vụ tốt nhất dựa trên công nghệ của Saltlux với kinh nghiệm đi trên con đường trí tuệ nhân tạo dữ liệu lớn cho đến Machine Learning và lý luận quy mô lớn trong suốt 20 năm qua. Công nghệ dữ liệu lớn và trí tuệ nhân tạo cho phép ứng dụng vào văn bản và ứng dụng thông qua dịch vụ phân tích khác nhau.

  • Cung cấp dữ liệu có quy mô lớn nhất châu Á

Người dùng có thể nhân hoặc sử dụng dữ liệu lớn cho phép tận dụng ngay lập tức vào quá trình phân tích các từ điển khác nhau theo tên miền ngoài dữ liệu xã hôij, dữ liệu mở, dữ liệu liên kết, dữ liệu theo thời gian thực.

  • Cung cấp miễn phí dịch vụ phân tích nhận thức thông minh

Cung cấp miễn phí dịch vụ phân tích nhận thức bằng cách áp dụng dữ liệu xã hội của khoảng 20 tỷ dữ kiện được cung cấp miễn phí và áp dụng công nghệ trí tuệ nhân tạo. Dịch vụ này cho phép khám phá mô hình bị ẫn giữa các sự liệu và dự đoán tương lai bằng cách tích hợp, phân tích chuyên sâu dữ liệu và trực quan hóa từ các góc độ khác nhau. Ngoài ra còn cung cấp dịch vụ cao cấp phù hợp với khách hàng đưa ra kết quả bằng cách chủ động phản ánh nhu cầu của khách hàng với dịch vụ tư vấn được thu thập và phân tích phù hợp khách hàng 100%.

Dịch vụ chính

Dịch vụ khoa học dữ liệu

Dịch vụ khoa học dữ liệu của Saltlux là dịch vụ tư vấn và giáo dục cung cấp nghiệp vụ IT và đào tạo kỹ thuật cho phép trực tiếp ứng dụng vào nghiệp vụ thực tế cho toàn bộ quá trình từ thu thập và tinh chế dữ liệu thông qua phân tích thành công nhận thức và Machine Learning nhờ vào kinh nghiệm của các chuyên gia tích lũy trong 20 năm qua, cho đến quá trình lựa chọn, tối ưu hóa các mô hình Machine Learning, mô hình phân tích đồng thời đánh giá và trực quan hóa về dự đoán, kết quả thông minh.

209

< Dịch vụ khoa học dữ liệu >

Dịch vụ khoa học dữ liệu của Data Science Cloud Service – DATAMIX tích hợp kỹ thuật máy tính, thống kê toán học, thuật toán Machine Learning, phương pháp mô hình hóa kiến thức miền thông qua mô hình xoắn ốc kép của Saltlux và tạo nên sự phát triển của dịch vụ tri thức dựa trên trí tuệ nhân tạo như dịch vụ phân tích dữ liệu lớn thông minh, dịch vụ hỏi đáp hay đối thoại.

210

< Dịch vụ dữ liệu dựa trên phương pháp mô hình xoắn ốc kép >

Tính cần thiết của sự hợp tác tích cực giữa con người và thiết bị (human-in-the-loop) để thông minh hóa dịch vụ phân tích dữ liệu chuyên sâu theo tiêu chuẩn ưu việt. Hệ thống khoa học dữ liệu của DATAMIX là hệ thống được các huyên gia tương tác hỗ trợ tích cực dựa trên phương pháp mô hình xoắn ốc kép (dual spiral methodology).

Đối với quy trình của khoa học dữ liệu điển hình, từ việc thu thập,tinh chế dữ liệu thông qua phương pháp xoắn ốc kép độc quyền của Saltlux cho đến lựa chọn, tối ưu hóa Machine Learning và mô hình phân tích, đánh giá và trực quan hóa về dự đoán, kết quả thông minh được thực hiện lặp đi lặp lại.

211

< Quá trình của dịch vụ tư vấn dữ liệu khoa học >

① Giai đoạn phân tích yêu cầu

Đây là giai đoạn đưa ra định nghĩa và phương hướng các nguồn tài nguyên dữ liệu cần thiết cho phân tích dữ liệu thông qua quá trình kết luận mục tiêu phân tích/thông minh hóa, quá trình phân tích và hiểu vấn đề cốt lõi về phân tích dữ liệu.

② Giai đoạn quản lý dữ liệu

Khó khăn lớn nhất trong việc phân tích chuyên sâu và học máy là thiếu dữ liệu tinh chế và học tập cho dữ liệu có quy mô lớn chứa lỗi. Quản lý dữ liệu là bước để thu thập nguồn tài nguyên dữ liệu được định nghĩa ở bước yêu cầu đồng thời tạo dữ liệu để phân tích và học tập bằng cách quá trình tinh chế, sàng lọc dữ liệu thông qua quá trình, công cụ và các chuyên gia được đào tạo để phù hợp với mục đích phân tích và thông minh hóa.

 

③ Giai đoạn phân tích và học tập dữ liệu

Đây là giai đoạn thực hiện phân tích chuyên sâu dữ liệu áp dụng công nghệ Machine Learning khác nhau như phân tích thống kê truyền thống, CRF, SVM và công nghệ Deep Learning dựa trên mạng thần kinh chuyên sâu như CNN, RNN. Đây là giai đoạn học máy và dự đoán của dữ liệu có quy mô lớn bằng cách tận dụng nền tảng phân tích thông minh sau khi tích hợp các công nghệ khác nhau của Saltlux với tài nguyên mở tối ưu như R, TensorFlow . Đây cũng là giai đoạn kiển chứng, đánh giá mô hình, điều chỉnh tham số mô hình sau khi thực hiện phân tích chuyên sâu dựa trên Deep Learning. Giai đoạn này cung cấp kết quả tối ưu đáp ứng nhu cầu của khách hàng thông qua sự thay đổi thuật toán học tập.

 

④ Giai đoạn kiểm chứng phân tích dữ liệu và phản hồi

Đây là giai đoạn khám phá kiến thức, mô hình, ngoại lệ từ kết quả được phân tích hoặc nhận đánh giá, kiểm chứng từ kết quả phân tích học tập – dự đoán thông qua phản hồi của chuyên gia nội bộ hoặc bên ngoài và khách hàng trước khi truyền tải kết quả ohân tích đến khách hàng.

 

⑤ Giai đoạn báo cáo phân tích dữ liệu cuối cùng

Đây là giai đoạn cung cấp báo cáo kết quả phân tích dữ liệu đáp ứng yêu cầu của khách hàng giúp việc phân tích và tận dụng dữ liệu có thể trở thành sức cạnh tranh mới của cá nhân hoặc tổ chức.

Dịch vụ quản lý dữ liệu

Dịch vụ bao gồm tất cả các hoạt động để nâng cao giá trị tận dụng của dữ liệu như gắn thẻ thông tin meta (chú thích), phân loại và tạo dữ liệu chuyên dùng cho học tập trong thu thập và tinh chế dữ liệu. Đối với phân tích chuyên sâu dựa trên dữ liệu và Machine Learning không chỉ bảo mật dữ liệu có quy mô lớn mà thiết bị còn phải được trang bị khả năng đọc, học tập và hiểu ý nghĩa. Dịch vụ quản lý dữ liệu của Saltlux cung cấp dịch vụ dữ liệu theo tiêu chuẩn tốt nhất thế giới dựa trên kinh nghiệm quản lý chất lượng và học máy được tích lũy trong suốt 20 năm.

212

< Dịch vụ quản lý dữ liệu >

① Quy trình dịch vụ quản lý dữ liệu

6 giai đoạn của quản lý dữ liệu được áp dụng chung cho tất cả các miền, và nhóm chuyên gia trong mỗi giai đoạn hợp tác theo hệ thống để xây dựng dịch vụ tri thức cho khách hàng.

213
② Chức năng của dịch vụ quản lý dữ liệu

Quản lý dữ liệu bao gồm tất cả các hoạt động giúp nâng cao giá trị tận dụng dữ liệu. Ngoài các lĩnh vực xử lý dữ liệu chung như kỹ thuật số hóa dữ liệu sách, thu thập thông tin thô, tinh chế dữ liệu, dịch vụ này còn cung cấp chức năng quản lý dữ liệu chuyên môn như chú thích hình ảnh và video, chú thích dữ liệu R&D, thiết lập cơ sở tri thức như dưới đây.

214
Dịch vụ phân tích nhận thức thông minh

Dịch vụ phân tích nhận thức thông minh của Saltlux cung cấp miễn phí chức năng phân tích nhận thức thông minh có thể phân tích chuyên sâu thông qua chức năng phân tích cao cấp nhờ áp dụng công nghệ trí tuệ nhân tạo phân tích tổng hợp, phân tích chủ đề liên quan, phân tích cảm xúc, phân tích xu hướng, phát hiện vấn đề, liên kết R thời gian thực và chức năng phân tích mạng quan hệ ý nghĩa nằm bên trong dữ liệu bằng cách tận dụng hơn 10 tỷ dữ liệu xã hội được cung cấp miễn phí.

1) Chức năng dữ liệu cho phép tải lên trực tiếp, đăng kí và sử dụng dữ liệu cộng đồng khác nhau, dữ liệu của tôi được cung cấp bởi dịch vụ dữ liệu.

2) Chức năng hợp nhất dữ liệu cho phép tạo dữ liệu đã được tối ưu hóa cho quá trình phân tích the nhu cầu bằng cách lựa chọn và tổng hợp những yếu tố mong muốn từ hai hay nhiều tệp.

3) Chức năng tạo widget cho phép áp dụng biểu đồ khác nhau thông qua phân tích thông minh về chủ đề phân tích đối tượng quan tâm bằng cách sử dụng dữ liệu xã hội được cung cấp.

4) Chức năng tạo bảng thông báo cho phép tạo bảng thông báo của riêng mình bằng cách đặt các widget đã tạo vào vị trí mong muốn thông qua phương pháp kéo thả.

5) Chức năng chia sẻ và xuất bản web để chia sẻ bảng thông báo được tạo từ góc độ của nhiều người khác nhau bằng cách chia sẻ qua qua thư viện hoặc sử dụng SNS.

① Chức năng dữ liệu của tôi

Chức năng dữ liệu của tôi trong dịch vụ phân tích nhận thức là chức năng cho phép xử lý, lưu trữ, đăng kí khoảng hơn 100 dữ liệu xã hội và hơn 340.000 dữ liệu mở được cung cấp từ Saltlux, hoặc để áp dụng vào dịch vụ phân tích nhận thức thông minh dữ liệu người dùng tùy vào nhu cầu người dùng.

② Chức năng phân tích widget

Chức năng widget trong dịch vụ phân tích nhận thức là chức năng phân tích nhận thức thông minh tận dụng hơn 100 dữ liệu xã hội và hơn 340.000 dữ liệu mở được cung cấp từ Saltlux hoặc tận dụng dữ liệu người dùng theo yêu cầu của người dùng. Chức năng này cho phép ứng dụng kết quả phân tích vào biểu đồ khác nhau bằng cách sử dụng chức năng phân tích nhận thức thông minh về chủ đề phân tích người dùng dưới dạng widget. Chức năng này có thể được chia thành chức năng phân tích nhận thức sử dụng dữ liệu lớn xã hội và chức năng phân tích nhận thức sử dụng dữ liệu của tôi, đồng thời có thể phân tích xu hướng, phân tích từ khóa liên quan, phân tích cảm xúc dựa trên chức năng phân tích nhận thức chi tiết.

③ Bảng thông báo người dùng và chức năng thư viện

Widget kết quả nhận thức người dùng cho phép lưu trữ và đăng kí vào thư viện widget phân tích, bằng cách sử dụng widget kết quả phân tích nhận thức đã được đăng kí như thế này người dùng có thể tạo ra bảng thông báo. Bảng thông báo được tạo ra chức năng chia sẻ và tải cho người dùng khác tùy theo lựa chọn của người dùng.

Dịch vụ chức năng xử lý dữ liệu và Machine Learning – Dataiku

Là nền tảng dữ liệu lớn thông minh dựa trên dữ liệu tập trung, tận dụng tối đa chức năng phân tích để đảm bảo doanh nghiệp không chỉ dừng lại ở mức lưu trữ dữ liệu mà còn tác động mật thiết đến quá trình của doanh nghiệp. Thông qua đó dữ liệu được mô hình hóa thông qua Machine Learning và ứng dụng dữ liệu đó vào hoạt động của công ty.

215

< Dịch vụ dữ liệu khoa học đám mây – Dataiku >

① Chức năng kiểm tra dữ liệu

Tạo báo cáo tự động trên các bộ dữ liệu và chỉ ra các vấn đề về chất lượng dữ liệu còn tồn đọng. Tạo báo cáo kiểm toán tập hợp dữ liệu chi tiết bằng cách tạo dữ liệu đơn và thống kê đa biến. Tinh lọc và tìm kiếm dễ dàng dữ liệu như trong Excel. Đạt được tầm nhìn sâu rộng bàng cách mở rộng phạm vị phân tích thông qua thực nghiệm trên các công nghệ Spark, Hadoop hoặc SQL.

 

② Tiền xử lý dữ liệu và chức năng chuyển đổi trực quan 

Có thể dễ dàng truy cập hơn 80 bộ xử lý hình ảnh nội bộ để ngăn chặn tranh luận dữ liệu không mã hóa. Có thể tự động chuyển đổi ngữ cảnh được đề xuất và thực hiện nhiều thao tác trên dữ liệu.

 

③ Chức năng học máy

Chức năng sản sinh, lựa chọn và kỹ thuật tự động sử dụng tất cả các loại mô hình của dữ liệu. Tối ưu hóa mô hình siêu tham số bằng cách sử dụng chiến lược kiểm tra tính xác thực chéo khác nhau. Có thể đạt được tầm nhìn sâu rộng trực quan thu được từ mô hình (tính quan trọng của biến, tương tác hoặc đặc điểm của tham số), đánh giá tính năng mô hình thông qua số liệu chi tiết.

 

④ Chức năng phân phối mô hình dựa trên Machine Learning

Hỗ trợ các nhà phân tích và các nhà khoa học dữ liệu phân phối mô hình trong sản xuất chỉ bằng mấy lần nhấp. Hình thành một đường dẫn điểm được đơn giản hóa bằng cách thực hiện cùng lúc thao tác dọn dẹp, phong phú hóa và tiền xử lý dữ liệu.

 

⑤ Chức năng quản lý thông tin sản sinh dữ liệu

Mô hình phân phối bao gồm tất cả các bước cần thiết cho quá trình tạo dữ liệu trong mô hình UI duy nhất 1) Phát triển mô hình sản sinh dữ liệu (workflow), 2) Mô hình và thử nghiệm dữ liệu sản xuất, 3) Nguyên mẫu dữ liệu (Sản xuất và kiểm chứng), 4) Sản phẩm hóa dữ liệu (Đóng gói mô hình tạo dữ liệu)

Khả năng cạnh tranh nổi bật

  • Phân tích dữ liệu – Trực quan hóa phân tích

Đạt được tầm nhìn sâu rộng thông qua phân tích tác giả, văn bản tương tự, công nghệ liên quan, trang mạng từ khóa, phân tích sự hội tụ – phức hợp giưax các công nghệ khác nhau, phân tích nhận thức, phân tích chuyên sâu. Nắm bắt tình trạng công nghệ và nghiên cứu phát triển hiện tại của các đối thủ cạnh tranh, tóm tắt chính sách chính phủ của lĩnh vực nghiên cứu phát triển, cảm biến công nghệ mới và giám sát xu hướng trong lĩnh vực nghiên cứu phát triển.

  • Quản lý dữ liệu – Dữ liệu hóa thông minh

Quản lý dữ liệu có nghĩa là bao gồm tất cả các hoạt động để nâng cao giá trị tận dụng dữ liệu từ thu thập, tinh chế dữ liệu cho đến chú thích, phân loại và tạo dữ liệu chuyên dùng cho học tập. Để phân tích chuyên sâu dựa trên dữ liệu và Machine Learning không chỉ cần bảo mật dữ liệu có quy mô lớn mà thiết bị còn phải được trang bị dưới dạng có thể đọc, học tập (learnable) và hiểu ý nghĩa (Understandable).

  • Cung cấp dịch vụ nền tảng khoa học dữ liệu duy nhất tại Hàn Quốc – Science Total Service

Hỗ trợ tất cả các nghiệp vụ để đạt được tầm nhìn sâu rộng hoặc triển khai hệ thống thông minh hóa bằng cách áp dụng thu thập, quản lý dữ liệu, phân tích thống kê. Dù là những người chưa có kinh nghiệm về công nghệ cũng có thể phân tích dữ liệu thông qua sản phẩm này.

  • Machine Learning, AI – Dự đoán thực nghiệm và kết quả nghiên cứu

Khi dữ liệu được nghiên cứu nội bộ và dữ liệu thực nghiệm như đồ thị/bảng/hình ảnh/công thức hóa học từ tài liệu bên ngoài được quản lý (trích xuất và tính chế) thì có thể thu được nhanh chóng và dễ dàng kết quả bằng cách thực hiện gián tiếp thí nghiệm nghiên cứu thông qua chức năng ML có sử dụng dữ liệu đó.

  • Hoàn thành thu thập dữ liệu nội bộ và dữ liệu bên ngoài – Ngân hàng dữ liệu

Cho phép thu thập, chia sẻ và tái sử dụng dữ liệu nghiên cứu phân tán nội bộ. Nội bộ hóa bằng cách thực hiện quá trình thu thập dữ liệu phi cấu trúc khác nhau như tài liệu bên ngoài, bằng cấp, tài liệu kỹ thuật. Nhúng chức năng (6 loại) thu thập lớn nhất trong công nghệ thu thập ở trong và ngoài nước và đảm bảo hiệu suất thu thập tốt nhất bằng cách áp dụng công nghệ xử lý thu thập dữ liệu trong thời gian thực.

Màn hình chính

스크린샷(47)
스크린샷(48)