Tôi không biết mọi người cảm thấy thế nào về quản trị dữ liệu, nhưng tôi cảm thấy như mình đang đối mặt với một con quái vật khổng lồ và không biết phải bắt đầu từ đâu. Có vẻ như có rất nhiều việc cần phải làm, nhưng cụ thể là phải làm gì? Nên làm gì trước và làm gì sau? Có điểm quan trọng nào ảnh hưởng tới toàn bộ cơ thể không? Làm thế nào chúng ta có thể đạt được đầu ra theo từng giai đoạn? Làm sao để tiến hành suôn sẻ? Đợi đã, có vẻ như có nhiều câu hỏi hơn là câu trả lời. Nếu chúng ta nói về điều đầu tiên cần phải thống nhất hiện nay, cá nhân tôi tin rằng bước đầu tiên trong quản trị dữ liệu là xác định ranh giới cần quản lý. 1. Ba người tham gia dữ liệuTheo luồng dữ liệu, có ba bên tham gia: bên tạo dữ liệu, bên xử lý dữ liệu và bên sử dụng dữ liệu. Nhà sản xuất dữ liệu là hệ thống kinh doanh tạo ra dữ liệu. Bộ xử lý dữ liệu là bộ phận dữ liệu thực hiện việc dọn dẹp, lập mô hình và xử lý, thường là bộ phận văn phòng trung gian dữ liệu. Người tiêu thụ dữ liệu là các phòng ban cuối cùng sử dụng dữ liệu đã được làm sạch và xử lý, có thể là phòng kinh doanh hoặc phòng phân tích. 2. Hai ranh giới của quản trị dữ liệuÝ nghĩa của việc xác định ranh giới quản trị dữ liệu ở đây là xác định xem quản trị chỉ dành cho phạm vi liên quan đến bộ xử lý dữ liệu hay bao gồm cả phạm vi liên quan đến nhà sản xuất dữ liệu. Nói cách khác, chỉ có dữ liệu do hệ thống kinh doanh tạo ra và nhập vào nền tảng dữ liệu trung gian mới được quản lý, tức là dữ liệu được quản lý sau khi vào hồ dữ liệu. Khi dữ liệu được hệ thống kinh doanh tạo ra, việc quản trị bắt đầu trước khi dữ liệu được nhập vào trung tâm dữ liệu, tức là quản trị trước khi vào hồ dữ liệu. Như tên gọi của nó, nếu chúng ta muốn thực hiện quản trị dữ liệu cấp doanh nghiệp, thì tất nhiên chúng ta cần cả quản trị trước khi đưa dữ liệu vào hồ và quản trị sau khi đưa dữ liệu vào hồ. Tuy nhiên, thực tế cho thấy vẫn còn những khác biệt lớn giữa hai loại hình quản trị này về độ khó, quy trình, phạm vi truyền thông,... Người ta ví dữ liệu như dòng nước chảy. Loại quản trị dữ liệu này trước khi đổ vào hồ giống như hạ lưu của một con sông. Có thể hình dung được việc quản lý ở vùng thượng nguồn con sông khó khăn đến mức nào. Đầu tiên là quản trị dữ liệu sau khi vào hồ, chủ yếu dựa trên nền tảng dữ liệu trung gian (giả sử nền tảng dữ liệu trung gian đóng vai trò dẫn đầu), được hỗ trợ bởi các phòng ban kinh doanh khác. Loại thứ hai bao gồm quản trị dữ liệu trước khi đưa vào sử dụng, nhưng thực tế đòi hỏi toàn bộ công ty phải thích ứng và chuyển đổi hệ thống. Huawei được cho là đã đạt được mục tiêu quản lý trước và sau khi vào hồ phải tuân thủ một số tiêu chuẩn quản lý dữ liệu và yêu cầu chất lượng nhất định trước khi hệ thống kinh doanh được phát hành trực tuyến. Nếu không đáp ứng được yêu cầu, hệ thống sẽ không được phép trực tuyến. Nếu bạn nói khi bắt đầu dự án quản trị dữ liệu rằng bạn cần tiến hành quản trị dữ liệu toàn cầu trước và sau khi vào hồ, và bạn cần sự hợp tác của toàn bộ công ty để chuyển đổi, thì khả năng thành công sẽ rất thấp. Hiện nay, chúng ta thường nghe nói rằng "quản trị dữ liệu là một dự án cấp cao", nhưng cá nhân tôi cảm thấy rằng điều đó phụ thuộc vào cách thức và nội dung mà người lãnh đạo cấp cao hỗ trợ. Nếu sự hỗ trợ thiếu suy nghĩ thực sự ảnh hưởng đến hệ thống kinh doanh, ai sẽ phải chịu trách nhiệm? Xét cho cùng, quản trị dữ liệu vẫn đang ở giai đoạn hoàn thiện ở thời điểm hiện tại. Và hiện tại, có vẻ như một con đường thành công rõ ràng dường như không hoàn toàn rõ ràng. Tất nhiên, điều này không có nghĩa là không cần sự hỗ trợ của ban lãnh đạo. Trong quá trình quản trị dữ liệu, cá nhân tôi tin rằng sự hỗ trợ của ban lãnh đạo là một điều kiện thuận lợi (chúng ta sẽ nói về địa điểm và con người sau). Thay vào đó, điều này có nghĩa là chỉ sau khi con đường trở nên rõ ràng, bạn mới có thể giành được sự ủng hộ của các nhà lãnh đạo, trao cho họ con người, tiền bạc, thời gian và kiểm soát kỳ vọng. Hầu hết sự hỗ trợ đều có điều kiện và bạn cần phải thấy được hy vọng thành công trước khi có thể nhận được hỗ trợ. 3. Bạn có thực hiện quản trị dữ liệu trước khi vào hồ không?Như vậy có nghĩa là sẽ không có quản trị dữ liệu trước khi vào hồ phải không? Không hẳn vậy. Thay vào đó, điều này có nghĩa là lúc đầu, chỉ thực hiện quản trị dữ liệu sau khi vào hồ, sau đó dần dần thâm nhập vào quản trị dữ liệu trước khi vào hồ thông qua các phương pháp dựa trên vấn đề và dựa trên kịch bản để tác động đến doanh nghiệp và đạt được quản trị dữ liệu toàn cầu. Hướng tới vấn đề thì dễ hiểu. Nghĩa là một ngày nào đó bạn phát hiện một số dữ liệu không nhất quán, cỡ nòng không thể thống nhất, các giá trị không thể thống nhất. Nguyên nhân là do dữ liệu trong một hệ thống nhất định thường có điểm bất thường. Lúc này, có thể sử dụng bài toán này để thúc đẩy doanh nghiệp thực hiện quản trị dữ liệu trước khi nhập dữ liệu vào nền tảng trung gian, tức là thực hiện quản trị dữ liệu trên hệ thống doanh nghiệp. Thông qua dữ liệu sai, chúng ta có thể buộc hệ thống nguồn phải cải thiện chất lượng dữ liệu. Tất nhiên, quá trình này đòi hỏi phải có công cụ giám sát và hỗ trợ. Cho phép hệ thống kinh doanh sử dụng các công cụ để cấu hình linh hoạt các quy tắc giám sát có liên quan. Thay vì vận hành thủ công, không có cách nào để tiến hành thống kê hiệu ứng tiếp theo. Điều này liên quan đến việc chuẩn bị dụng cụ. Ngoài ra, cần phải có các quy định về chính sách đi kèm với các công cụ để thực hiện chúng. Cũng phải có nhân lực tổ chức tương ứng để ứng phó và chịu trách nhiệm về vấn đề này. Một cách khác là thực hiện các tình huống. Trong một kịch bản quan trọng hơn, luôn có những năng lực không nhất quán trong công ty. Với cùng một chỉ số, bạn nói giá trị này và tôi nói giá trị kia. Hoặc thông tin dữ liệu chính không thể được tích hợp trên các hệ thống, chẳng hạn như nhân sự, địa chỉ, v.v. Lúc này, một kịch bản được sử dụng để phối hợp mọi người từ các tổ chức khác nhau, tuân theo cùng một tiêu chuẩn và sử dụng các công cụ để thống nhất năng lực của họ. Ví dụ, thống nhất dữ liệu địa chỉ của các hệ thống khác nhau trong công ty và thiết lập ECIF để kết nối dữ liệu nhân sự được thu thập bởi các hệ thống khác nhau trong công ty. Mỗi mô hình quản trị theo kịch bản này sẽ là một dự án hệ thống tương đối lớn. Như đã đề cập ở trên, ECIF là một hệ thống độc lập được sử dụng để kết nối dữ liệu chính của người dùng. Hình thức cải tiến dần dần này được sử dụng để tác động đến doanh nghiệp và đạt được mục tiêu quản trị dữ liệu hệ thống trước khi đưa vào hồ. Hơn nữa, còn có một lý do nữa để tiến hành quản trị dữ liệu sau khi vào hồ trước. Thông qua hoạt động quản trị này sau khi vào hồ, sự giao tiếp và tin cậy giữa bộ phận dữ liệu trung gian và doanh nghiệp có thể được tăng cường. Nó có thể cho doanh nghiệp biết những gì đang được thực hiện và tác động đến doanh nghiệp ngay từ cấp độ hành động, thay vì khiến doanh nghiệp cảm thấy rằng điều này là tùy chọn hoặc thậm chí là chống lại nó. IV. Phần kết luậnChương này chủ yếu nói về vấn đề đầu tiên cần được xác nhận khi hiểu về quản trị dữ liệu: vấn đề ranh giới của quản trị dữ liệu. Ban đầu, trọng tâm là quản trị dữ liệu sau khi đưa vào hồ, sau đó quản trị trước khi đưa vào hồ được thực hiện thông qua các phương pháp theo hướng vấn đề và theo hướng kịch bản để đạt được quản trị toàn cầu. Sau khi xác nhận ranh giới của quản trị dữ liệu, trước khi tiếp tục giới thiệu nội dung quản trị dữ liệu, trước tiên chúng ta hãy nói về sự khác biệt giữa quản lý dữ liệu và quản trị dữ liệu. Bằng cách xác định ý nghĩa khác nhau của hai khái niệm này, chúng ta có thể hiểu rõ hơn về khái niệm quản trị dữ liệu. |
<<: Cửa hàng WeChat của Luckin Coffee nhận được hơn 10.000 "món quà" trong một ngày
>>: Làm thế nào để phân biệt giữa quản trị dữ liệu và quản lý dữ liệu? (Phiên bản đảm bảo)
Nhiều bạn bè đã phàn nàn, nhưng sau buổi họp báo, ...
Chúng đã thu hút được nhiều sự chú ý trên thị trườ...
Chúng ta hãy nói về tình huống chuyển đổi tệp âm t...
Để một thương hiệu phát triển từ 0 lên 1, từ 1 lê...
Việc sử dụng điện thoại Apple trong thời gian dài ...
Apple là một công ty công nghệ nổi tiếng thế giới ...
Với sự phổ biến của các thiết bị di động trong cuộ...
Với sự phổ biến của mạng xã hội hiện nay, WeChat đ...
Máy chiếu đóng vai trò ngày càng quan trọng trong ...
Khi mua nhạc hoặc sử dụng thiết bị Apple, chúng ta...
Mang trong mình hàng ngàn năm lịch sử và văn hóa, ...
Tai nghe Bluetooth đã trở thành một trong những ph...
PlayStation5 (gọi tắt là PS5) là thế hệ máy chơi g...
DHCP (Giao thức cấu hình máy chủ động) là giao thứ...
Debug là gì? Một thư viện động do Apache phát triể...