“Dữ liệu là nguồn dầu mỏ mới” (Clive Humby, 2006). Nếu phải chọn một thứ thì dữ liệu này giống nhất với dầu mỏ. Cả hai đều là nguồn lực chiến lược quan trọng và là động lực thúc đẩy thế giới. Nhưng dữ liệu chỉ là dữ liệu, nó không phải là thứ gì khác. 1. Năm đặc điểmDữ liệu là sự tồn tại khách quan và mô tả thực tế về mọi thứ, có thể thu được thông qua đo lường, ghi chép, khám phá, v.v. Dữ liệu có năm đặc điểm: vô hạn, dễ sao chép, không đồng nhất, dễ hỏng và tính nguyên bản. 1. Vô cựcKhông giống như các đối tượng vật lý, dữ liệu sẽ không bị cạn kiệt do sử dụng. Thay vào đó, nó được tạo ra do sử dụng và sẽ tiếp tục được tạo ra và tăng lên về số lượng. "Dữ liệu sẽ trở thành sản phẩm khách quan cơ bản nhất. Bất kể chúng ta làm gì, chúng ta đều đang tạo ra dữ liệu" (Paul Sonderegger, 2017). Theo Xu hướng công nghệ mới nổi 2016-2045 của DASA R&T , lượng dữ liệu mới được tạo ra trên toàn thế giới tăng gấp đôi sau mỗi hai năm. Đây có thể được gọi là Định luật Moore về Dữ liệu lớn và sự bùng nổ dữ liệu là điều không thể tránh khỏi. 2. Dễ dàng sao chépDữ liệu có thể được sao chép nhanh chóng với chi phí gần như bằng không, có thể được nhiều người sử dụng cùng lúc, có thể được tái chế nhiều lần và việc sử dụng của một người không loại trừ hoặc cản trở việc sử dụng của những người khác và không có xung đột lợi ích trực tiếp giữa những người khác nhau trong quá trình sử dụng. Tính dễ tái tạo khiến dữ liệu không mang tính cạnh tranh và không độc quyền ở một mức độ nào đó, nhưng dữ liệu không phải là tài sản công cộng. Có dữ liệu công khai, dữ liệu doanh nghiệp và dữ liệu cá nhân. 3. Tính không đồng nhấtTrong "Kẻ ngụy trang", Tạ Nhược Lâm nói: "Bây giờ ở đây có hai thỏi vàng, hãy nói cho ta biết thỏi nào cao quý, thỏi nào bẩn thỉu?" Điều này minh họa cho một sự thật - các thỏi vàng là đồng nhất và hai thỏi vàng có cùng giá trị. Tính đồng nhất có ở khắp mọi nơi, chẳng hạn như hàng hóa rời khỏi nhà máy, các nguồn năng lượng như dầu và điện. Tuy nhiên, dữ liệu không đồng nhất. Giá trị chứa trong một bit dữ liệu hoàn toàn khác với giá trị chứa trong một bit dữ liệu khác và cùng một dữ liệu có giá trị khác nhau đối với những người khác nhau. Như Wang Qinmin (2023) đã nói: “Giá trị của dữ liệu thay đổi tùy thuộc vào người dùng, tình huống ứng dụng và các tiêu chuẩn chất lượng dữ liệu chuyên biệt”. 4. Tính dễ hỏngDữ liệu là một loại hàng hóa dễ hư hỏng và mất giá nhanh chóng theo thời gian. Theo IBM (2015), 60% dữ liệu phi cấu trúc mất đi giá trị thực của nó chỉ trong vài mili giây. Điều này có nghĩa là giá trị của dữ liệu phần lớn được phản ánh ở tính kịp thời của nó. Hơn một nửa dữ liệu không còn giá trị ngay khi được tạo ra. Chúng ta có thể gọi nó là "luật một giây". Thậm chí còn có ít dữ liệu hơn để phân tích và sử dụng thực tế. 90% dữ liệu của thế giới không bao giờ được phân tích và sử dụng (IBM, 2015; DASA R&T, 2016). Ít hơn 2% dữ liệu được tạo hoặc sao chép vào năm 2020 được lưu và lưu giữ vào năm 2021 (nguồn: IDC). 5. Tính độc đáoDữ liệu là dữ liệu thô và tự nó không có ý nghĩa gì. Chỉ bằng cách xử lý và phân tích, thông tin mới có thể được chuyển thành thông tin hữu ích cho con người. Nếu dữ liệu là dầu mỏ mới thì phân tích chính là động cơ đốt trong. Thông tin là sản phẩm của việc trích xuất dữ liệu; thông tin được bộ não con người xử lý để hình thành nên kiến thức, mang tính chủ quan; dữ liệu, thông tin và kiến thức mang tính lịch sử, trong khi trí tuệ mang tính tương lai và là khả năng của con người sử dụng kiến thức để đưa ra quyết định và phán đoán. Về mối quan hệ giữa dữ liệu, thông tin, kiến thức và trí tuệ, Giáo sư Zeleny của Đại học Fordham (1987) đã đề xuất mô hình kim tự tháp DIKW (như thể hiện bên dưới), từ dưới lên trên:
Hình mô hình kim tự tháp DIKW Hai hoặc ba câu hỏi khóKhoảng cách giữa một người và những người xung quanh chủ yếu nằm ở khả năng nắm bắt, hiểu và áp dụng thông tin khác nhau. Dữ liệu và thông tin rất quan trọng. Tuy nhiên, hiện nay có ba vấn đề khó khăn cản trở sự phát triển dữ liệu lành mạnh và có trật tự, đó là xác nhận quyền dữ liệu, giao dịch dữ liệu và các thành phần dữ liệu. Chúng ta phải đối mặt với thách thức, dám hành động và vượt qua mọi khó khăn bằng lòng dũng cảm và trí tuệ to lớn. 1. Xác nhận quyền sở hữu dữ liệuQuan Vũ ở phe Tào Tháo nhưng trong lòng lại theo Hàn. Chúng ta có thể dễ dàng xác định quyền sở hữu của một cơ thể vật chất; Tuy nhiên, tâm trí và linh hồn là vô hình và có tính không chắc chắn, bí mật và đa dạng, thậm chí có thể thuộc về nhiều chủ thể cùng một lúc. Dữ liệu cũng tương tự. Mọi người khó có thể xác định rõ ràng nó thuộc về ai và cũng khó có thể phân chia nó một cách hiệu quả về mặt vật lý cũng như phân bổ quyền hợp lý. Tính phức tạp của việc xác nhận quyền sở hữu liên quan đến đặc điểm của dữ liệu và tính đa dạng của chủ sở hữu quyền. Chuỗi dữ liệu liên quan đến nhiều bên tham gia, mỗi bên đều không thể thiếu và không thể hoạt động một mình, đồng thời mỗi bên đều có những yêu cầu khác nhau. Ngoài ra, mật độ giá trị của dữ liệu thấp và lợi ích tạo ra khó có thể đo lường rõ ràng, khiến chi phí xác nhận quyền dữ liệu trở nên cực kỳ cao. 2. Giao dịch dữ liệuGiao dịch là hành vi cùng có lợi và là hoạt động tự phát và tích cực nhất trong xã hội loài người. Giao dịch chỉ có thể diễn ra nếu cả hai bên đều có lợi. Khi nói đến dữ liệu, giao dịch là một thách thức. UNCTAD (2019) chỉ ra: "Dữ liệu có giá trị sử dụng (hoặc lạm dụng) quan trọng, nhưng không có giá trị trao đổi như hầu hết các hàng hóa kinh tế". Các giao dịch thực tế thường có giá rõ ràng, có thể lặp lại và dự đoán được. Ví dụ, khi một cửa hàng liên tục bán trà sữa với mức giá rõ ràng cho nhiều người tiêu dùng khác nhau, thì lợi ích mà người tiêu dùng nhận được là có thể đoán trước được - giải khát, ngon miệng và tương tác xã hội. Dữ liệu không đồng nhất, giá trị khó đo lường, giá cả khó định lượng, tiện ích mong đợi khó quản lý và có nguy cơ "ăn theo"... Đây là tất cả những vấn đề phải đối mặt trong giao dịch dữ liệu. 3. Các yếu tố dữ liệuCác yếu tố sản xuất là các nguồn lực cơ bản mà con người sử dụng để sản xuất hàng hóa và dịch vụ. Nó tạo điều kiện thuận lợi cho sản xuất nhưng không trở thành một phần của sản phẩm và dịch vụ cũng như không bị thay đổi đáng kể bởi quá trình sản xuất. Marshall, người sáng lập ra trường phái tân cổ điển, đã đề xuất lý thuyết sản xuất bốn yếu tố trong cuốn sách nổi tiếng của ông "Các nguyên lý kinh tế" (1890), cụ thể là đất đai, lao động, vốn và tinh thần kinh doanh. Viện sĩ Mei Hong chỉ ra (2023): "Việc xây dựng dữ liệu như một yếu tố sản xuất quan trọng là sáng kiến của Trung Quốc." Tuy nhiên, việc xác định các yếu tố sản xuất dữ liệu trong kinh tế là một nhiệm vụ khó khăn và vẫn chưa có kết quả có sức ảnh hưởng và thuyết phục nào được đưa ra. Các nhà kinh tế đang rất cần đẩy mạnh nghiên cứu. 3. Tránh sự kiêu ngạo về dữ liệu lớnKhi nói đến những trường hợp kinh điển về khai thác dữ liệu, nhiều người sẽ nghĩ đến "bia và tã" và Google Flu Trends. Trên thực tế, câu chuyện đầu tiên đã xuất hiện từ năm 1992 và chưa bao giờ thực sự xảy ra; phương pháp sau đã dự đoán trước được sự xuất hiện của bệnh cúm, nhưng sau đó đã bị đóng cửa vì độ chính xác quá thấp. Tầm quan trọng của dữ liệu là không thể bàn cãi. Mọi người thích thêm từ "lớn" trước "dữ liệu" để làm nổi bật tính phi thường của nó. Mọi người cũng thường hiểu lầm về "sự kiêu ngạo về dữ liệu lớn". Dữ liệu có thể giải quyết được nhiều vấn đề, nhưng nó có những hạn chế và khó có thể dự đoán được các đột biến thông qua dữ liệu. Một chú lợn sống cuộc sống bình yên không thể dự đoán được thiên nga đen của Tết Nguyên đán dựa trên dữ liệu quá khứ; Dữ liệu di chuyển của xe ngựa có thể giúp con người có được "một con ngựa chạy nhanh hơn", nhưng không thể giúp con người phát minh ra ô tô. Dữ liệu là lợi thế cạnh tranh của doanh nghiệp, nhưng nó không phải là toàn năng. Một ỨNG DỤNG tốt không thể ngồi yên và thư giãn chỉ vì nó có dữ liệu lịch sử. Nó liên tục bị thách thức bởi những người đổi mới và chỉ có thể “phổ biến trong vài năm”. Ngay cả khi doanh nhân không có dữ liệu hoặc sự tích lũy, họ vẫn có thể tung ra các sản phẩm sáng tạo, thu hút người dùng và đạt được thành công. Theo góc nhìn này, việc không có dữ liệu không phải là không thể. Trong thời đại dữ liệu lớn, “tương quan chứ không phải quan hệ nhân quả” được coi là nguyên tắc chỉ đạo. "Điều quan trọng là mọi người phải sử dụng lý luận phân tích để tìm ra lý do tại sao hai thứ xuất hiện cùng lúc hoặc liên tiếp. Chỉ khi lý do đúng thì mới có thể coi đó là kiến thức mới hoặc quy luật mới được phát hiện. Bản thân tương quan không có nhiều giá trị" (Li Guojie, 2015). Tốt hơn là không có “con số” nào còn hơn chỉ tin vào “con số”. Chúng ta phải sử dụng toàn diện các phương pháp khoa học như quan sát thực nghiệm, suy luận logic, quy nạp và tinh chỉnh để khám phá mối quan hệ và quy luật giữa các sự vật nhằm khai thác thông tin và kết luận có giá trị. Chúng tôi coi trọng dữ liệu không phải vì bản thân dữ liệu quan trọng, mà vì tinh thần tìm kiếm sự thật từ những sự kiện tôn trọng thế giới khách quan và các quy luật khách quan là quan trọng. Dữ liệu là sự thật. Như Viện sĩ Lý Quốc Kiệt (2015) đã nói: “Gắn chặt tầm quan trọng vào dữ liệu có nghĩa là nhấn mạnh tinh thần khoa học trong việc nói lên sự thật và tuân theo tư duy hợp lý”. Tác giả: Yan Deli; Tài khoản công khai WeChat: "Viện nghiên cứu Tencent (ID: cyberlawrc)" |
<<: Khả năng tư duy của bạn đang ở mức độ nào?
>>: Thương hiệu và giá cả quyết định sự sống còn
Máy in dùng chung đã trở thành thiết bị phổ biến t...
Với sự ra mắt của Huawei Enjoy 20, sản phẩm đã trở...
Bản chất của mọi doanh nghiệp là phục vụ con ngườ...
Trong bối cảnh tốc độ phát triển của Internet đan...
Việc mang theo và lưu trữ dữ liệu rất tiện lợi, và...
Xu hướng tiêu thụ thú cưng đang trở nên phổ biến ...
Vậy làm sao để giải quyết vấn đề? Hầu hết nguyên n...
Trong những năm gần đây, ngành thương mại điện tử...
Khi kỳ nghỉ hè đang đến gần, các bậc phụ huynh đã ...
Mỗi người có phong cách khác nhau và điện thoại Ap...
Tôi tin rằng mọi người đều biết tiệm cắt tóc Youj...
Điện thoại di động đã trở thành công cụ không thể ...
Điện thoại Apple luôn được người dùng yêu thích vì...
Với sự tiến bộ không ngừng của công nghệ trí tuệ ...
Nhưng đôi khi sẽ có trường hợp máy rèm khí không c...