"Tôi không muốn sử dụng máy tính nữa, tôi muốn làm việc theo dự án." Nhiều sinh viên làm việc trong ngành khoa học dữ liệu có mong muốn mãnh liệt này. Thực sự không phải là điều tốt khi tính toán số liệu một cách máy móc hàng ngày mà không biết dữ liệu đó dùng để làm gì. Mọi người đều muốn có cơ hội tự mình chịu trách nhiệm cho một dự án. Tuy nhiên, nhiều sinh viên vẫn còn nhiều nghi ngờ:
Chúng ta hãy bắt đầu ngày hôm nay với câu hỏi đầu tiên: Dự án phân tích dữ liệu là gì? 1. Dự án là gì?Bản chất của dự án là sắp xếp nguồn nhân lực và vật lực trong một khoảng thời gian nhất định để đạt được mục tiêu đầu ra cụ thể. Mặc dù câu này đơn giản, nhưng nó nêu bật ba khía cạnh chính của một dự án: thời gian, chi phí và chất lượng đầu ra. Ba chiều này thường được gọi là "tam giác sắt dự án". Nó được gọi là một dự án vì nó tương ứng với công việc thường xuyên.
Bạn thấy đấy, cả hai đều là đường sắt. Nếu bạn làm việc chăm chỉ cả đời để bảo trì tuyến đường sắt cũ, sẽ không ai để ý đến điều đó. Nhưng nếu xây dựng một tuyến đường mới, chắc chắn bạn sẽ trang trí nó bằng đèn và màu sắc, đánh trống, chiêng và đốt pháo. Điều này cũng tương tự như việc chúng ta đều thích làm việc theo dự án và không thích bị sa lầy vào công việc thường ngày. Trong công ty, một số phòng ban có nhiều dự án và thường gây xôn xao dư luận, trong khi một số phòng ban có rất ít dự án và chỉ có thể nuốt cơn tức giận vào trong. 2. Dự án dữ liệu là gì?Sự thật tàn khốc là: mặc dù các ông chủ cứ nói về "dữ liệu lớn", "trí tuệ nhân tạo" và "chuyển đổi số", nhưng ở hầu hết các công ty, dữ liệu giống như một chuỗi cung ứng hơn. Mặc dù mọi người đều nói rằng điều này rất quan trọng nhưng đó là tương lai và là xu hướng. Nhưng cuối cùng, thứ nhất, bạn không thể kiếm tiền cho công ty, và thứ hai, bạn đang làm công việc khó khăn để phục vụ người khác. Tình huống đáng xấu hổ này có nghĩa là trạng thái dữ liệu chắc chắn sẽ ở mức thấp. Những công ty có địa vị cao hơn một chút là một số công ty có thể kiếm tiền trực tiếp từ dữ liệu (chẳng hạn như các công ty tư vấn bán dữ liệu và dịch vụ dữ liệu, các công ty dịch vụ của bên thứ ba và các sản phẩm từ Internet đến B) hoặc chờ kiếm tiền từ dữ liệu (thuê một nhóm lập trình viên và chứng minh với các ông bố đầu tư mạo hiểm rằng họ là một công ty dữ liệu lớn về trí tuệ nhân tạo). Vì địa vị của một người không cao nên tự nhiên sẽ có ít dự án được giao cho người đó hơn. 3. Dự án phân tích dữ liệu là gì?Biểu hiện cốt lõi của việc giao ít dự án là khi công việc dữ liệu được chia nhỏ, mọi thứ đều trở thành công việc hàng ngày . Đúng vậy, họ không phải là người viết mã và họ hoàn toàn không thể hiểu được bạn đã phải bỏ ra bao nhiêu công sức để viết ra bảy từ "lấy dữ liệu đó". Điều này không tốt bằng chuỗi cung ứng. Ít nhất khi mọi người nhìn thấy những núi vật liệu, họ sẽ cảm nhận được công sức lao động của mình. Mọi người nhìn vào dữ liệu giống như bà mẹ già ở nhà: "Bạn làm gì trước máy tính mỗi ngày?" Do đó, nếu bạn muốn khởi động một dự án liên quan đến dữ liệu, chỉ có một cách: thực hiện nó cùng một lúc! Tất cả những công việc khó khăn nêu trên đều được thực hiện dưới vỏ bọc của một cái tên không liên quan gì đến dữ liệu nhưng lại nghe có vẻ tuyệt vời (đúng vậy, nó liên quan đến trí tuệ kinh doanh). Trong số đó, dự án hợp pháp, công khai và dễ thấy nhất là dự án BI với màn hình dữ liệu lớn. Các phòng dữ liệu của vô số công ty truyền thống giành được sự ưu ái của sếp bằng cách thực hiện các dự án màn hình lớn. Tất nhiên, tình hình này đã thay đổi trong hai năm qua. Tiếng sủa của AlphaGo mang lại hy vọng về trí tuệ nhân tạo cho vô số ông chủ. Khi đối mặt với những vấn đề không thể giải quyết, con người thường đặt hy vọng vào một sức mạnh kỳ diệu nào đó mà họ không thể hiểu được nhưng người khác lại bàn tán về nó. Trước kia là Kinh Dịch, tiền đồng và Bát Quái, còn bây giờ là thuật toán trí tuệ nhân tạo. Kết quả là nhiều dự án thuật toán đã được triển khai. Trên thực tế, trước khi có cơn sốt truyền thông tự phát, đã có nhiều trường hợp thành công trong việc sử dụng thuật toán để cải thiện hoạt động kinh doanh, chẳng hạn như xác định rủi ro vỡ nợ thông qua thuật toán, cải thiện tỷ lệ thành công của cuộc gọi đi, tăng tỷ lệ nhấp chuột của người dùng, dự đoán lượng điện tiêu thụ/lượng cuộc gọi, v.v. Nhưng các ứng dụng này có chất lượng dữ liệu rất nghiêm ngặt và các kịch bản ứng dụng rất rõ ràng. Điều này không có nghĩa là bạn có thể đưa một số dữ liệu ngẫu nhiên vào mô hình và mong đợi kết quả. Chưa kể đến việc nó độc lập về hệ thống quản lý, đầu tư vốn, cơ sở hạ tầng và hợp tác kinh doanh. Chỉ cần mã còn chạy, tiền sẽ chảy ra khỏi màn hình. Kết quả là, nhiều dự án vội vã dấn thân vào vũng nước đục của thuật toán đều phải chịu kết cục bi thảm. Nhưng điều đó không quan trọng. Chẳng bao lâu sau, mọi người đã tìm ra một sức mạnh mới mà họ không thể hiểu được nhưng những người khác lại cho là kỳ diệu: nền tảng dữ liệu trung gian! Vậy là một vòng mới chứng kiến sự trỗi dậy và sụp đổ của các tòa nhà cao tầng đã bắt đầu vào năm 2020. 4. Các vấn đề với dự án phân tích dữ liệu là gì?Theo góc nhìn về tam giác sắt của dự án, khi so sánh dữ liệu với các dự án khác, điểm mấu chốt rất dễ nhận thấy: Ngay cả những con số chẵn cũng khó có thể phản ánh được giá trị. Ví dụ, khi phân tích nguyên nhân, ngay cả khi không xem dữ liệu, doanh nghiệp vẫn có thể đoán được một số lý do. Nếu bạn chỉ giới hạn bản thân trong việc đề xuất một giả thuyết và xác minh nó bằng dữ liệu trong doanh nghiệp, thì bạn chẳng khác gì một chú chó bắt đĩa bay. Dù bạn có làm việc chăm chỉ đến đâu, mọi người vẫn nghĩ bạn chỉ là một người thợ sửa chữa. Trên đây là những lý do cơ bản tại sao ít dự án phân tích dữ liệu được triển khai và khó thành công. Tất nhiên, điều còn tệ hơn nữa là nhiều người mới vào nghề không nhận ra điều này (đặc biệt là những người vừa tốt nghiệp sau đại học và đã viết nhiều bài báo với những cái tên phức tạp). Họ khoe sơ đồ, mô hình và mã của mình như một học sinh tiểu học khoe máy biến hình mới của mình trước lớp. Lòng tôi tràn ngập suy nghĩ: “Tôi thật tuyệt vời.” Bỏ qua thực tế là khi nói đến việc vận chuyển hàng hóa, xe tải ben thông thường nhất cũng tốt hơn Optimus Prime. Nếu bạn muốn đột phá, bạn phải bám vào tam giác dự án: 1. Thời gian(1) Thiết lập hệ thống giám sát trong thời gian bình thường để giải phóng lao động khỏi việc thu thập dữ liệu tạm thời. (2) Dựa trên dữ liệu hàng ngày, tích lũy kinh nghiệm và nắm bắt cơ hội! (3) Khơi dậy cảm giác khủng hoảng kinh doanh vào những thời điểm quan trọng và thực hiện các dự án mà bạn chịu trách nhiệm độc lập. 2. Chi phí(1) Làm mọi cách có thể để cải thiện chất lượng dữ liệu. (2) Thúc đẩy xây dựng cơ sở hạ tầng dữ liệu khi thời điểm thích hợp. (3) Xem xét lượng dữ liệu ít nhất cho mỗi dự án và sử dụng mô hình đơn giản nhất để giải quyết vấn đề. 3. Chất lượng(1) Cơ sở hạ tầng : Làm nhiều việc hơn từ 0 đến 1, lấp đầy khoảng trống và chứng minh thành tích. (2) Phương pháp luận : Thiết lập logic lý luận, suy nghĩ theo góc độ kinh doanh và hành động như một người hướng dẫn hơn là một giáo viên. (3) Gợi ý : Đề xuất 100 giả thuyết để làm kinh ngạc giới doanh nhân và chủ động đưa ra kết quả. Từ những điều trên, tôi nghĩ mọi người đều có thể hiểu được thời gian và chi phí. Phần chất lượng sẽ dễ hiểu hơn khi xét đến những trường hợp cụ thể. Tác giả: Thầy giáo thực tế Chen Nguồn: Tài khoản chính thức của WeChat: "Cô giáo Chen thực tế" |
<<: Làm thế nào để tiến hành phân tích dữ liệu hoạt động?
>>: NIO, "Haidilao" của ngành công nghiệp ô tô, tiến hành tiếp thị tên miền riêng như thế nào?
Bàn phím máy tính đóng vai trò quan trọng trong vi...
Máy giặt là một trong những thiết bị gia dụng khôn...
Vào năm 2024, Boss IP sẽ trở thành xu hướng mới t...
Nhưng đôi khi sẽ có vấn đề với âm thanh đột ngột. ...
Chúng ta có thể thử nhấn và giữ nút nguồn và nút g...
Nhưng đôi khi bạn có thể gặp phải vấn đề không ngh...
Trong lĩnh vực thương mại điện tử, việc lựa chọn ...
Khi sử dụng máy tính, chúng ta thường cài đặt chế ...
Hiện tại vẫn còn rất nhiều điện thoại di động mà m...
Vào năm mới, mọi người đã bắt đầu suy nghĩ về các...
Adobe Photoshop (gọi tắt là PS) đóng vai trò quan ...
Máy tính bảng đã trở thành một phần không thể thiế...
Làm thế nào để xây dựng hệ thống phân tích dữ liệ...
Nhiều tệp và thư mục mặc định bị ẩn trong hệ điều ...
Nếu địa chỉ lưu tệp là exchange, định dạng của tệp...