Cách các nhà phân tích dữ liệu nên hợp tác với các kỹ sư thuật toán là một vấn đề cũ. Một mặt, phía doanh nghiệp ngày càng có nhiều tưởng tượng về mô hình này. Mặt khác, rất nhiều công ty gặp phải các vấn đề như thu thập dữ liệu kém, thiếu nhân sự dữ liệu, mục tiêu công việc không rõ ràng, v.v. Phân tích và thuật toán có thể phối hợp với nhau như thế nào để đạt được hiệu quả cao hơn? Hôm nay tôi xin chia sẻ hệ thống này. 1. Hai cách thực hành sai điển hình: Phong cách GoubuliMột số nhà lãnh đạo công ty thích phàn nàn về sự kém cỏi của các nhà phân tích dữ liệu của công ty mình, luôn nghĩ rằng "chỉ cần có thể đưa ra được mô hình là đã tuyệt rồi". Kết quả là, các nhà phân tích dữ liệu đều cố gắng tự bảo vệ mình và chỉ đơn giản là vạch ra ranh giới giữa họ và mọi công việc liên quan đến từ "mô hình", để lại mọi việc cho các kỹ sư thuật toán. Tất nhiên, làm như vậy sẽ phá hỏng thuật toán. Chưa kể, trong nhiều trường hợp, mô hình mà người lãnh đạo nêu ra chỉ đơn thuần là một cái gì đó mơ hồ như "SWOT"; Chưa kể, nhiều mục tiêu của người mẫu chỉ đơn giản là những điều không thực tế như "dự đoán những gì tôi có thể làm để thành công". Nếu không có ai hỗ trợ công việc sàng lọc tính năng cơ bản, các kỹ sư thuật toán sẽ kiệt sức. Tiến độ dự án chậm, và cuối cùng tôi vẫn bị chỉ trích: "Tại sao mô hình của anh không thể đưa ra dự đoán chính xác 100%!!!" Tất nhiên, những vấn đề như vậy thường gặp ở các doanh nghiệp truyền thống. Đặc biệt trong giai đoạn chuyển đổi số, các nhà lãnh đạo đã xem rất nhiều bài thuyết trình dài dòng và nghĩ rằng họ hiểu rất rõ các doanh nghiệp truyền thống. Kiểu chó : Một số công ty Internet có định vị tương đối rõ ràng về việc ứng dụng thuật toán và vị thế của nhóm thuật toán cũng tương đối cao. Vì vậy, họ đi đến thái cực khác: đối xử với các nhà phân tích được phân công vào nhóm thuật toán như những con chó. Bạn không cần phải lo lắng về những gì tôi làm, chỉ cần lấy dữ liệu theo những gì tôi nói. Công việc phân tích dữ liệu bị quá tải bởi các bảng thu thập dữ liệu vô tận. Khi làm như vậy, mọi người sẽ bị đặt vào tình thế nguy hiểm. Bởi vì ngay cả các nhà phân tích dữ liệu còn không hiểu được logic của thuật toán, chứ đừng nói đến bộ phận vận hành. Trong trường hợp không có kiến thức, bộ phận vận hành chỉ có thể suy ra hiệu quả của thuật toán thông qua việc theo dõi chỉ số dữ liệu đơn giản. Và ngay khi có dấu hiệu rắc rối nhỏ nhất, họ bắt đầu đặt câu hỏi: "Thuật toán không hoạt động!", "Bạn đã bí mật thay đổi cái gì vậy!", "Bạn chỉ đang đùa thôi!" Những nghi ngờ này sẽ trở thành ngòi nổ cho việc đổ lỗi và cãi vã giữa các phòng ban, gây ra xung đột nội bộ không hồi kết. 2. Những ý tưởng cơ bản để phá vỡ thế bế tắcVề bản chất, phân tích và thuật toán đều là ứng dụng của dữ liệu. Vậy thì câu hỏi đặt ra ở đây là: Với dữ liệu, liệu tiền có cứ thế chảy ra khỏi máy tính thành một dòng vô tận không? Rõ ràng là không! Bản thân dữ liệu không thể chữa khỏi mọi bệnh tật. Nếu bạn muốn dữ liệu phát huy tác dụng, bạn phải tích hợp chặt chẽ dữ liệu với thực tế kinh doanh và tìm ra những điểm mà dữ liệu có thể giúp ích. Tuy nhiên, tình hình kinh doanh thực tế rất phức tạp và dữ liệu cũng như hành vi kinh doanh thường gắn liền với nhau. Ví dụ:
Vào thời điểm này, bộ phận kinh doanh luôn có thể đổ lỗi: "Dữ liệu của chúng tôi quá kém, sẽ thật tuyệt nếu chúng tôi có thuật toán của Byte." Về mặt dữ liệu, cả thuật toán và phân tích đều đáng trách. Do đó, giải pháp tối ưu là sinh viên dữ liệu phải đoàn kết, tìm ra những kịch bản tốt, đạt được thành tựu và giảm bớt sự đổ lỗi , thay vì đổ lỗi cho nhau. Những từ ngữ sáo rỗng nghe có vẻ quá trống rỗng, vậy hãy cùng xem xét nó trong một tình huống vấn đề cụ thể. 3. Kịch bản hợp tác điển hình 1Kịch bản vấn đề thành lập dự án : Một công ty sản xuất lớn hy vọng thiết lập "mô hình phân tích ba chiều đa chiều" để cải thiện hiệu quả tuyển dụng. Câu hỏi: Làm sao để đáp ứng được nhu cầu hiện nay? Đây là tình huống điển hình khi các yêu cầu không rõ ràng.
Các tình huống trên không rõ ràng Do đó, bất kể ai phụ trách thuật toán/phân tích, bất kỳ ai tiếp nhận nhu cầu đều phải đặt ra những câu hỏi trên trước. Tất nhiên, khi định nghĩa vấn đề không rõ ràng, thì việc để nhà phân tích dữ liệu đứng ra giao tiếp sẽ phù hợp hơn. Các nhà phân tích dữ liệu gần gũi hơn với doanh nghiệp và có thể dễ dàng hiểu được ngôn ngữ kinh doanh và định hướng các ý tưởng kinh doanh. Phía doanh nghiệp phản hồi thêm:
Vậy, đã đến lúc bắt đầu xây dựng mô hình “đa chiều” và “ba chiều” chưa? KHÔNG! Không hề gần chút nào! IV. Kịch bản hợp tác điển hình 2Có ba vấn đề chính trong việc phân chia nhiệm vụ , hạn chế tiến độ của dự án: 1. Định nghĩa về vị trí quản lý “phù hợp” không rõ ràng .Việc đánh giá người quản lý phức tạp hơn nhiều so với việc đánh giá công nhân lắp ráp. Công nhân lắp ráp chỉ cần kiểm tra một vài thông tin đơn giản như tuổi tác, CMND, trình độ học vấn là có thể vượt qua được bài đánh giá công việc chuẩn hóa. Tình hình đối với các nhà quản lý phức tạp hơn nhiều vì cũng có những điểm đánh giá mang tính cá nhân hóa cao và không thể định lượng như "liệu lãnh đạo có thích anh ta hay không". Vì vậy, chúng ta không thể dừng lại ở đây. Cần có định nghĩa sâu hơn. 2. Thiếu dữ liệu về lực lượng lao động của từng tỉnh, thành phố .Lưu ý: Việc sàng lọc những ứng viên phù hợp từ hồ sơ mà phòng nhân sự đang nhận và xác định nơi nào có nhiều nhân lực hơn trong biển người là hai vấn đề hoàn toàn khác nhau. Bởi vì dữ liệu đã tiếp nhận có thể đếm được, nhưng lại không có dữ liệu nào cho biển người mênh mông. Nếu chúng ta bắt đầu làm việc một cách mù quáng, rất có thể sẽ dẫn đến sai lầm. 3. Chi phí tuyển dụng chung của bộ phận và hiệu quả tuyển dụng là hai vấn đề cơ bản .Chi phí lao động của toàn bộ phòng ban, ngoài việc tuyển dụng mới, còn bao gồm tiền lương và phúc lợi liên tục, tiền bồi thường cho những người nghỉ việc, v.v. Nếu mục tiêu là kiểm soát tổng chi phí của phòng ban, thì bộ phận nào có tổng số tiền cao nhất, bộ phận nào chiếm tỷ lệ lớn nhất, bộ phận nào dư thừa và bộ phận nào tăng trưởng nhanh nhất, tất cả đều cần được phân tích rõ ràng trước. Chúng ta hãy cùng xem cách giải quyết nhé. Đến thời điểm này, ít nhất có thể chia nhỏ năm nhiệm vụ.
Năm nhiệm vụ này chủ yếu là công việc phân tích dữ liệu. Phân tích dữ liệu làm rõ tình hình hiện tại và thu thập dữ liệu để các thuật toán tiếp theo có thể nhắm mục tiêu tốt hơn. Ví dụ: 1. Trong trường hợp có nhãn "phù hợp/không phù hợp" cho các vị trí quản lý, một mô hình dự đoán phân loại (hồi quy logistic/cây quyết định) được xây dựng cho người được phỏng vấn dựa trên thông tin sơ yếu lý lịch, thông tin do người săn đầu người cung cấp và thông tin kênh tuyển dụng để dự đoán xác suất "phù hợp". 2. Khi bạn đã có dữ liệu về cơ cấu chi phí lao động chung, lý do tăng trưởng và xu hướng phát triển, hãy xây dựng một mô hình dự đoán (chuỗi thời gian/hồi quy đa biến) để xác định xem chi phí lao động có vượt quá kỳ vọng hay không, từ đó can thiệp vào quá trình ra quyết định (không tuyển dụng số lượng lớn do thiếu hụt nhân viên ngắn hạn và so sánh sự khác biệt về chi phí giữa tiền làm thêm giờ và việc tuyển thêm nhân viên mới). Tất nhiên, còn có điểm hợp tác thứ ba: khi có thách thức phát sinh trong công việc, chúng tôi cùng nhau giải quyết. V. Kịch bản hợp tác điển hình 3Để trả lời câu hỏi cuối cùng là “Tại sao mô hình lại không chính xác?”, mọi người phải cùng nhau làm việc. Điều đầu tiên cần loại trừ là tác động của các yếu tố bên ngoài, biến động bất ngờ và hành vi kinh doanh chủ động . Đừng ném bùn vào mô hình chỉ vì nó là một vấn đề. Ví dụ: sự thay đổi đột ngột ở ban quản lý cấp cao dẫn đến những thay đổi trong yêu cầu tuyển dụng quản lý; xảy ra dịch bệnh tại nơi tuyển dụng, nhân viên không thể rời đi; các công ty hàng đầu trong ngành đột nhiên tăng lương, làm tăng chi phí của toàn bộ ngành; kế hoạch tuyển dụng ban đầu bị hoãn lại vì nhiều lý do, và các kỳ vọng không đạt được, do đó cần phải bổ sung các kênh/phương pháp mới. Tất cả những yếu tố này sẽ làm cho mô hình được thiết kế ban đầu trở nên vô giá trị hoặc giảm hiệu quả của nó. Để ứng phó với những thay đổi này, phân tích dữ liệu phải được đặt lên hàng đầu. Khi theo dõi dữ liệu hàng ngày, các vấn đề có thể được phát hiện sớm, rủi ro kinh doanh có thể được cảnh báo và mọi người có thể được nhắc nhở chú ý đến những thay đổi. Thay vì chờ doanh nghiệp tìm đến bạn rồi mới tranh cãi với bạn. VI. Bản tóm tắtSự khác biệt về bản chất công việc của thuật toán và phân tích có nghĩa là khi hai công nghệ này hợp tác và phân chia công việc, chúng sẽ có trọng tâm khác nhau. Cách hợp tác lý tưởng là: phân tích để giải quyết các trở ngại trong kinh doanh và thuật toán để nâng cao hiệu quả . Chúng ta hãy cùng nhau đạt được kết quả. Trên thực tế, nếu bạn làm việc đủ lâu và có đủ tiếp xúc với doanh nghiệp, bạn sẽ thấy rằng hầu hết các yêu cầu "xây dựng mô hình" đến trực tiếp từ doanh nghiệp đều không đáng tin cậy, do thiếu dữ liệu hoặc mục tiêu không rõ ràng. Đặc biệt là khi nói đến các vấn đề dự đoán (các vấn đề phân loại tương đối tốt hơn). Các nhu cầu được chuyển đổi bởi các nhà phân tích dữ liệu đáng tin cậy hơn nhiều. Tác giả: Thầy giáo thực tế Chen Tài khoản công khai WeChat: "Cô giáo Chen thực tế" |
Nhưng đôi khi chúng ta có thể gặp phải vấn đề là đ...
Bài viết này khám phá giá trị sâu sắc và con đườn...
Điều này có thể do vấn đề tín hiệu. Đôi khi bạn có...
Trong thời đại số ngày nay, Internet đã trở thành ...
Trong xã hội hiện đại, ảnh đã trở thành một trong ...
Tủ đông cũng có thể gặp một số lỗi. Tủ đông đóng v...
Vào năm 2017, Dark Warrior, một trò chơi nhập vai ...
Điện thoại di động đã trở thành một phần không thể...
Ở thời đại số, máy tính đã trở thành một phần khôn...
“Thương mại điện tử dựa trên người mua” mà Xiaoho...
Trong thời đại bùng nổ thông tin như hiện nay, AI...
Với việc nâng cao mức tiêu dùng và nâng cao nhận ...
Trong cuộc sống và công việc hàng ngày, chúng ta t...
Gần đây, một bà mối tên là Vương Pha đã xuất hiện...
Thư mục Users là thư mục quan trọng để lưu trữ dữ ...