Nhà phân tích dữ liệu Kỹ sư thuật toán PK, Ai là người chiến thắng?

Nhà phân tích dữ liệu Kỹ sư thuật toán PK, Ai là người chiến thắng?

Xuất phát từ vấn đề hợp tác giữa các nhà phân tích dữ liệu và các nhà phân tích thuật toán, bài viết này phân tích các tình huống lỗi điển hình và đưa ra ý tưởng phá vỡ bế tắc, cho chúng ta thấy kịch bản hợp tác đúng đắn và hài hòa. Tài liệu đọc được khuyến nghị cho các nhà phân tích dữ liệu và kỹ sư thuật toán.

Cách các nhà phân tích dữ liệu nên hợp tác với các kỹ sư thuật toán là một vấn đề cũ. Một mặt, phía doanh nghiệp ngày càng có nhiều tưởng tượng về mô hình này. Mặt khác, rất nhiều công ty gặp phải các vấn đề như thu thập dữ liệu kém, thiếu nhân sự dữ liệu, mục tiêu công việc không rõ ràng, v.v. Phân tích và thuật toán có thể phối hợp với nhau như thế nào để đạt được hiệu quả cao hơn? Hôm nay tôi xin chia sẻ hệ thống này.

1. Hai cách thực hành sai điển hình: Phong cách Goubuli

Một số nhà lãnh đạo công ty thích phàn nàn về sự kém cỏi của các nhà phân tích dữ liệu của công ty mình, luôn nghĩ rằng "chỉ cần có thể đưa ra được mô hình là đã tuyệt rồi". Kết quả là, các nhà phân tích dữ liệu đều cố gắng tự bảo vệ mình và chỉ đơn giản là vạch ra ranh giới giữa họ và mọi công việc liên quan đến từ "mô hình", để lại mọi việc cho các kỹ sư thuật toán.

Tất nhiên, làm như vậy sẽ phá hỏng thuật toán.

Chưa kể, trong nhiều trường hợp, mô hình mà người lãnh đạo nêu ra chỉ đơn thuần là một cái gì đó mơ hồ như "SWOT";

Chưa kể, nhiều mục tiêu của người mẫu chỉ đơn giản là những điều không thực tế như "dự đoán những gì tôi có thể làm để thành công".

Nếu không có ai hỗ trợ công việc sàng lọc tính năng cơ bản, các kỹ sư thuật toán sẽ kiệt sức. Tiến độ dự án chậm, và cuối cùng tôi vẫn bị chỉ trích: "Tại sao mô hình của anh không thể đưa ra dự đoán chính xác 100%!!!"

Tất nhiên, những vấn đề như vậy thường gặp ở các doanh nghiệp truyền thống. Đặc biệt trong giai đoạn chuyển đổi số, các nhà lãnh đạo đã xem rất nhiều bài thuyết trình dài dòng và nghĩ rằng họ hiểu rất rõ các doanh nghiệp truyền thống.

Kiểu chó : Một số công ty Internet có định vị tương đối rõ ràng về việc ứng dụng thuật toán và vị thế của nhóm thuật toán cũng tương đối cao. Vì vậy, họ đi đến thái cực khác: đối xử với các nhà phân tích được phân công vào nhóm thuật toán như những con chó. Bạn không cần phải lo lắng về những gì tôi làm, chỉ cần lấy dữ liệu theo những gì tôi nói. Công việc phân tích dữ liệu bị quá tải bởi các bảng thu thập dữ liệu vô tận.

Khi làm như vậy, mọi người sẽ bị đặt vào tình thế nguy hiểm. Bởi vì ngay cả các nhà phân tích dữ liệu còn không hiểu được logic của thuật toán, chứ đừng nói đến bộ phận vận hành. Trong trường hợp không có kiến ​​thức, bộ phận vận hành chỉ có thể suy ra hiệu quả của thuật toán thông qua việc theo dõi chỉ số dữ liệu đơn giản. Và ngay khi có dấu hiệu rắc rối nhỏ nhất, họ bắt đầu đặt câu hỏi: "Thuật toán không hoạt động!", "Bạn đã bí mật thay đổi cái gì vậy!", "Bạn chỉ đang đùa thôi!" Những nghi ngờ này sẽ trở thành ngòi nổ cho việc đổ lỗi và cãi vã giữa các phòng ban, gây ra xung đột nội bộ không hồi kết.

2. Những ý tưởng cơ bản để phá vỡ thế bế tắc

Về bản chất, phân tích và thuật toán đều là ứng dụng của dữ liệu. Vậy thì câu hỏi đặt ra ở đây là: Với dữ liệu, liệu tiền có cứ thế chảy ra khỏi máy tính thành một dòng vô tận không? Rõ ràng là không! Bản thân dữ liệu không thể chữa khỏi mọi bệnh tật. Nếu bạn muốn dữ liệu phát huy tác dụng, bạn phải tích hợp chặt chẽ dữ liệu với thực tế kinh doanh và tìm ra những điểm mà dữ liệu có thể giúp ích.

Tuy nhiên, tình hình kinh doanh thực tế rất phức tạp và dữ liệu cũng như hành vi kinh doanh thường gắn liền với nhau.

Ví dụ:

  • DAU video ngắn giảm, liệu có phải do thuật toán đề xuất không đủ mạnh hay do chất lượng của chính người sáng tạo quá kém?
  • Tỷ lệ chuyển đổi giao dịch đã giảm. Có phải do sản phẩm được giới thiệu không tốt hay do nguồn hàng không được lựa chọn kỹ?
  • Dự báo hiệu suất có không chính xác không? Có phải do mô hình dự báo không đủ mạnh hay do bản thân doanh nghiệp lỏng lẻo?

Vào thời điểm này, bộ phận kinh doanh luôn có thể đổ lỗi: "Dữ liệu của chúng tôi quá kém, sẽ thật tuyệt nếu chúng tôi có thuật toán của Byte." Về mặt dữ liệu, cả thuật toán và phân tích đều đáng trách. Do đó, giải pháp tối ưu là sinh viên dữ liệu phải đoàn kết, tìm ra những kịch bản tốt, đạt được thành tựu và giảm bớt sự đổ lỗi , thay vì đổ lỗi cho nhau.

Những từ ngữ sáo rỗng nghe có vẻ quá trống rỗng, vậy hãy cùng xem xét nó trong một tình huống vấn đề cụ thể.

3. Kịch bản hợp tác điển hình 1

Kịch bản vấn đề thành lập dự án : Một công ty sản xuất lớn hy vọng thiết lập "mô hình phân tích ba chiều đa chiều" để cải thiện hiệu quả tuyển dụng. Câu hỏi: Làm sao để đáp ứng được nhu cầu hiện nay?

Đây là tình huống điển hình khi các yêu cầu không rõ ràng.

  • Hiệu quả tuyển dụng là gì?
  • Giảm chi phí tuyển dụng? Liệu việc giữ chân nhân tài có tốt hơn sau khi tuyển dụng không? Tuyển dụng đúng người?
  • Người phù hợp là ai? Có định nghĩa rõ ràng nào không?
  • Định nghĩa về “phù hợp” có nhất quán giữa công nhân dây chuyền lắp ráp, nhân viên bán hàng, lập kế hoạch tiếp thị và quản lý không?
  • Các vấn đề tuyển dụng dành cho công nhân lắp ráp, nhân viên bán hàng, lập kế hoạch tiếp thị và quản lý có giống nhau không?

Các tình huống trên không rõ ràng

Do đó, bất kể ai phụ trách thuật toán/phân tích, bất kỳ ai tiếp nhận nhu cầu đều phải đặt ra những câu hỏi trên trước. Tất nhiên, khi định nghĩa vấn đề không rõ ràng, thì việc để nhà phân tích dữ liệu đứng ra giao tiếp sẽ phù hợp hơn. Các nhà phân tích dữ liệu gần gũi hơn với doanh nghiệp và có thể dễ dàng hiểu được ngôn ngữ kinh doanh và định hướng các ý tưởng kinh doanh.

Phía doanh nghiệp phản hồi thêm:

  • Để giúp tuyển dụng nhiều người phù hợp hơn cho các vị trí quản lý
  • Chúng tôi thấy rằng việc tuyển dụng công nhân lắp ráp ở tỉnh, thành phố XX dễ dàng hơn. Chúng tôi tuyển dụng họ theo cách tập trung.
  • Để giữ chi phí lao động của toàn bộ phòng ban trong phạm vi XXX triệu nhân dân tệ

Vậy, đã đến lúc bắt đầu xây dựng mô hình “đa chiều” và “ba chiều” chưa?

KHÔNG! Không hề gần chút nào!

IV. Kịch bản hợp tác điển hình 2

Có ba vấn đề chính trong việc phân chia nhiệm vụ , hạn chế tiến độ của dự án:

1. Định nghĩa về vị trí quản lý “phù hợp” không rõ ràng .

Việc đánh giá người quản lý phức tạp hơn nhiều so với việc đánh giá công nhân lắp ráp. Công nhân lắp ráp chỉ cần kiểm tra một vài thông tin đơn giản như tuổi tác, CMND, trình độ học vấn là có thể vượt qua được bài đánh giá công việc chuẩn hóa. Tình hình đối với các nhà quản lý phức tạp hơn nhiều vì cũng có những điểm đánh giá mang tính cá nhân hóa cao và không thể định lượng như "liệu lãnh đạo có thích anh ta hay không". Vì vậy, chúng ta không thể dừng lại ở đây. Cần có định nghĩa sâu hơn.

2. Thiếu dữ liệu về lực lượng lao động của từng tỉnh, thành phố .

Lưu ý: Việc sàng lọc những ứng viên phù hợp từ hồ sơ mà phòng nhân sự đang nhận và xác định nơi nào có nhiều nhân lực hơn trong biển người là hai vấn đề hoàn toàn khác nhau. Bởi vì dữ liệu đã tiếp nhận có thể đếm được, nhưng lại không có dữ liệu nào cho biển người mênh mông. Nếu chúng ta bắt đầu làm việc một cách mù quáng, rất có thể sẽ dẫn đến sai lầm.

3. Chi phí tuyển dụng chung của bộ phận và hiệu quả tuyển dụng là hai vấn đề cơ bản .

Chi phí lao động của toàn bộ phòng ban, ngoài việc tuyển dụng mới, còn bao gồm tiền lương và phúc lợi liên tục, tiền bồi thường cho những người nghỉ việc, v.v. Nếu mục tiêu là kiểm soát tổng chi phí của phòng ban, thì bộ phận nào có tổng số tiền cao nhất, bộ phận nào chiếm tỷ lệ lớn nhất, bộ phận nào dư thừa và bộ phận nào tăng trưởng nhanh nhất, tất cả đều cần được phân tích rõ ràng trước. Chúng ta hãy cùng xem cách giải quyết nhé.

Đến thời điểm này, ít nhất có thể chia nhỏ năm nhiệm vụ.

  1. Xác định “sự phù hợp” của các vị trí quản lý (để xác định sự phù hợp, bạn có thể cần xây dựng một mô hình kinh doanh riêng, chẳng hạn như mô hình năng lực).
  2. Dựa trên dữ liệu phỏng vấn trước đây, đánh dấu mức độ “phù hợp” của các vị trí quản lý để chuẩn bị cho mô hình hóa.
  3. Thu thập dữ liệu thị trường lao động từ nhiều khu vực khác nhau (thông tin do thị trường lao động công bố, thông tin do các bên trung gian cung cấp, v.v.).
  4. Kết hợp với các hoạt động tuyển dụng trước đây, tính hợp lý của việc tuyển dụng theo khu vực đã được kiểm chứng (cũng có khả năng mặc dù người tìm việc đến từ các tỉnh nội địa nhưng họ vẫn đến các tỉnh ven biển để tìm việc, do đó việc phân chia theo khu vực không thực sự có ý nghĩa. Những giả định này cần được kiểm chứng).
  5. Phân tích cơ cấu và xu hướng chi phí lao động chung để tìm ra những điểm chính trong kiểm soát chi phí.

Năm nhiệm vụ này chủ yếu là công việc phân tích dữ liệu. Phân tích dữ liệu làm rõ tình hình hiện tại và thu thập dữ liệu để các thuật toán tiếp theo có thể nhắm mục tiêu tốt hơn. Ví dụ:

1. Trong trường hợp có nhãn "phù hợp/không phù hợp" cho các vị trí quản lý, một mô hình dự đoán phân loại (hồi quy logistic/cây quyết định) được xây dựng cho người được phỏng vấn dựa trên thông tin sơ yếu lý lịch, thông tin do người săn đầu người cung cấp và thông tin kênh tuyển dụng để dự đoán xác suất "phù hợp".

2. Khi bạn đã có dữ liệu về cơ cấu chi phí lao động chung, lý do tăng trưởng và xu hướng phát triển, hãy xây dựng một mô hình dự đoán (chuỗi thời gian/hồi quy đa biến) để xác định xem chi phí lao động có vượt quá kỳ vọng hay không, từ đó can thiệp vào quá trình ra quyết định (không tuyển dụng số lượng lớn do thiếu hụt nhân viên ngắn hạn và so sánh sự khác biệt về chi phí giữa tiền làm thêm giờ và việc tuyển thêm nhân viên mới).

Tất nhiên, còn có điểm hợp tác thứ ba: khi có thách thức phát sinh trong công việc, chúng tôi cùng nhau giải quyết.

V. Kịch bản hợp tác điển hình 3

Để trả lời câu hỏi cuối cùng là “Tại sao mô hình lại không chính xác?”, mọi người phải cùng nhau làm việc. Điều đầu tiên cần loại trừ là tác động của các yếu tố bên ngoài, biến động bất ngờ và hành vi kinh doanh chủ động . Đừng ném bùn vào mô hình chỉ vì nó là một vấn đề.

Ví dụ: sự thay đổi đột ngột ở ban quản lý cấp cao dẫn đến những thay đổi trong yêu cầu tuyển dụng quản lý; xảy ra dịch bệnh tại nơi tuyển dụng, nhân viên không thể rời đi; các công ty hàng đầu trong ngành đột nhiên tăng lương, làm tăng chi phí của toàn bộ ngành; kế hoạch tuyển dụng ban đầu bị hoãn lại vì nhiều lý do, và các kỳ vọng không đạt được, do đó cần phải bổ sung các kênh/phương pháp mới. Tất cả những yếu tố này sẽ làm cho mô hình được thiết kế ban đầu trở nên vô giá trị hoặc giảm hiệu quả của nó. Để ứng phó với những thay đổi này, phân tích dữ liệu phải được đặt lên hàng đầu. Khi theo dõi dữ liệu hàng ngày, các vấn đề có thể được phát hiện sớm, rủi ro kinh doanh có thể được cảnh báo và mọi người có thể được nhắc nhở chú ý đến những thay đổi. Thay vì chờ doanh nghiệp tìm đến bạn rồi mới tranh cãi với bạn.

VI. Bản tóm tắt

Sự khác biệt về bản chất công việc của thuật toán và phân tích có nghĩa là khi hai công nghệ này hợp tác và phân chia công việc, chúng sẽ có trọng tâm khác nhau. Cách hợp tác lý tưởng là: phân tích để giải quyết các trở ngại trong kinh doanh và thuật toán để nâng cao hiệu quả . Chúng ta hãy cùng nhau đạt được kết quả.

Trên thực tế, nếu bạn làm việc đủ lâu và có đủ tiếp xúc với doanh nghiệp, bạn sẽ thấy rằng hầu hết các yêu cầu "xây dựng mô hình" đến trực tiếp từ doanh nghiệp đều không đáng tin cậy, do thiếu dữ liệu hoặc mục tiêu không rõ ràng. Đặc biệt là khi nói đến các vấn đề dự đoán (các vấn đề phân loại tương đối tốt hơn). Các nhu cầu được chuyển đổi bởi các nhà phân tích dữ liệu đáng tin cậy hơn nhiều.

Tác giả: Thầy giáo thực tế Chen

Tài khoản công khai WeChat: "Cô giáo Chen thực tế"

<<:  "Làm nổ tung Internet!" Doanh số bán hàng từ tài khoản mới của Dong Yuhui đã vượt quá 100 triệu nhân dân tệ ngay trong lần phát sóng đầu tiên. Nó phát ra những tín hiệu mới nào?

>>:  Khi kinh doanh vào năm 2024, các doanh nghiệp vừa và nhỏ có thể tận dụng hiệu quả Xiaohongshu như thế nào?

Gợi ý

Bảy dự đoán về “thương mại điện tử của người mua” của Xiaohongshu

“Thương mại điện tử dựa trên người mua” mà Xiaoho...