Nhiều sinh viên thường hỏi: "Làm thế nào để tạo ra một dự án phân tích dữ liệu tuyệt vời? Nếu không, tôi không biết cách viết sơ yếu lý lịch và tóm tắt cuối năm". Tôi đã đưa ra câu trả lời và hướng dẫn chi tiết. Hôm nay mình sẽ tóm tắt và chia sẻ những vấn đề mọi người thường gặp. Nếu bạn muốn làm tốt các dự án phân tích dữ liệu, điều quan trọng nhất bạn cần làm là thiết lập các khái niệm đúng . Sau đây là 5 câu hỏi trắc nghiệm. Hãy cùng kiểm tra xem bạn có khả năng tạo ra một dự án tốt đến đâu. Câu hỏi 1 (câu hỏi lựa chọn một đáp án)Các chỉ số đo lường chất lượng của các dự án phân tích dữ liệu là: A. Thời gian, chi phí, chất lượng B. Độ khó của thuật toán, kiến thức thống kê, công thức toán học Chủ đề này là khái niệm quan trọng nhất, quyết định trực tiếp đến việc một nhà phân tích dữ liệu có làm tốt ở công ty hiện tại hay không. Công việc phân tích dữ liệu có đặc thù riêng: ★ Khác với bán hàng và không thể trực tiếp tạo ra doanh thu cho công ty. ★ Khác với hoạt động kinh doanh và không thể trực tiếp tăng các chỉ số duy trì hoạt động và thanh toán. ★ Khác với việc phát triển các hệ thống giao dịch/website/ERP vốn là những hỗ trợ cần thiết cho doanh nghiệp. ★ Nó khác với DBA. Không có công ty nào không có DBA, nhưng có nhiều công ty không có nhà phân tích toàn thời gian. Công việc phân tích dữ liệu về cơ bản là một vị trí bổ trợ có khả năng thay thế cao. Trước khi khái niệm phân tích dữ liệu trở nên phổ biến, nhiều công ty đã tìm kiếm các lập trình viên có thể viết SQL để đảm nhiệm vị trí này. Giống như mối quan hệ giữa ống ngắm và súng vậy. Súng vẫn có thể bắn mà không cần ống ngắm, nhưng khi có ống ngắm, súng có thể bắn chính xác hơn. Do đó, mặc dù phân tích dữ liệu được hỗ trợ bởi các thuật toán, số liệu thống kê và dữ liệu, các công ty không quan tâm đến những chương sách này, nhưng chúng có tác dụng gì đối với doanh nghiệp? Nó hữu ích như thế nào? Giống như các dự án khác trong doanh nghiệp, điều quan trọng nhất đối với các dự án phân tích dữ liệu là xem xét thời gian, chi phí và chất lượng. Nếu chúng ta tách rời khỏi những điều này, chúng ta sẽ chỉ là những kẻ rỗng tuếch khi theo đuổi “phương pháp tôi sử dụng phức tạp quá, tôi vĩ đại quá”. Tốt hơn hết là quay lại trường học và nghiên cứu khoa học. Nghiên cứu khoa học đòi hỏi phải theo đuổi sự chính xác và cao cấp. Điều các doanh nghiệp theo đuổi là: chi phí càng thấp càng tốt, thời gian càng ngắn càng tốt khi đạt được mục tiêu. Vậy thì câu trả lời cho câu hỏi này phải là A. Nhiều nhà phân tích dữ liệu mới tốt nghiệp, thay đổi nghề nghiệp hoặc mới vào nghề thường thích chọn B. Chọn B không có nghĩa là không có tương lai. Bởi vì những học sinh chọn câu B sẽ phải tốn rất nhiều năng lượng để học tập chăm chỉ. Mặc dù họ có thể không thăng tiến được ở một công ty, họ vẫn có thể vượt qua vòng phỏng vấn khi đổi việc, do đó họ cũng có thể tăng lương bằng cách đổi việc một lần mỗi năm. Nhưng nếu bạn muốn đạt được kết quả trong một công ty, tốt hơn nên chọn A. Câu hỏi này là quan trọng nhất. Khi bạn hiểu rồi thì những vấn đề sau đây sẽ dễ dàng được giải quyết. Câu hỏi 2 (câu hỏi sắp xếp)Những người sau đây có tiếng nói trong chất lượng của các dự án phân tích dữ liệu: A. Lãnh đạo phòng kinh doanh B. Trưởng phòng dữ liệu C. Nhân viên phòng kinh doanh D. Nhân viên phòng dữ liệu (tôi) Nếu bạn hiểu rõ vấn đề thì câu hỏi này không khó chút nào và đáp án là A≥B≥C≥D. Ý kiến của người lãnh đạo quan trọng hơn ý kiến của nhân viên. Nếu trưởng phòng kinh doanh đồng ý thì trưởng phòng dữ liệu sẽ trực tiếp đồng ý. Nếu người đứng đầu bộ phận kinh doanh không lên tiếng thì điều đó phụ thuộc vào việc người đứng đầu bộ phận dữ liệu có đồng ý hay không. Với tôi, việc nghĩ rằng mình đang làm tốt là vô nghĩa. Xin hãy nhớ điều này. Xin lưu ý rằng đôi khi thái độ của các nhà lãnh đạo doanh nghiệp và nhà lãnh đạo dữ liệu có thể không nhất quán. Lúc này, thái độ của người lãnh đạo trực tiếp của bạn phải chiếm ưu thế, bộ phận bên ngoài sẽ xem xét sau. Ở hầu hết các công ty, người quản lý trực tiếp của bạn là người quyết định điểm hiệu suất của bạn, vì vậy bạn không được phép làm mất lòng người đó. Câu hỏi 3 (câu hỏi sắp xếp)Vui lòng xếp hạng năm kết quả dự án sau theo thứ tự chất lượng: A. Sản phẩm dữ liệu trực quan B. Mô hình dữ liệu cho đầu ra hàng tháng thường xuyên C. Báo cáo ppt các cuộc họp cấp phòng ban trở lên D. PPT không có bài trình bày nhóm E. Bảng dữ liệu Excel F. Các số không có định dạng cố định G. Viết SQL và báo cho doanh nghiệp biết số lần chạy sau Để giải thích đầy đủ câu hỏi này cần phải viết cả một bài viết, nhưng sinh viên có thể sử dụng nghĩa đen của từ để đưa ra câu trả lời trực tiếp. Câu trả lời là: A=B≥C≥D=E≥F≥G. Kết quả phân tích dữ liệu có thể dễ dàng được sử dụng như một chiếc bô: bạn sẽ cảm thấy tuyệt vời khi sử dụng nó, nhưng bạn sẽ quên mất nó khi sử dụng xong. Bình thường tôi nghĩ bạn bẩn: Này, tôi chỉ muốn một con số thôi! Vẫn phải chạy lâu như vậy! Do đó, khi thực hiện các dự án phân tích dữ liệu, chúng ta nên cố gắng đưa ra các kết quả có thể sử dụng thường xuyên, có thể sản xuất hàng loạt và mọi người đều có thể nhìn thấy. Cách tốt nhất là sử dụng hệ thống BI hoặc sử dụng mô hình để tối ưu hóa và sắp xếp danh sách theo dõi người dùng doanh nghiệp để mọi người đều có thể sử dụng. Nếu cách này không hiệu quả, hãy viết một bản PPT nhưng cố gắng phát biểu trước công chúng tại cuộc họp. Trường hợp xấu nhất là tôi đã chạy một loạt các bảng yêu cầu tùy ý và viết 2.000 dòng SQL, nhưng thậm chí không có kết quả đầu ra chính thức và tôi thậm chí không biết phải viết gì trong báo cáo hiệu suất vào cuối năm. Câu hỏi 4 (câu hỏi lựa chọn một đáp án)Hôm nay là 12 giờ trưa ngày 11 tháng 11. Trưởng nhóm yêu cầu bạn đưa ra ước tính trước khi tan làm để dự đoán hiệu suất của chúng ta trong chương trình Double Eleven. Bạn sẽ làm gì? A. Quay lại và bắt đầu lập mô hình, chuỗi thời gian và XGboost B. Quay lại tìm hiểu cách sử dụng chi phí hoạt động và khuyến mại, tính tỷ lệ đầu vào-đầu ra. C. Quay lại và xem dữ liệu buổi sáng. Chụp một bức ảnh dựa trên cùng kỳ năm ngoái. Câu hỏi này rất khó hiểu. Đặc biệt là sau khi đọc câu hỏi trước, nhiều học sinh sẽ có thói quen chọn A. Chìa khóa của câu hỏi này không phải là "dự đoán" mà là "từ 12 giờ trưa đến hết giờ tan làm". Phân tích dữ liệu có thể được sử dụng để lập mô hình, BI và trực quan hóa, nhưng tất cả đều cần thời gian. Trong nhiều trường hợp, công việc kinh doanh không chờ đợi bất kỳ ai và kết quả phải được đưa ra nhanh chóng. Lúc này cần ưu tiên các phương pháp đơn giản, trực tiếp, kết hợp với dữ liệu để chỉ ra rủi ro. Do đó, bạn cần phải học về mô hình hóa, thống kê và cách đưa ra quyết định nhanh chóng và hợp lý dựa trên suy nghĩ của mình. Đây chính là lý do vì sao nhiều người mới vào nghề phải miệt mài tạo ra hàng loạt mô hình, nhưng kế hoạch của họ lại bị các nhà lãnh đạo đảo lộn chỉ sau vài câu nói, và họ bị chỉ trích: "Sao các anh làm chậm thế?" Câu trả lời cho câu hỏi này là C. Tốt nhất là đưa ra câu trả lời trong vòng 10 phút. Người dẫn chương trình hướng dẫn: "Câu hỏi này rất quan trọng và đòi hỏi cách tiếp cận phức tạp và khoa học hơn". Sau đó xét AB. Câu hỏi 5 (Trắc nghiệm)Chi phí cho công việc phân tích dữ liệu bao gồm những gì? A. Chi phí cơ sở dữ liệu B. Chi phí máy tính C. Chi phí phát triển phần mềm D. Chi phí sản phẩm BI E. Chất lượng thu thập dữ liệu F. Chất lượng làm sạch dữ liệu G. Giờ làm việc của lập trình viên Câu hỏi này cũng rất khó hiểu. Trước khi cô giáo Trần hỏi câu hỏi này, nhiều người chưa từng nghĩ đến: "Phân tích dữ liệu có mất phí không?!" "Đây không phải là điều mà một người đã đọc "Học máy", "Thống kê" và "Thành thạo Python trong 21 ngày" có thể làm được bằng cách gõ trên bàn phím sao?!" Trả lời: Phân tích dữ liệu chắc chắn có chi phí và chi phí lớn nhất là chất lượng dữ liệu. Dữ liệu tốt dẫn đến phân tích tốt, trong khi dữ liệu rác dẫn đến phân tích rác. Đặc biệt trong việc thu thập dữ liệu, quy trình kinh doanh còn nhiều lỗ hổng, quản lý kinh doanh không được chuẩn hóa, dữ liệu đưa lên mạng mà không được nhúng đúng cách, dữ liệu cơ bản thì bẩn và lộn xộn, còn việc phân tích thì vô ích. Còn chi phí phần mềm và chi phí máy tính thì chỉ là muối bỏ bể. Chất lượng dữ liệu là vấn đề cơ bản đối với các công ty. Vậy thì câu trả lời cho câu hỏi này là ABCDEFG. Nếu chúng ta sắp xếp chúng, thì đó là E≥≥F≥G≥A≥D≥B≥C. vân vân! Nhiều học sinh sẽ hỏi: Tại sao lại có G và tại sao nó lại được xếp hạng cao như vậy? ! Bởi vì thời gian làm việc của một nhà phân tích dữ liệu là vô cùng quý giá. Những mô hình khổng lồ và phức tạp như vậy trong trường học, giấy tờ và bằng sáng chế đều được tạo ra bằng vô số thời gian. Các nhà phân tích dữ liệu trong các công ty thông thường đã kiệt sức vì phải xử lý nhiều công việc thu thập dữ liệu, báo cáo và Excel khác nhau mỗi ngày. Họ thậm chí có thể không có thời gian để tìm đối tác, chứ đừng nói đến việc phát triển các mô hình tiên tiến. Vì vậy, bạn phải cân nhắc giờ làm việc của mình, ưu tiên các nhu cầu hàng ngày, tập trung vào việc làm những việc có hiệu quả và ngừng những yêu cầu "Tôi muốn xin số" lộn xộn. Sau khi hoàn thành 5 câu hỏi trên và hiểu được ý tưởng của các câu hỏi, bạn sẽ biết cách thực hiện một dự án phân tích dữ liệu xuất sắc. Làm thế nào để thực hiện một dự án phân tích dữ liệu tuyệt vời: 1. Thiết lập dự án chính thức, lấy những điểm khó khăn của doanh nghiệp làm mục tiêu của dự án 2. Xem xét tính cấp bách của thời gian và chất lượng dữ liệu và thiết kế các phương pháp phù hợp 3. Kết quả đầu ra được sử dụng thường xuyên, được sản xuất và phải được mọi người nhìn thấy 4. Ưu tiên nhu cầu của bạn và dành thời gian để làm công việc chất lượng cao 5. Sử dụng các phương pháp phân tích nhanh để giải quyết các nhu cầu đơn giản và tiết kiệm năng lượng cho các nhu cầu phức tạp Để đạt được kết quả giảng dạy tốt, sau đây là 5 lỗi thường gặp nhất. Mục đích là giúp mọi người ghi nhớ năm điểm chính để thực hiện một dự án phân tích dữ liệu xuất sắc. Tác giả: Thầy giáo thực tế Chen Nguồn: Tài khoản công khai WeChat: Giáo viên thực tế Chen (ID: gh_abf29df6ada8) |
<<: Kỹ năng dùng dao của Moutai Luckin
Chương trình và Dịch vụ, Trình quản lý tác vụ là m...
Trong thời đại công nghệ phát triển nhanh chóng nh...
Bài viết này tóm tắt xu hướng khuyến mãi 618 và n...
Chúng ta cài đặt nhiều ứng dụng khác nhau trên màn...
Đồng hồ điện thoại đã trở thành một phần không thể...
iPhone rất phổ biến với người dùng và là thương hi...
Một thương hiệu cần có một câu chuyện hay. Bước đ...
Chúng ta thường xuyên cần chuyển đổi hình ảnh từ đ...
Ngày hôm qua, Tencent đã ra mắt "Tencent Yua...
Dưới đây là bảng so sánh bốn mẫu máy trong dòng iP...
Trong số đó, mã lỗi màn hình xanh 0x00000077 là mộ...
Halo tương tự như mùa S7 ngày nay. Có một điều rất...
Tỷ lệ màn hình chiếu được điều chỉnh để đảm bảo hi...
Bài viết này chủ yếu thảo luận về mối quan hệ cạn...
Bài viết này bắt đầu từ "mô hình tiếp thị ph...