Có thể nói suy luận nhân quả là một trong những vấn đề khó khăn nhất trong lĩnh vực phân tích dữ liệu và vẫn chưa có kết luận cuối cùng sau nhiều năm tranh luận. Học sinh thường được hỏi: "Nguyên nhân của vấn đề này là gì?" Mọi người đều thấy khó để phân tích, vì vậy hôm nay chúng tôi sẽ giải thích một cách có hệ thống. 1. Phương pháp tháo rờiPhương pháp phổ biến nhất được sử dụng để tìm mối quan hệ nhân quả là phương pháp phân tích. Phân tích chỉ số kết quả từ nhiều góc độ và tìm ra những lý do ảnh hưởng đến chỉ số đó. Ví dụ: Hôm qua có 4 kênh quảng cáo và tổng cộng có 100 khách hàng. Ngày nay, chỉ có 80 khách hàng được tìm thấy. Câu hỏi đặt ra là tại sao số lượng khách hàng có được lại giảm. Phương pháp tháo rời (như hình trên): 1. Phân tích tổng số khách hàng theo bốn kênh, chúng tôi thấy rằng kênh A có ít khách hàng nhất. Kết luận 1: Vì có ít kênh A hơn nên tổng số khách hàng có được cũng ít hơn. 2. Phân tích quá trình thu hút khách hàng của kênh A thành ba bước theo quy trình thu hút khách hàng, cụ thể là trang hiển thị-trang đích-chuyển đổi. Phát hiện liên kết chuyển đổi bị thiếu. Kết luận: Do quá trình chuyển đổi kênh A gặp vấn đề nên tổng số khách hàng có được ít hơn. 3. Tóm tắt: Quá trình chuyển đổi kênh A đang gặp vấn đề, đây chính là nguyên nhân khiến lượng khách hàng thấp. Có vẻ như đây là câu trả lời hoàn hảo, lý do đã được tìm ra! Nhưng câu trả lời này không thể giải quyết được câu hỏi khác từ bộ phận kinh doanh: Tại sao A lại chuyển đổi kém? Tôi không thay đổi văn bản? Quỹ đầu tư không hề nhỏ phải không? Chỉ có một ngày chênh lệch giữa hai ngày, tại sao lại có sự khác biệt lớn như vậy? Tại sao chỉ có A trở nên tệ hơn trong khi những cái khác vẫn giữ nguyên? Tôi không thể trả lời bất kỳ câu hỏi nào... Phương pháp tháo rời này về cơ bản chỉ là khóa vị trí xảy ra sự cố thông qua việc phân chia. Không thể tìm ra thủ phạm. Do đó, nó thường được sử dụng để phát hiện vấn đề thay vì giải thích chúng (như minh họa bên dưới). 2. Phương pháp hệ số tương quanTrong thống kê có các phương pháp phân tích tương quan. Và có một công thức rất phức tạp (như được hiển thị bên dưới): Nhiều sinh viên đã rất phấn khích khi nhìn thấy nó! Vì vậy, tôi đã đưa hai chỉ số vào để tính hệ số tương quan và cũng trò chuyện về GPT ở khắp mọi nơi:
Dù sao thì hệ số tương quan cũng đủ lớn nên đây là tương quan! Lần này có một công thức phức tạp để hỗ trợ nên chắc chắn nó rất khoa học, đúng không? Bằng cách này, thật dễ dàng để đưa ra "Dragon Vein" kinh điển trong lĩnh vực thống kê
Phân tích tương quan, phân tích hồi quy và phân tích cụm về bản chất không phải là "phân tích" mà là tính toán. Thông qua tính toán, có thể thu được mối quan hệ giữa hai hoặc nhiều cột số. Về việc mối quan hệ này có ý nghĩa gì hay không, bản thân công thức tính toán không có trách nhiệm giải thích điều đó. Do đó, khi áp dụng vào thực tế, người ta thường sản sinh ra đủ loại kết quả kỳ lạ. Mọi phương pháp thống kê đều có những vấn đề tương tự. Họ chỉ có thể giải thích mối quan hệ giữa các dữ liệu, nhưng không thể giải thích mối quan hệ trong thực tế. Nhìn nhận vấn đề một cách cơ bản hơn: Liệu mọi hành vi kinh doanh và các yếu tố bên ngoài có thể được định lượng không? Không có gì. Ví dụ, lòng tin của người tiêu dùng vào một thương hiệu, chất lượng trải nghiệm sản phẩm và cảm nhận về nội dung quảng cáo rất khó để định lượng thành một chỉ số ổn định và đáng tin cậy. Do đó, bằng phương pháp thống kê, có thể sàng lọc và lọc các chỉ số trên diện rộng, nhưng khó có thể suy ra nguyên nhân và kết quả thực sự. 3. Phương pháp phân tích xu hướngVì những phương pháp phức tạp không hiệu quả, vậy có cách đơn giản nào không? có! Ví dụ, dựa trên cảm giác đơn giản nhất: vì A sẽ kích hoạt B, vậy nếu A được tạo ra, B cũng phải được tạo ra. Khi A kết thúc, B cũng sẽ dần kết thúc (hoặc B sẽ chết). Người ta đã tóm tắt bốn nguyên tắc của suy luận nhân quả. Bốn nguyên tắc:
Suy luận như vậy phù hợp với logic trực quan của con người. Quan trọng hơn là cần ít dữ liệu hơn! Xu hướng của chỉ một chỉ báo có thể phản ánh toàn bộ câu chuyện trên biểu đồ. Vì vậy, nó rất hữu ích. NHƯNG, có một vấn đề lớn khi thực hiện điều này, đó là không thể loại bỏ các yếu tố hỗn hợp và chỉ có thể quan sát yếu tố có tác động lớn nhất. Chúng ta thậm chí còn ít có khả năng nhìn thấy những yếu tố sâu xa ẩn giấu đằng sau nó. Ví dụ, khi quan sát các yếu tố bên ngoài, chúng ta chỉ có thể quan sát các yếu tố rõ ràng như thời tiết và hạn chế giao thông; Khi quan sát các yếu tố nội tại, chúng ta chỉ có thể quan sát các yếu tố như giảm giá. Các yếu tố nhỏ khác không thể quan sát được. Do đó, phương pháp này thường được sử dụng như một quá trình loại trừ để loại bỏ những lý do vô lý. Ví dụ: "Bạn nói rằng thời tiết xấu đồng nghĩa với hiệu suất kém, vậy tại sao những người khác vẫn có hiệu suất tốt ngay cả khi thời tiết xấu!" Vậy những yếu tố nào thúc đẩy hiệu suất? Tôi không biết, chúng ta cần sử dụng phương pháp khác để phân tích nó. 4. Phương pháp biến điều khiểnCách tốt nhất để loại bỏ các yếu tố hỗn hợp là tiến hành thử nghiệm nhóm, cho các mẫu vào hộp kín, sau đó thử nghiệm tác động của từng nhóm. Ví dụ, nếu tôi muốn kiểm tra tỷ lệ phản hồi của người dùng đối với các bản sao quảng cáo khác nhau, về mặt lý thuyết, tôi nên sử dụng cùng một sản phẩm, giá cả, vị trí chuyển đổi, chọn cùng một nhóm người, cùng một kênh, sau đó bắt đầu thử nghiệm: Nhưng phương pháp thử nghiệm cũng có một số vấn đề:
Kết quả là loại thử nghiệm này phù hợp với các tình huống có phản hồi tức thời + kênh thông tin khép kín + thúc đẩy cá nhân hóa. Đúng vậy, đây là tình huống tương tự như các ứng dụng gọi taxi và ứng dụng video ngắn. Nếu tốc độ phản hồi chậm hơn một chút, ví dụ như các nền tảng thương mại điện tử sử dụng dữ liệu lớn để nhắm mục tiêu vào khách hàng cũ, thì rất dễ bị phát hiện khi người tiêu dùng thay đổi số điện thoại di động để đăng nhập và so sánh giá. Cuối cùng, tôi sẽ mua thứ nào rẻ hơn... 5. Tại sao các phương pháp thông thường không hiệu quảTóm lại, chúng ta sẽ thấy rằng trong lĩnh vực suy luận nhân quả, hầu như không có phương pháp nào hoàn toàn đáng tin cậy, bao gồm nhiều phương pháp thống kê cổ điển và phương pháp thực nghiệm khoa học. Tại sao chuyện này lại xảy ra? Bởi vì về bản chất, quản lý kinh doanh là vấn đề khoa học xã hội chứ không phải khoa học tự nhiên. Lĩnh vực khoa học tự nhiên được hỗ trợ bởi một số nguyên tắc cơ bản của vật lý, hóa học, toán học, v.v. Những nguyên tắc này ổn định, khoa học và có thể định lượng được. Do đó, thông qua thống kê dữ liệu + thí nghiệm khoa học, chúng ta có thể dần khám phá ra những quy luật tự nhiên ẩn chứa đằng sau chúng. Trường hợp này hoàn toàn không đúng với các vấn đề khoa học xã hội! Các vấn đề khoa học xã hội tự thân chịu ảnh hưởng của nhiều yếu tố, dễ bị con người thao túng và thay đổi, đồng thời mang tính cảm xúc và bốc đồng. Do đó, trong lĩnh vực khoa học xã hội, việc áp dụng trực tiếp các phương pháp của khoa học tự nhiên để giải quyết vấn đề là rất khó khăn. Ngoài ra, những người làm việc trong công ty đều có lập trường, thái độ và mục đích riêng. Khi họ hỏi "Nguyên nhân chính xác gây ra vấn đề này là gì?" hoặc "Công lao này từ đâu ra?", điều họ nghĩ trong tiềm thức là: Công lao là của tôi, nên tôi phải lấy một phần, còn lỗi là của người khác, nên tôi phải vứt bỏ nó đi dù có cố gắng thế nào đi nữa. Do đó, ngay cả khi có phương pháp đáng tin cậy, mọi người vẫn có thể không muốn sử dụng nó. Kể cả khi đã có kết luận, người ta vẫn sẽ tìm ra những lý do khác để quanh co. Do đó, khi đối mặt với suy luận nhân quả, chúng ta phải phân biệt cẩn thận các tình huống có vấn đề. Nói tóm lại, cách giải quyết vấn đề là kết hợp kịch bản kinh doanh và phân tích cụ thể các vấn đề. |
<<: Hướng dẫn đánh giá ra mắt Xiaohongshu
>>: Người lái không nên trở thành "gia vị" của các video ngắn
Chúng tôi sẽ giới thiệu, trong bài viết này "...
Khi nhịp sống ngày càng nhanh và công việc ngày cà...
Điều này gây ra rất nhiều rắc rối cho người dùng v...
Trầm cảm là một vấn đề sức khỏe tâm thần phổ biến,...
Bảo vệ môi trường và tiết kiệm năng lượng dần trở ...
Hóa ra có rất nhiều cách để sử dụng Xiaohongshu. ...
Ngày nay, điện thoại thông minh đã trở thành công ...
Đối mặt với những tổn thất thực tế từ sản xuất, l...
Bài viết này tiết lộ sự thật và những rủi ro tiềm...
Vipshop đã nhận được sự công nhận và khen ngợi rộ...
Internet đã trở thành một phần không thể thiếu tro...
Chúng ta thường cần điều chỉnh kích thước bộ nhớ ả...
Bài viết này sử dụng các trường hợp thay đổi tên ...
Đôi khi chúng ta có thể thấy phím prtsc không hoạt...
Chúng ta có thể cảm thấy bối rối và thất vọng nếu ...