Đừng chỉ so sánh theo từng năm. Năm bước này sẽ giúp phân tích dữ liệu của bạn sâu hơn.

Đừng chỉ so sánh theo từng năm. Năm bước này sẽ giúp phân tích dữ liệu của bạn sâu hơn.

Làm thế nào để đào sâu một dự án phân tích dữ liệu? Công việc này có thể được thực hiện chuyên sâu từ góc độ nào? Bài viết này chia công việc phân tích dữ liệu thành năm cấp độ theo mức độ sâu sắc và đưa ra các ví dụ về cách thực hiện công việc phân tích dữ liệu ở các cấp độ khác nhau, từ nhu cầu đến logic, cho người đọc thấy ý tưởng phân tích dữ liệu rõ ràng. Bài viết này phù hợp với những ai quan tâm đến phân tích dữ liệu. Tôi hy vọng nó sẽ hữu ích với bạn.

Nhiều sinh viên luôn cảm thấy rằng việc phân tích dữ liệu không đủ sâu và PPT chỉ bao gồm các so sánh theo từng năm và theo từng năm. Vậy họ nên làm gì? Hôm nay, tôi sẽ chia sẻ với các bạn cách thực hiện một dự án phân tích dữ liệu chuyên sâu bằng một ví dụ cụ thể.

1. Mức độ sâu: Mức 0

Một ngày nọ, bạn nhận được yêu cầu: "Kiểm tra chức năng A mới được thêm vào ỨNG DỤNG của chúng tôi và xem có bao nhiêu người đã sử dụng chức năng này 1+ lần trong 5 ngày qua (đã loại bỏ trùng lặp)". Vấn đề này quá đơn giản. Chỉ cần nhập một con số, "Tổng số người dùng trong 5 ngày qua là 10.000" là xong.

Nhưng loại phân tích này hoàn toàn không sâu sắc và thậm chí không thể được gọi là "phân tích". Nó chỉ đưa ra một con số. Thật vậy, khi nhu cầu là các chỉ số thu thập dữ liệu rất cụ thể + thời gian thống kê, thì đây chỉ là việc lấy số liệu, và đây chính là trường hợp của cấp độ phân tích chuyên sâu thứ 0.

2. Mức độ chuyên sâu: Mức độ 1

Một ngày nọ, bạn nhận được một yêu cầu khác: "Hãy kiểm tra chức năng A mới được thêm vào trong ỨNG DỤNG của công ty chúng tôi và xem có bao nhiêu người sử dụng chức năng này trong 5 ngày qua".

Câu hỏi này nghe có vẻ giống với câu hỏi trước, nhưng xin lưu ý rằng "có bao nhiêu người" không phải là một chỉ số rõ ràng mà là một câu nói chung. Cụ thể hơn, có:

  1. Những người đã sử dụng nó hơn 1 lần trong 5 ngày (xóa các mục trùng lặp)
  2. Bạn đã sử dụng nó bao nhiêu lần trong 5 ngày qua (không loại bỏ trùng lặp)?
  3. Có bao nhiêu người sử dụng nó mỗi ngày trong 5 ngày?
  4. Trong vòng 5 ngày, có bao nhiêu người đã sử dụng nó trong tổng cộng 5, 4, 3, 2 và 1 ngày?
  5. Số người sử dụng từng tần số trong vòng 5 ngày (1, 2, 3...10, 10+ lần)

Chỉ khi kết hợp nhiều chỉ số lại với nhau thì chúng ta mới có thể giải thích rõ ràng được con số này là bao nhiêu. Một số học sinh có thể nghĩ rằng điều này quá rắc rối. Tôi chỉ cho rằng anh ấy không quan tâm đến số lượng người đến. Trên thực tế, rất nhiều trường hợp thu thập dữ liệu nhiều lần tại nơi làm việc, làm thêm giờ và bị doanh nghiệp truy đuổi để lấy dữ liệu đều bắt đầu từ việc "không xác nhận rõ ràng các yêu cầu và mặc định sử dụng chỉ số mà doanh nghiệp không muốn". Đặc biệt là khi bạn hỏi doanh nghiệp: bạn muốn thấy trình độ nào? Các doanh nghiệp sẽ nói: Hãy nhìn tất cả chúng. Vào thời điểm này, tốt nhất là bạn nên suy nghĩ trước để tránh phải làm lại nhiều lần.

Kiểu suy nghĩ chủ động này chính là điểm khởi đầu cho quá trình phân tích chuyên sâu. Bởi vì những chỉ số này hữu ích cho doanh nghiệp:

  1. Bằng cách xem xét số lượng người dùng trùng lặp, chúng ta có thể đánh giá mức độ thâm nhập của tổng số người dùng.
  2. Nhìn vào số lượng khách truy cập mỗi ngày, chúng ta có thể thấy xu hướng phát triển
  3. Bằng cách xem xét số ngày sử dụng tích lũy của từng loại, bạn có thể xác định có bao nhiêu người dùng thường xuyên.
  4. Bằng cách xem xét số ngày sử dụng tích lũy của từng loại, bạn có thể xác định có bao nhiêu người dùng thường xuyên.

Hơn nữa, chúng tôi thấy rằng kết quả Cấp độ 0 trở thành một phần của đầu ra Cấp độ 1. Tương tự như vậy đối với việc theo dõi. Càng đi sâu, bạn càng thiết kế nhiều chỉ số và kích thước, và vấn đề sẽ càng trở nên phức tạp hơn.

3. Mức độ sâu: Mức 2

Một ngày nọ, bạn nhận được một yêu cầu khác: "Hãy xem chức năng mới A được thêm vào ỨNG DỤNG của chúng tôi. Hành vi thanh toán của những người đã sử dụng chức năng này trong 5 ngày qua có tốt hơn những người khác không?"

Lưu ý rằng không có chỉ số dữ liệu rõ ràng nào ở đây, vì vậy trước tiên chúng ta cần phân tích vấn đề:

  1. Chủ đề là: người dùng đã sử dụng chức năng A trong 5 ngày qua. Có bao nhiêu người sử dụng nó đầu tiên? Tất cả dữ liệu từ cấp độ sâu đầu tiên cần được thêm vào đây.
  2. Hành vi được trả tiền: Hành vi được trả tiền là một thuật ngữ chung. Số tiền thanh toán hay tần suất thanh toán? Nếu bạn chưa giải thích rõ ràng, hãy lấy chúng ra và xem trước.
  3. Tốt hơn những cái khác: Những cái khác đó là gì? Tất cả người dùng hoặc người dùng không sử dụng chức năng này. Từ tình huống có vấn đề, cần phân biệt những người dùng không sử dụng chức năng trong 5 ngày qua và đã hoạt động ít nhất một lần để có thể so sánh được.

Với ba bước tháo rời này. Yêu cầu không rõ ràng này có thể được chuyển thành yêu cầu truy xuất dữ liệu:

  1. Thông tin cơ bản của người dùng đã sử dụng chức năng A trong 5 ngày qua (số lượng người dùng, phân bố ngày sử dụng và phân bố tần suất sử dụng)
  2. Hành vi thanh toán của người dùng đã sử dụng chức năng A trong 5 ngày qua (tỷ lệ phần trăm, số tiền thanh toán tích lũy của người dùng trả phí trong 5 ngày qua, tần suất thanh toán trong 5 ngày qua, số tiền thanh toán trung bình trên một người, số lần thanh toán trung bình trên một người)
  3. Số ngày hoạt động, tỷ lệ thanh toán, số tiền thanh toán, tần suất thanh toán, số tiền thanh toán trung bình trên mỗi người và thời gian thanh toán trung bình trên mỗi người dùng hoạt động không sử dụng chức năng A trong 5 ngày qua

Theo cách này, bằng cách so sánh hai nhóm, chúng ta có thể rút ra kết luận. Tuy nhiên, làm như vậy nhanh chóng sẽ dẫn đến câu hỏi tiếp theo: "Tại sao những người sử dụng A lại sử dụng nó nhiều hơn/ít hơn các nhóm khác?"

IV. Mức độ sâu: Mức 3

Một ngày nọ, bạn nhận được một yêu cầu khác: "Phân tích tại sao những người sử dụng chức năng A lại được hưởng lợi khi trả tiền?" Lưu ý rằng việc hỏi xem điều đó có đúng không trước rồi mới hỏi tại sao là yêu cầu cơ bản để trả lời câu hỏi. Do đó, khi phân tích một bài toán, trước tiên bạn phải hoàn thành bài tập chuyên sâu cấp độ 2. Sau khi xác nhận “mức thanh toán của A tốt hơn”, chúng ta có thể phân tích lý do.

Giả định rất quan trọng khi phân tích nguyên nhân. Vì nhu cầu tập trung vào chức năng A nên điều quan trọng là liệu chức năng A có hữu ích hay không. Khi phân tích các lý do, việc bác bỏ dễ hơn là chứng minh, vì vậy trước tiên chúng ta có thể loại bỏ một số câu trả lời rõ ràng là sai, chẳng hạn như "người dùng chức năng A đều là nhóm trả phí cao", điều này có thể loại bỏ trực tiếp câu trả lời "chức năng A hữu ích cho các chuyển đổi trả phí".

Nhưng điều này không hợp lý về mặt logic, bởi vì:

  1. Mức tiêu thụ tự nó đã cao, nhưng nó thậm chí còn cao hơn sau khi sử dụng chức năng A
  2. Bản thân mức tiêu thụ cao, nhưng nó cao hơn những người không sử dụng A
  3. Những người có mức tiêu thụ thấp cũng có thể cải thiện
  4. Với những người có mức tiêu thụ thấp, việc không sử dụng A chỉ làm mức tiêu thụ giảm xuống.

Ngay cả khi chúng ta xem dữ liệu: Mức tiêu thụ của Nhóm A đương nhiên cao hơn các nhóm không phải là nhóm, vẫn có ít nhất bốn khả năng cần loại trừ. Do đó, chúng ta cần liệt kê rõ ràng cây logic giả thuyết và kiểm tra từng khả năng một. Đây cũng chính là điều chúng tôi muốn nói: để xác minh một quan điểm, bạn cần tìm ví dụ về cả mặt tích cực và tiêu cực.

Lưu ý rằng ngay cả ở đây cũng có những phản biện. Vì tất cả chúng ta đều dựa trên phân tích dữ liệu trong quá khứ, nên rất có thể quan điểm phản bác sẽ là: "Chức năng A chỉ có thể thu hút nhóm người dùng nhỏ này và không thể mở rộng" hoặc "Người dùng A chỉ đang thử một cái gì đó mới và nó sẽ không có tác dụng sau một thời gian". Cả hai quan điểm này đều liên quan đến tình hình dữ liệu trong tương lai, do đó cần có thời gian quan sát trước khi có thể đưa ra kết luận.

Nếu chúng ta không thể chờ đợi lâu như vậy, chúng ta vẫn có thể làm xét nghiệm. Ví dụ, để kiểm tra quan điểm "không thể mở rộng", chúng ta có thể chủ động quảng bá chức năng A cho các nhóm khác và quan sát hiệu ứng gia tăng và duy trì của chức năng A. Nếu hiệu ứng gia tăng nhỏ hoặc có hiệu ứng gia tăng nhưng hiệu ứng duy trì kém, thì chúng ta có thể suy ra rằng chức năng đó không thể mở rộng. Nếu bạn muốn phân tích chuyên sâu, việc thử nghiệm và quan sát lâu dài là điều cần thiết, và cần có thời gian để đưa ra kết luận tốt.

5. Mức độ sâu: Mức 4

Một ngày nọ, bạn nhận được yêu cầu khác: "Phân tích tác động của chức năng A đối với người dùng?" Có vẻ như vấn đề được diễn đạt đơn giản hơn, nhưng việc giải quyết lại phức tạp hơn. Bởi vì từ cấp độ 0 đến cấp độ 3, chúng ta chỉ thảo luận về tác động của "thanh toán", nhưng trên thực tế có thể có nhiều tác động hơn, chẳng hạn như hoạt động, duy trì, giới thiệu, v.v. Mỗi hướng phải trải qua một quá trình phân chia và phân tích rất dài trước khi có thể thu được kết quả toàn diện.

Đến thời điểm này, chúng tôi đã phân tích rất sâu sắc. Thật thú vị là vấn đề của chúng ta thực ra rất đơn giản. Trên thực tế, nếu một câu hỏi:

  1. Có số liệu rõ ràng
  2. Có những tiêu chí rõ ràng để đánh giá một chỉ số là tốt hay xấu
  3. Có logic rõ ràng về ảnh hưởng giữa các chỉ số
  4. Dựa trên các kịch bản kinh doanh khép kín, dễ dàng kiểm tra

Khi đó vấn đề này có thể được giải quyết dễ dàng.

Nhưng vấn đề thực sự thường là:

  1. Nói chuyện thông tục
  2. Chứa nhiều khía cạnh
  3. Không có tiêu chí rõ ràng để phán đoán
  4. Có nhiều yếu tố ảnh hưởng
  5. Không có thời gian hoặc không gian để chúng ta thử nghiệm chậm

Lúc này, bạn có thể bắt đầu lại từ đầu và sắp xếp từng chút một. Đảo ngược thứ tự của bài viết này là sắp xếp lại các tình huống của vấn đề kinh doanh từ đầu.

Tất nhiên, không phải mọi phân tích đều cần phải được thực hiện từ đầu đến cuối.

  • Có thể người đặt câu hỏi không hề biết gì cả. Trong trường hợp này, trước tiên bạn có thể cung cấp cho anh ta dữ liệu độ sâu cấp độ 1 để giúp anh ta xây dựng nhận thức, sau đó cung cấp cho anh ta dữ liệu độ sâu cấp độ 2 để hướng dẫn anh ta chú ý đến những điểm khác biệt.
  • Có thể người đặt câu hỏi nói mơ hồ nhưng lại có mục tiêu rõ ràng trong đầu. Vào thời điểm này, có thể tiến hành trao đổi sâu hơn để làm rõ nhu cầu.
  • Có thể người đặt câu hỏi không cần lập luận chặt chẽ và sẵn sàng đưa ra kết luận dựa trên một số bằng chứng. Trong trường hợp này, bạn chỉ có thể tranh luận về điểm mà anh ấy băn khoăn nhất.

Điều duy nhất bạn không nên làm lúc này là tránh giao tiếp, chỉ đưa ra một số con số tại chỗ hoặc tìm cái gọi là "mô hình" trên Internet và áp dụng một cách máy móc. Làm việc sau cánh cửa đóng kín như thế này, phải làm lại, làm thêm giờ và bị coi thường là những chuyện thường xảy ra.

Nếu trong một kịch bản kinh doanh nào đó, chúng ta đã thực hiện nhiều xác minh và chứng minh được các chỉ số chính + tiêu chí đánh giá + mối quan hệ nhân quả của vấn đề kinh doanh, thì chúng ta có thể áp dụng trực tiếp vào lúc này. Đây là những gì chúng tôi gọi là: mô hình phân tích kinh doanh. Tuy nhiên, trước khi giải quyết được vấn đề này, vẫn cần phải có thêm nhiều lập luận, đặc biệt là lập luận về quan hệ nhân quả. Nếu không thực hiện chi tiết, bạn sẽ bị tát vào mặt chỉ trong vài phút.

Tác giả: Thầy giáo thực tế Chen

Nguồn: Tài khoản công khai WeChat "Giáo viên thực tế Trần"

<<:  Ai nói những chủ đề nóng hổi là khó nắm bắt? Ba cách để tạo chủ đề và thu hút sự chú ý

>>:  Ứng dụng yếu tố hài hước trong content marketing: Làm thế nào để sử dụng sự hài hước để nội dung hấp dẫn hơn?

Gợi ý

Nghĩ về việc làm cho thương hiệu lớn hơn

Bài viết này chủ yếu phân tích tám yếu tố để xây ...

Thưởng thức các món ăn ngon từ cá vược (khám phá kỹ thuật nấu cá vược)

Cá vược là một loại cá nước ngọt thơm ngon có hươn...

Phải làm gì nếu máy chạy bộ không sáng (màn hình đen)

Nó cũng có thể mang đến cho chúng ta những nguy cơ...

Chiến lược doanh nghiệp so với Chiến lược thương hiệu

Bài viết này cho thấy cách Xiangpiaopiao nắm bắt ...

Cách làm đậu tằm mềm ngon và đơn giản (món đậu tằm mềm ngon đơn giản)

Nó cũng có thể được sử dụng để làm các món ăn lạnh...

Sự gia tăng của AIGC có thể thay đổi ngành công nghiệp video như thế nào?

Sự xuất hiện của AIGC sẽ có tác động hoặc ảnh hưở...