Một trường hợp để hiểu toàn bộ quá trình phân tích dữ liệu

Một trường hợp để hiểu toàn bộ quá trình phân tích dữ liệu

Thông qua phân tích dữ liệu, mọi người có thể xác định xu hướng, khám phá mối quan hệ và dự đoán xu hướng tương lai, giúp đưa ra quyết định thông minh hơn và phát triển các chiến lược hiệu quả hơn. Bài viết này mô tả toàn bộ quá trình phân tích dữ liệu, tôi hy vọng nó sẽ hữu ích với bạn.

Sinh viên mới thường hỏi: Quy trình phân tích dữ liệu đầy đủ là gì? Hôm nay, tôi sẽ sử dụng một ví dụ đơn giản để giúp bạn hiểu toàn bộ quá trình phân tích dữ liệu. Bằng cách so sánh, bạn cũng có thể tìm ra lý do tại sao bạn cảm thấy mình chưa phân tích dữ liệu đầy đủ.

Một ngày nọ, người bạn Lão Vương của bạn nói với bạn: "Sao bạn vẫn đi làm? Bạn chỉ kiếm được 10.000 nhân dân tệ một tháng. Bạn cũng có thể bán bánh hành như tôi. Bạn có thể kiếm được nhiều hơn nhiều so với khi đi làm!" Bạn ngạc nhiên và tò mò. Bán bánh xèo hành lá có thực sự kiếm được nhiều tiền hơn đi làm thêm không? Để trả lời câu hỏi này, bạn phải phân tích. Những gì Lão Vương nói với bạn trước đây được gọi một cách chuyên nghiệp là: hiểu bối cảnh phân tích .

Vậy, làm sao bạn xác định được nghề nào kiếm được nhiều tiền hơn, bán bánh hành hay làm công việc khác? Bạn có thể trực giác nghĩ rằng: số tiền bạn kiếm được mỗi tháng khi làm việc thì rất rõ ràng, nhưng số tiền bạn kiếm được mỗi tháng khi bán bánh xèo hành thì không rõ ràng. Vì vậy, bạn đã viết bảng so sánh như hiển thị bên dưới và bắt đầu thu thập dữ liệu. Hành động này, theo thuật ngữ chuyên môn, được gọi là: xác định mục tiêu phân tích .

Quầy bánh kếp kéo tay này tuy nhỏ nhưng lại bán rất nhiều mặt hàng đa dạng.

  • Thu nhập: Bán bánh ngọt, xúc xích, gà rán, đồ uống...
  • Chi phí: xe đẩy, bếp, bình gas, nước sốt, hành lá thái nhỏ...

Việc đếm từng cái một thực sự rất nhàm chán và khó khăn.

Do đó, bạn quyết định đơn giản hóa mọi thứ và tập trung vào những chi phí và doanh thu quan trọng nhất. Bạn đến gian hàng của Lão Vương và tìm hiểu những thông tin quan trọng sau:

1. Bánh xèo kéo tay hương vị nguyên bản cơ bản nhất: 1 bánh xèo + 1 quả trứng, 5 tệ

2. Nước sốt và hành lá cắt nhỏ là những khoản chi phí nhỏ. Chi phí chính là bánh kếp, trứng và khí đốt tự nhiên.

3. Xúc xích giăm bông mua 0,2 tệ bán 2 tệ, thịt gà phi lê mua 0,3 tệ bán 3 tệ, có thể mang lại lợi nhuận rất lớn.

4. Những thứ còn lại chỉ là phế liệu, nhưng còn hơn không.

Vì vậy, bạn hãy sắp xếp sơ đồ logic và bảng dữ liệu sau. Bước này, theo thuật ngữ chuyên môn, được gọi là xây dựng mô hình phân tích.

Sau khi thực hiện xong, bạn có thể bắt đầu thu thập dữ liệu.

1. Sử dụng WeChat và Alipay để thanh toán, do đó bạn có thể trực tiếp xem số tiền nhận được trong ngày.

2. Lượng bánh quy, trứng, xúc xích giăm bông và thịt gà phi lê tiêu thụ có thể được tính một lần vào mỗi buổi sáng và buổi tối.

3. Lượng khí tiêu thụ không thể tính toán được theo ngày. Bạn chỉ có thể tính toán được cần bao nhiêu ngày để thay gas hai lần và phân bổ số ngày đó.

Quá trình này, theo thuật ngữ chuyên môn, được gọi là thu thập dữ liệu . Trong quá trình thu thập, chúng ta nên chú ý loại bỏ một số vấn đề. Ví dụ, nếu ai đó thua 1.000 nhân dân tệ khi chơi mạt chược vào ban đêm, thì điều này không liên quan gì đến quầy hàng, vì vậy nên loại trừ khỏi thu nhập và chi tiêu của WeChat. Đây được gọi là làm sạch dữ liệu .

Sau khi thu thập dữ liệu chi tiết, có thể tính toán thu nhập và chi tiêu hàng ngày như thể hiện trong bảng sau. Quá trình này được gọi là: tính toán dữ liệu (thường được gọi là: thu thập dữ liệu) . Độ phức tạp của việc thu thập dữ liệu có liên quan trực tiếp đến độ phức tạp của việc tính toán dữ liệu. Nếu dữ liệu đơn giản như trên thì công việc chắc chắn sẽ dễ dàng hơn nhiều.

Có một bài thơ như sau: "Một tách trà, một điếu thuốc và một câu lệnh SQL để viết trong một ngày", bài thơ này phàn nàn rằng việc tính toán dữ liệu quá phức tạp, dẫn đến phải viết hàng trăm dòng lệnh SQL.

Sau khi xem dữ liệu, bạn sẽ tò mò: Tại sao thu nhập của Lão Vương lại không ổn định như vậy? Một ngày cao, một ngày thấp. Sau khi hiểu rõ từng ngày, bạn sẽ thấy:

1. Vào những ngày mưa, ít người ra đường và thu nhập giảm (yếu tố bên ngoài)

2. Hôm nay tôi dậy muộn, không kiếm được chỗ ngồi tốt và thu nhập của tôi giảm (yếu tố nội tại)

3. Hôm nay tôi bị sốt và cảm thấy khó chịu nên chỉ làm đến 9 giờ tối và đóng quầy sớm, dẫn đến thu nhập giảm (yếu tố nội tại)

Có vẻ như nếu không ghi lại những lý do này thì không thể tiến hành phân tích chuyên sâu được. Vì vậy, bạn đã ghi lại các yếu tố bên trong và bên ngoài của Lão Vương hàng ngày như thể hiện trong hình bên dưới. Hành động này được gọi là: thêm chiều phân tích (thường được gọi là: dán nhãn).

Với góc độ phân tích, chúng ta có thể lý giải vì sao thu nhập của Lão Vương không ổn định và có khả năng dự đoán nhất định. Ví dụ, nếu bạn xem dự báo thời tiết và dự kiến ​​trời sẽ mưa trong hai tuần vào tháng này thì chắc chắn ông Vương sẽ mất thu nhập.

Kết hợp tất cả thông tin trên, sau 1 tháng, cuối cùng bạn đã hoàn thành các mục tiêu phân tích được liệt kê ở phần đầu, như thể hiện trong hình bên dưới.

Nhìn chung, có vẻ như lương của Lão Vương thực sự cao hơn lương của bạn trong tháng thống kê này. Nhưng sau khi phân tích cẩn thận, bạn sẽ hiểu được những yếu tố ảnh hưởng đến sự biến động thu nhập của Lão Vương, điều này có thể bổ sung thêm chiều hướng mới cho phán đoán của bạn. Ví dụ:

1. Tôi có thể kiên trì dựng gian hàng 28 ngày một tháng không?

2. Tôi có thể dậy lúc 6 giờ sáng để có chỗ ngồi tốt không?

3. Tôi có thể chịu đựng đến 9 giờ tối ngay cả khi bị sốt không?

Quá trình này, theo thuật ngữ chuyên môn, được gọi là: thêm tiêu chí đánh giá .

Cuối cùng, bạn đi đến kết luận rằng tuy thu nhập từ việc dựng gian hàng cao nhưng lại đòi hỏi quá nhiều sức lực và độ ổn định kém nên bạn từ chối lời đề nghị dựng gian hàng. Điều này được gọi là: rút ra kết luận phân tích .

Trên đây là toàn bộ quá trình phân tích dữ liệu:

1. Hiểu bối cảnh phân tích

2. Làm rõ mục tiêu phân tích

3. Xây dựng mô hình phân tích

4. Thu thập dữ liệu, làm sạch và tính toán

5. Thêm kích thước phân tích và tiêu chí đánh giá

6. Rút ra kết luận và đề xuất

Những lý do phổ biến khiến nhiều sinh viên cảm thấy rằng họ chưa thực hiện phân tích đầy đủ là:

  • Là một nhân viên cơ sở, tôi chỉ thực hiện bước 4. Tôi không biết tại sao người ta lại thu thập những con số này và chúng được dùng để làm gì.
  • Nếu không có mục tiêu rõ ràng (bước 2), không thể đưa ra kết luận sau khi thu thập dữ liệu và không thể đưa ra những đề xuất hiệu quả.
  • Tôi không hiểu về doanh nghiệp, tôi không biết mô hình là gì (bước 3) và tôi không biết những chiều nào là hữu ích (bước 5)
  • Xây dựng dữ liệu của công ty quá kém, thiếu dữ liệu, chất lượng dữ liệu kém và tiêu tốn nhiều năng lượng (Bước 4)
  • Bộ phận kinh doanh không hợp tác, và chính người lãnh đạo của tôi cũng quá lười để chỉ bảo tôi, chỉ bảo tôi “suy nghĩ nhiều hơn”…

Tác giả: Thầy giáo thực tế Trần, Nguồn: Tài khoản công khai WeChat "Thầy giáo thực tế Trần"

<<:  Xiaohongshu có nhiều bài viết phổ biến nhưng không mang lại sự chuyển đổi. Làm thế nào để phá vỡ bế tắc?

>>:  Cơ chế thuật toán lưu lượng truy cập Xiaohongshu, Tài khoản video và Douyin, nên thu thập!

Gợi ý

Kinh tế câu chuyện, hãy để tiếp thị của bạn chạm đến trái tim mọi người

Người tiêu dùng có ác cảm mạnh mẽ với quảng cáo g...

Tại sao người Trung Quốc ghét người Nhật Bản (Khám phá lịch sử)

Có một lịch sử lâu dài và mối quan hệ phức tạp giữ...

Hoạt động Khoảnh khắc Thích (Giúp bạn bè đạt được mong muốn)

Vòng tròn bạn bè đã trở thành nền tảng quan trọng ...

2025, thương mại điện tử mở ra một “sự cân bằng mới”

Năm 2024 là một năm đầy thách thức đối với các do...

Kiểm tra tên trùng lặp, kiếm 3.000 một ngày

Tác giả bài viết này đã chia sẻ một trường hợp ki...

“Tiếp thị” thực chất là gì?

Chúng ta đều quen thuộc với các khái niệm về tiếp...

Cách khởi động lại thiết bị Apple bị sập (Giải pháp cho thiết bị Apple bị sập)

Một tình huống khác là phần cứng điện thoại bị lỗi...