Năm nay, 618 hãng hàng không lớn đang cạnh tranh để trở thành "mẫu thấp nhất toàn mạng lưới". Tính toán đằng sau dịch vụ miễn phí này là gì?

Năm nay, 618 hãng hàng không lớn đang cạnh tranh để trở thành "mẫu thấp nhất toàn mạng lưới". Tính toán đằng sau dịch vụ miễn phí này là gì?

Trong sự kiện 618 này, không chỉ có sự cạnh tranh khốc liệt giữa các sàn thương mại điện tử mà cuộc chiến giá cả cũng nổ ra giữa các nhà sản xuất mẫu máy lớn, nhiều nhà sản xuất mẫu máy lớn đã lựa chọn phương án giảm giá. Làm thế nào để giải thích thêm? Hãy cùng xem những nội dung được chia sẻ trong bài viết này.

Cuộc chiến giá cả trong lễ hội mua sắm 618 này được khởi xướng bởi những người mẫu lớn.

ByteDance dẫn đầu và BAT bám sát theo sau. Mẫu chính giảm giá 97%, một triệu token chỉ còn 1 nhân dân tệ, mẫu lớn tiến vào "kỷ nguyên centimet", miễn phí, hoàn toàn miễn phí, miễn phí vĩnh viễn... Đã lâu rồi chưa thấy giảm giá ở mức này. Có vẻ như đây là sự tái hiện của "Cuộc tấn công trăm trung đoàn", "cuộc chiến O2O", "cuộc chiến trợ cấp gọi xe trực tuyến" và "đấu thầu 1 nhân dân tệ cho các dự án đám mây", châm ngòi cho cuộc chiến trong ngành.

1. 8 mẫu xe lớn đồng loạt giảm giá

ByteDance và BAT đã cùng nhau bước vào cuộc chiến giá mô hình lớn. Theo số liệu thống kê chưa đầy đủ của IT Times, kể từ tháng 5, tám công ty người mẫu lớn trong và ngoài nước đã công bố giảm giá mạnh, bao gồm Huanfang Quantitative, Zhipu, GPT-4o, ByteDance, Alibaba Tongyi Qianwen, Baidu Wenxin Yiyan, Tencent Hunyuan và iFlytek Spark.

Vào ngày 15 tháng 5, ByteDance đã bắt đầu cuộc chiến giá cả cho các mẫu máy lớn. Giá đầu vào của Doubao Universal Model Pro-32k phiên bản giảm xuống còn 0,0008 nhân dân tệ/nghìn token, giá đầu vào của Doubao Universal Model Pro-128k phiên bản giảm xuống còn 0,005 nhân dân tệ/nghìn token. Điều này có nghĩa là 1,25 triệu token của mô hình chính Doubao có thể được mua với giá 1 nhân dân tệ, tương đương với khoảng 2 triệu chữ Hán, tương đương với 3 bản sao của "Tam Quốc Diễn Nghĩa".

Các mô hình lớn thường sử dụng "nhân dân tệ/nghìn token" làm đơn vị thanh toán. ByteDance đã trực tiếp giảm chi phí sử dụng từ vài cent xuống còn vài cent, điều này thực sự đã gây ra một cuộc chiến về giá.

Alibaba và Baidu cũng đi theo xu hướng này vào khoảng ngày 21 tháng 5, với giá đầu vào của Qwen-Long, mô hình GPT-4 chính của Alibaba Tongyi Qianwen, giảm xuống còn 0,0005 nhân dân tệ/nghìn token, giảm 97%. Sau khi giảm giá, giá chỉ còn khoảng 1/400 giá GPT-4, phá vỡ mức giá sàn toàn cầu. Điều này có nghĩa là 1 nhân dân tệ có thể mua được 2 triệu token, tương đương với 5 cuốn từ điển Tân Hoa Xã. Baidu Wenxin Yiyan trực tiếp tuyên bố rằng hai mô hình chính của họ hoàn toàn miễn phí và có hiệu lực ngay lập tức. Đó là các mẫu máy ảnh lớn nhẹ ERNIE Speed ​​và ERNIE Lite ra mắt vào tháng 3 năm nay, hỗ trợ độ dài ngữ cảnh 8k và 128k.

Vào ngày 22 tháng 5, mẫu xe cỡ lớn Hunyuan của Tencent đã giảm giá đồng loạt. Giá của một trong những mô hình chính, mô hình Hunyuan-lite, đã được điều chỉnh từ 0,008 nhân dân tệ/nghìn token thành hoàn toàn miễn phí và tổng chiều dài đầu vào và đầu ra API dự kiến ​​sẽ được nâng cấp từ 4k hiện tại lên 256k. Giá đầu vào và đầu ra API của ba model chính là Hunyuan-standard, Hunyuan-standard-256k có khả năng xử lý văn bản siêu dài trên 380.000 ký tự và Hunyuan-pro, model có cấu hình cao nhất với hàng nghìn tỷ tham số, đều được giảm trên diện rộng, mức giảm giá tối đa là 87,5%.

Cùng ngày, iFLYTEK đã ra mắt mẫu máy bay lớn "miễn phí vĩnh viễn" đầu tiên trong ngành - Spark Large Model Lite. Giá của phiên bản cao cấp nhất của iFLYTEK Spark Max API chỉ thấp tới 0,21 nhân dân tệ/10.000 token. Trong khi đó, Baidu Wenxin Yiyan ERNIE4.0 và Ali Tongyi Qianwen Qwen-Max có giá 1,2 nhân dân tệ/10.000 token. Phiên bản cao cấp nhất của iFLYTEK Spark chỉ bằng một phần năm của Baidu và Ali.

Điều thực sự khiến các mô hình lớn trong nước lo lắng là OpenAI đã giảm giá bốn lần kể từ đầu năm 2023. GPT-4o được phát hành vào ngày 13 tháng 5 không chỉ đạt được bước nhảy vọt về hiệu suất mà còn giảm giá 50%.

2. Những người khổng lồ chi tiền để mua dữ liệu

"Mức giá hiện tại của các mẫu xe lớn không còn đủ để trang trải chi phí, nhưng tại sao các nhà sản xuất xe lớn vẫn tiếp tục giảm giá? Mục đích chính là để thu thập dữ liệu." Theo quan điểm của Zhou Jian, CEO của Lanma Technology, tập trung vào AI Agent, chiến lược của GPT-4o là cung cấp các dịch vụ miễn phí cho công chúng và giảm một nửa phí cho các nhà phát triển để công chúng có thể sử dụng nhiều hơn, qua đó thu thập dữ liệu tương tác như nhiều vòng hội thoại, có thể cải thiện khả năng của mô hình nhanh hơn dữ liệu tĩnh. Các mẫu xe lớn trong nước cũng đang trong giai đoạn "đốt tiền mua dữ liệu".

Trước đây, các mô hình LLM lớn không có khái niệm về thời gian, nhưng GPT-4o đã giải quyết được vấn đề về trí nhớ ngắn hạn. Nó có thể cảm nhận cảm xúc, làm theo hướng dẫn hoặc bị ngắt lời trong khi trò chuyện và có thể kể chuyện bằng giọng nói với nhiều cảm xúc khác nhau. Tuy nhiên, khả năng ghi nhớ dài hạn và trí thông minh xã hội của nó vẫn còn chưa đủ.

Chu Kiến đưa ra một phép so sánh. Kể cả khi GPT-4o thông minh như Einstein thì cũng không đủ tiêu chuẩn để trở thành CFO của một công ty niêm yết vì vai trò này đòi hỏi trí nhớ dài hạn tốt và khả năng tóm tắt và phân tích toàn bộ cơ cấu tổ chức, cơ cấu quyền lực, v.v. của công ty dựa trên các phương thức truyền thông khác nhau. Do đó, ở giai đoạn này nó vẫn chỉ là "bộ não trong lọ".

Ngoài việc miễn phí cho công chúng, OpenAI còn sử dụng phần cứng để thu thập dữ liệu về doanh số bán hàng ngoại tuyến, săn đầu người và các tương tác khác với khách hàng. Sau khi phát hành GPT-4o, OpenAI đã hợp tác với Reddit, một diễn đàn nổi tiếng của Mỹ và là nơi tập hợp các nhà đầu tư bán lẻ trên thị trường chứng khoán Hoa Kỳ, để thu thập nội dung cộng đồng nhằm đào tạo các mô hình lớn. Do đó, mục đích của việc thu thập những dữ liệu động thực này là để làm cho mô hình lớn giống con người hơn, có khả năng thực hiện nhiều vòng hội thoại, trí nhớ dài hạn và quen thuộc với logic của tương tác xã hội.

Theo quan điểm của Xu Hongyi, giám đốc R&D cấp cao tại Viện Trí tuệ nhân tạo Thượng Hải, dữ liệu cũng là chìa khóa để các mô hình lớn chinh phục thị trường. Hiện nay, sự cạnh tranh đối với các mô hình lớn đã chuyển từ sức mạnh tính toán sang dữ liệu chất lượng cao. Dữ liệu chất lượng cao của Trung Quốc rất khan hiếm, dữ liệu tương tác động thậm chí còn quan trọng hơn.

Sách giáo khoa tiếng Trung chỉ bằng một phần mười sách giáo khoa tiếng Anh. Vòng dữ liệu kiến ​​thức tĩnh của tiếng Trung đương nhiên yếu hơn tiếng Anh, do đó chúng ta chỉ có thể đạt được những đột phá về mặt định lượng trong dữ liệu động. Chỉ bằng cách để người thật sử dụng, chúng ta mới có thể thu thập được dữ liệu động. Ngoài ra, 70% dữ liệu trên thế giới chỉ ở mức dữ liệu miễn phí và công khai. Nếu chúng ta muốn các mô hình lớn nắm vững kiến ​​thức chuyên môn, chúng ta chỉ có thể tiếp tục thu hút các nhà phát triển từ mọi tầng lớp xã hội để đưa vào các bộ dữ liệu trường dọc.

Giá thấp chắc chắn là cách tốt nhất để thu hút khách hàng. Tất nhiên, tiền đề là phải đảm bảo chất lượng tương đương hoặc thậm chí là tốc độ nhanh hơn. Từ GPT-4 năm ngoái đến GPT-4o năm nay, tốc độ phản hồi mã thông báo đầu tiên nhanh hơn 6 lần, nhưng giá truy xuất rẻ hơn 12 lần. Các nhà sản xuất nước ngoài thu hút sự chú ý bằng tốc độ, trong khi các nhà sản xuất trong nước chiếm lĩnh thị trường bằng giá cả. Tuy nhiên, một số người trong ngành và giới truyền thông đã đặt câu hỏi rằng việc các nhà sản xuất mô hình lớn thảo luận về giá mà không xem xét đến lượng đồng thời là "phi khoa học". Nếu chúng không thể hỗ trợ tính đồng thời cao, chúng không thể đảm bảo tốc độ và chất lượng đầu ra.

"Việc giảm giá đồng loạt các mẫu xe lớn không chỉ là chiến lược thị trường mà còn là tín hiệu cho thấy bước ngoặt đã đến." Yang Xiaojing, một chuyên gia được bổ nhiệm đặc biệt tại Bắc Kinh, người từng chịu trách nhiệm về mô hình rủi ro trái phiếu tín dụng đầu tiên của đất nước dựa trên dữ liệu không gian thời gian, tin rằng có ba lý do khiến giá chung của các mô hình lớn giảm: thứ nhất, dựa trên các chính sách như trợ cấp thống nhất, việc giảm chi phí đám mây, chip điện toán, v.v. đã mang lại lợi nhuận công nghệ; Thứ hai, đó là sự tự tin của các nhà sản xuất mô hình lớn vào khả năng tăng trưởng quy mô. Đầu năm 2024, khối lượng cuộc gọi API hàng ngày của tất cả các mô hình lớn trong nước sẽ không vượt quá 100 triệu lần, nhưng dự kiến ​​sẽ tăng gấp 100 lần vào cuối năm nay; Cuối cùng, nó nhằm thu hút các nhà phát triển, qua đó nhanh chóng bao phủ hàng ngàn ngành công nghiệp. Tỷ lệ thâm nhập người dùng AIGC hiện tại ở Trung Quốc chỉ khoảng 6%.

"ByteDance muốn quảng bá Volcano Engine và các dịch vụ đám mây thông qua mô hình lớn Doubao. Trên thực tế, video và các nội dung khác mới là nơi có giá trị nhất." Yang Xiaojing cũng tin rằng đám mây, sức mạnh điện toán, mô hình lớn, nội dung và dữ liệu là một chuỗi. Một khi kết nối với nhau, chúng có thể tạo thành một vòng tuần hoàn sinh thái khép kín. Đây cũng là logic nội tại của những gã khổng lồ chi tiền để đổi lấy dữ liệu.

3. Cuộc chiến giá cả có thể được truyền đến C-end

"Cuộc chiến trăm mẫu" đã thực sự bước vào giai đoạn chiến đấu thực sự. Theo quan sát của phóng viên "IT Times", nội dung chính của đợt giảm giá lần này là mô hình chữ lớn, chủ yếu hướng đến các nhà phát triển và doanh nghiệp, chưa truyền tải đến cấp độ người dùng C. Ở giai đoạn tiếp theo, các mẫu xe lớn trong nước có thể sẽ được giảm giá ở cấp độ người dùng C và các mẫu xe lớn đa phương thức. Làm cho nó có giá cả phải chăng hoặc thậm chí miễn phí cho người dùng C-end, giúp các mô hình lớn ngày càng dễ sử dụng hơn.

Ở nước ngoài, OpenAI gần như đã hình thành thế độc quyền nhờ lợi thế về hiệu suất. Mô hình lớn đa phương thức mới nhất GPT-4o của OpenAI hiện chỉ mở chức năng văn bản và hình ảnh, nhưng sẽ mở miễn phí cho tất cả người dùng C-end trong tương lai. Và hỗ trợ đầu vào và đầu ra giọng nói và video.

Bản trình diễn GPT-4o

Hiện tại, nếu bạn muốn trải nghiệm phiên bản Plus trên ChatGPT, bạn vẫn cần phải nâng cấp lên gói thành viên có giá 19,99 đô la/tháng. Theo Appfigures, một công ty phân tích ứng dụng, doanh thu ròng từ ứng dụng ChatGPT đã tăng 22% vào ngày GPT-4o được phát hành, đạt 900.000 đô la vào ngày 21 tháng 5, gần gấp đôi doanh thu trung bình hàng ngày của ứng dụng.

"Cạnh tranh trên thị trường xe cỡ lớn trong nước đang ngày càng trở nên khốc liệt. Cho đến khi có người chiến thắng tuyệt đối, xu hướng giảm giá sẽ không dừng lại và thậm chí có thể giảm theo cấp số nhân", Zhou Jian tin tưởng.

Yang Xiaojing cũng tin rằng lượng người dùng lớn và thị trường tiêu dùng rộng lớn sẽ đẩy nhanh quá trình giảm chi phí.

Đằng sau cuộc chiến giá cả là thực tế các mô hình lớn của Trung Quốc muốn nắm bắt lợi nhuận từ dữ liệu và kịch bản, đồng thời rút ngắn hoặc thậm chí vượt qua tốc độ phát triển của các mô hình lớn của Hoa Kỳ. "Vũ khí kỳ diệu" của Trung Quốc trong việc vượt mặt các đối thủ trên thị trường Internet di động và 5G chính là tập trung vào dữ liệu và kịch bản. Vậy, trong thời đại của những mẫu xe lớn, liệu con đường vượt mặt này có còn khả thi không?

Năm 2024 được coi là năm đầu tiên thương mại hóa các mô hình lớn. IDC dự đoán quy mô thị trường mô hình AI lớn của Trung Quốc sẽ đạt 21,1 tỷ đô la Mỹ vào năm 2026 và trí tuệ nhân tạo sẽ bước vào giai đoạn quan trọng để ứng dụng trên diện rộng. Theo quan sát của Xu Hongyi, các mô hình lớn trong nước có xu hướng đi sâu hơn vào các kịch bản ứng dụng và đặt nền tảng dựa trên kinh doanh.

Luôn có tranh cãi về khoảng cách trong phát triển mô hình quy mô lớn giữa Trung Quốc và Hoa Kỳ. Một số người nói rằng khoảng cách là một năm rưỡi, trong khi những người khác lại nói là nửa năm. Mới đây, "Báo cáo chỉ số trí tuệ nhân tạo năm 2024" do Đại học Stanford công bố cho thấy, trong số 149 mô hình lớn nổi tiếng được công bố trên thế giới vào năm 2023, Hoa Kỳ chiếm 61 và Trung Quốc chiếm 15, xếp thứ 2 thế giới, bắt kịp với tốc độ nhanh hơn. Trung Quốc chiếm 60% tổng số bằng sáng chế AI, dẫn đầu các quốc gia khác.

Nếu Trung Quốc muốn thu hẹp khoảng cách phát triển các mô hình lớn giữa Trung Quốc và Hoa Kỳ, các mô hình lớn của Trung Quốc phải dựa vào các kịch bản ứng dụng để giành chiến thắng.

Việc giảm giá sẽ trực tiếp thúc đẩy các công ty sử dụng những mẫu xe lớn. Dựa trên kinh nghiệm trước đây trong việc phát triển các mô hình rủi ro trái phiếu tín dụng và các cố vấn đầu tư thông minh, Yang Xiaojing ước tính rằng từ năm 2005 đến năm 2022, đã có 825.000 báo cáo nghiên cứu của công ty môi giới được tích lũy trên thị trường cổ phiếu A. Nếu tính mỗi báo cáo dài 10.000 từ thì tổng cộng khoảng 8,5 tỷ từ, tương đương với 340 triệu token. Đối với các nhà phát triển mô hình lớn phục vụ nghiên cứu đầu tư thông minh, nếu trước đây họ sử dụng giá của một mô hình lớn chung để gọi API, mỗi lần sẽ tốn 34.000 nhân dân tệ, nhưng hiện nay chỉ tốn 1.700 nhân dân tệ.

Theo đánh giá của Dương Hiểu Tĩnh, trong lĩnh vực tài chính, lĩnh vực dịch vụ khách hàng thông minh đang rất cần thiết sẽ chứng kiến ​​tác động của việc đưa AI vào và giảm giá nhanh nhất. Sau khi chi phí cuộc gọi giảm, quy mô người dùng dịch vụ cũng sẽ tăng nhanh chóng.

Ngoài ra, Trung Quốc là quốc gia lắp đặt robot công nghiệp lớn nhất thế giới, chiếm 50% tổng số robot trên toàn thế giới. Các công ty AI lớn của Trung Quốc nên nắm bắt cơ hội để nâng cấp quá trình công nghiệp hóa của mình. Yang Xiaojing cho biết: "Các dịch vụ AI phải dễ sử dụng và dễ tiếp cận như nước và điện, và phải phổ biến như 5G, để chúng ta có thể vượt qua các công nghệ khác như 5G và đạt được vị trí dẫn đầu toàn cầu".

<<:  Nhóm làm đẹp Hạ Môn có thể không thoát khỏi Douyin

>>:  Quảng cáo mới của Samsung có ẩn ý về Apple, liệu chiêu quảng cáo cạnh tranh này luôn hiệu quả?

Gợi ý

Tại sao việc phát triển các ứng dụng AI gốc lại khó khăn đến vậy?

Việc phát triển các ứng dụng AI gốc đang ngày càn...

Hema có vẻ như đã trở lại đúng hướng

Bài viết này phân tích sâu sắc những điều chỉnh c...

Miaoya Camera, xong chưa?

Bạn vẫn còn sử dụng Miaoya chứ? MiaoYa, từng thốn...