Tại sao việc phát triển các ứng dụng AI gốc lại khó khăn đến vậy?

Tại sao việc phát triển các ứng dụng AI gốc lại khó khăn đến vậy?

Việc phát triển các ứng dụng AI gốc đang ngày càng trở nên khó khăn. Tại sao các ứng dụng AI ngày càng khó triển khai? Chúng ta hãy cùng xem ý kiến ​​của tác giả nhé~

Các ứng dụng AI gốc "khó có thể ra đời". Sau cuộc chiến Trăm mẫu, một nhóm doanh nhân kiệt sức dần nhận ra rằng cơ hội thực sự của Trung Quốc nằm ở lớp ứng dụng và các ứng dụng AI gốc là mảnh đất màu mỡ nhất cho vòng tiếp theo.

Lý Diên Hồng, Vương Tiểu Xuyên, Chu Hồng Nghị và Phó Thịnh, khi xem lại các bài phát biểu của những người đứng đầu trong vài tháng qua, tất cả đều nhấn mạnh đến những cơ hội to lớn trong tầng ứng dụng.

Các gã khổng lồ Internet luôn nói về AI gốc: Baidu đã phát hành hơn 20 ứng dụng AI gốc cùng một lúc; ByteDance thành lập một nhóm mới để tập trung vào lớp ứng dụng; Tencent nhúng các mô hình lớn vào các chương trình nhỏ; Alibaba cũng muốn sử dụng Tongyi Qianwen để làm lại tất cả các ứng dụng; Wps đang tặng thẻ trải nghiệm AI một cách điên cuồng...

Các công ty khởi nghiệp thậm chí còn nhiệt tình hơn. Sau một cuộc thi hackathon, đã có gần 200 dự án AI gốc. Từ đầu năm đến nay, đã có hàng chục sự kiện lớn nhỏ diễn ra, trong đó có Qiji Chuangtan, Baidu, Founder Park, cùng hàng ngàn dự án, nhưng cuối cùng, không có dự án nào thành công.

Chúng ta phải đối mặt với thực tế rằng mặc dù chúng ta nhận thức được những cơ hội to lớn ở lớp ứng dụng, nhưng mô hình lớn vẫn chưa thể thay đổi tất cả các ứng dụng và tất cả các sản phẩm đều đang trải qua quá trình chuyển đổi dễ dàng. Mặc dù Trung Quốc có những nhà quản lý sản phẩm giỏi nhất, nhưng lần này họ cũng "thất bại".

Từ thời điểm Midjourney trở nên phổ biến vào tháng 4 đến nay, đã 9 tháng trôi qua. Tại sao ứng dụng AI bản địa trong nước từng tập hợp “niềm hy vọng của cả làng” lại khó có thể ra đời?

Sự lựa chọn quan trọng hơn sự chăm chỉ. Lúc này, có lẽ chúng ta cần bình tĩnh nhìn lại và tìm ra “tư thế” đúng đắn để mở ứng dụng AI gốc.

1. AI gốc, không phải đầu cuối

Tại sao việc tạo ra các ứng dụng gốc lại khó khăn? Chúng ta có thể tìm ra một số câu trả lời từ quá trình "sản xuất" các ứng dụng gốc.

"Chúng tôi thường chạy bốn hoặc năm mô hình cùng lúc và chọn mô hình có hiệu suất tốt hơn." Một doanh nhân kiểu mẫu ở Thung lũng Silicon đã đề cập trong một cuộc phỏng vấn với "Self-Quadrant" rằng họ phát triển các ứng dụng AI dựa trên các mô hình lớn cơ bản, nhưng không ràng buộc với một mô hình lớn cụ thể nào trong giai đoạn đầu. Thay vào đó, họ để từng mô hình chạy thử và cuối cùng chọn ra mô hình phù hợp nhất.

Nói một cách đơn giản, cơ chế đua ngựa hiện cũng đã tham gia vào mô hình lớn.

Tuy nhiên, cách tiếp cận này vẫn có một số nhược điểm. Mặc dù nó chọn nhiều mô hình lớn khác nhau để thử nghiệm, nhưng cuối cùng nó sẽ được kết hợp chặt chẽ với một trong những mô hình lớn đó. Đây vẫn là phương pháp nghiên cứu và phát triển "toàn diện", nghĩa là một ứng dụng tương ứng với một mô hình lớn.

Nhưng không giống như các ứng dụng, với tư cách là một mô hình cơ bản lớn, nó tương ứng với nhiều ứng dụng cùng một lúc, dẫn đến sự khác biệt rất hạn chế giữa các ứng dụng khác nhau trong cùng một kịch bản. Vấn đề lớn hơn là các mẫu xe lớn cơ bản trên thị trường hiện nay đều có điểm mạnh và điểm yếu riêng. Không có mô hình lớn nào trở thành chiến binh lục giác, dẫn đầu trong mọi lĩnh vực, do đó, điều này khiến các ứng dụng được phát triển dựa trên mô hình lớn khó đạt được sự cân bằng trong mọi chức năng.

Trong bối cảnh này, việc tách các mô hình lớn khỏi các ứng dụng đã trở thành một ý tưởng mới.

Cái gọi là "tách rời" thực chất được chia thành hai liên kết.

Đầu tiên là tách các mô hình lớn khỏi các ứng dụng. Là động lực cơ bản của các ứng dụng AI gốc, mối quan hệ giữa các mô hình lớn và ứng dụng gốc thực sự có thể được so sánh với ngành công nghiệp ô tô.

Đối với các ứng dụng AI gốc, các mô hình lớn giống như động cơ của ô tô. Cùng một loại động cơ có thể được lắp vào nhiều mẫu xe khác nhau và cùng một mẫu xe cũng có thể được lắp với nhiều loại động cơ khác nhau. Thông qua các cách điều chỉnh khác nhau, có thể đạt được vị thế khác nhau từ xe siêu nhỏ đến xe sang trọng.

Vì vậy, đối với toàn bộ xe, động cơ chỉ là một phần của cấu hình tổng thể và không thể là cốt lõi xác định toàn bộ xe.

Tương tự như các ứng dụng AI gốc, mô hình lớn cơ bản là chìa khóa để thúc đẩy ứng dụng, nhưng mô hình lớn cơ bản không nên bị ràng buộc hoàn toàn vào việc triển khai ứng dụng. Một mô hình lớn có thể điều khiển nhiều ứng dụng khác nhau và cùng một ứng dụng cũng có thể được điều khiển bởi nhiều mô hình lớn khác nhau.

Những ví dụ như vậy thực tế đã được phản ánh trong các trường hợp hiện tại. Ví dụ, Feishu và DingTalk trong nước và Slack nước ngoài đều có thể thích ứng với nhiều mô hình lớn cơ bản khác nhau và người dùng có thể lựa chọn theo nhu cầu của riêng mình.

Thứ hai, trong các ứng dụng cụ thể, mô hình lớn và các liên kết ứng dụng khác nhau phải được tách rời từng lớp.

Một ví dụ điển hình là HeyGen, một công ty video AI đã trở nên phổ biến ở nước ngoài. Doanh thu định kỳ hàng năm của công ty đạt 1 triệu đô la Mỹ vào tháng 3 năm nay và đạt 18 triệu đô la Mỹ vào tháng 11 năm nay.

HeyGen hiện có 25 nhân viên, nhưng đã xây dựng các mô hình AI video của riêng mình và tích hợp các mô hình ngôn ngữ lớn từ OpenAI và Anthropic cùng các sản phẩm âm thanh từ Eleven Labs. Dựa trên các mô hình lớn khác nhau, HeyGen sẽ sử dụng các mô hình khác nhau ở các liên kết khác nhau như sáng tạo, tạo kịch bản (văn bản) và âm thanh khi thực hiện video.

Một ví dụ trực tiếp khác là hệ sinh thái plug-in của ChatGPT. Gần đây, ứng dụng chỉnh sửa nội dung trong nước Jianying đã gia nhập hệ sinh thái ChatGPT. Sau đó, khi người dùng yêu cầu gọi plug-in của Jianying để tạo video trên ChatGPT, Jianying có thể tự động tạo video theo lệnh của ChatGPT.

Nói cách khác, khả năng khớp nhiều-nhiều giữa các mô hình lớn và ứng dụng có thể được tinh chỉnh để lựa chọn mô hình lớn phù hợp nhất để hỗ trợ trong mỗi liên kết. Nghĩa là, một ứng dụng không được điều khiển bởi một mô hình lớn mà bởi một số hoặc thậm chí một nhóm các mô hình lớn.

Nhiều mô hình lớn tương ứng với một ứng dụng, tích hợp thế mạnh của hàng trăm trường học. Theo mô hình như vậy, sự phân công lao động trong chuỗi ngành AI cũng sẽ được định nghĩa lại.

Giống như chuỗi công nghiệp ô tô hiện nay, mỗi mắt xích của động cơ, pin, phụ kiện và thân máy bay đều có một nhà sản xuất chuyên trách chịu trách nhiệm về nhiệm vụ của mình, và OEM chỉ cần lựa chọn và lắp ráp để tạo thành các sản phẩm khác biệt và đưa chúng ra thị trường cùng một lúc.

Phân chia lại công việc, phá bỏ và sắp xếp lại, không có phá hủy thì không có xây dựng.

2. Nguyên mẫu của hệ sinh thái mới

Mô hình đa mô hình và đa ứng dụng sẽ tạo ra một hệ sinh thái mới.

Theo hướng dẫn này, chúng tôi đã cố gắng hình dung kiến ​​trúc của hệ sinh thái mới dựa trên trải nghiệm của Internet.

Khi các chương trình nhỏ lần đầu tiên được giới thiệu, mọi người đều bối rối về khả năng, kiến ​​trúc và tình huống ứng dụng của chúng. Trong giai đoạn đầu, mỗi công ty phải tự học các khả năng và phương pháp của các chương trình nhỏ. Việc phát triển các chương trình nhỏ diễn ra rất chậm và số lượng không thể tăng nhanh.

Cho đến khi các nhà cung cấp dịch vụ WeChat xuất hiện, các nhà cung cấp dịch vụ đã có thể kết nối với hệ sinh thái WeChat một mặt và làm quen với kiến ​​trúc và cấu trúc cơ bản của các chương trình nhỏ, mặt khác kết nối với khách hàng doanh nghiệp để giúp khách hàng tạo ra các chương trình nhỏ độc quyền dựa trên nhu cầu của họ. Đồng thời, họ hợp tác với toàn bộ hệ sinh thái WeChat để thu hút và giữ chân khách hàng thông qua các chương trình nhỏ. Nhóm nhà cung cấp dịch vụ này cũng bao gồm WeMall và Youzan.

Nói cách khác, thị trường có thể không cần những mô hình dọc lớn, nhưng lại cần những nhà cung cấp dịch vụ mô hình lớn.

Tương tự như vậy, mỗi mô hình lớn cần phải được sử dụng và vận hành thực sự trước khi người ta có thể thực sự hiểu được các tính năng liên quan và cách sử dụng nó. Nhà cung cấp dịch vụ nằm ở lớp trung gian, không chỉ có thể tương thích ngược với nhiều mô hình lớn mà còn hợp tác với các doanh nghiệp để tạo ra một hệ sinh thái lành mạnh.

Dựa trên kinh nghiệm trước đây, chúng ta có thể chia các nhà cung cấp dịch vụ thành ba loại:

Loại thứ nhất là các nhà cung cấp dịch vụ có kinh nghiệm, hiểu biết và nắm vững đặc điểm và kịch bản ứng dụng của từng mô hình lớn, hợp tác với các kịch bản phân khúc của ngành và mở rộng thị trường thông qua các nhóm dịch vụ;

Loại nhà cung cấp dịch vụ dựa trên tài nguyên thứ hai giống như Weimob, có thể có được không gian quảng cáo giá rẻ trên WeChat và sau đó thuê ngoài. Trong tương lai, quyền mở của các mô hình lớn sẽ không còn được áp dụng phổ biến nữa. Các nhà cung cấp dịch vụ có thể xin được đủ giấy phép sẽ xây dựng các rào cản ngay từ đầu.

Loại thứ ba là nhà cung cấp dịch vụ công nghệ. Khi một ứng dụng có nhiều mô hình lớn khác nhau được nhúng trong lớp cơ sở, chúng cần giải quyết nhiều vấn đề kỹ thuật khác nhau như cách gọi và kết nối nhiều mô hình trong khi vẫn đảm bảo tính ổn định và bảo mật.

Theo quan sát của "Self-quadrant", các nguyên mẫu của các nhà cung cấp dịch vụ mô hình lớn đã bắt đầu xuất hiện trong sáu tháng qua, nhưng dưới hình thức dịch vụ doanh nghiệp, họ dạy các doanh nghiệp cách áp dụng nhiều mô hình lớn khác nhau. Cách phát triển ứng dụng cũng dần hình thành theo WorkFlow.

"Tôi đang làm một video. Đầu tiên, tôi đề xuất ý tưởng cho một kịch bản với Claud và nhờ anh ấy giúp tôi viết một câu chuyện. Sau đó, tôi sao chép và dán nó vào ChatGPT và sử dụng các khả năng logic của nó để chia nhỏ nó thành một kịch bản. Tôi kết nối plugin Jianying để chuyển đổi văn bản thành video để tạo trực tiếp một video. Nếu một số hình ảnh ở giữa không chính xác, tôi sử dụng Midjourney để tạo lại chúng và cuối cùng hoàn thành một video. Nếu một ứng dụng có thể gọi các khả năng này cùng một lúc, thì đó là một ứng dụng thực sự gốc." Một doanh nhân đã nói với chúng tôi.

Tất nhiên, vẫn còn nhiều vấn đề cần giải quyết để thực sự triển khai được một hệ sinh thái đa mô hình, đa ứng dụng, chẳng hạn như làm sao để nhiều mô hình có thể giao tiếp với nhau? Làm thế nào để tối đa hóa các cuộc gọi mô hình thông qua thuật toán? Làm thế nào để hợp tác để tìm ra giải pháp tốt nhất vừa là thách thức vừa là cơ hội.

Dựa trên kinh nghiệm trước đây, xu hướng phát triển của các ứng dụng AI có thể là sẽ xuất hiện theo dạng phân tán và theo từng điểm, sau đó dần dần được thống nhất và tích hợp.

Ví dụ, nếu chúng ta cần đặt câu hỏi, tạo hình ảnh và tạo PPT, đây có thể là nhiều ứng dụng riêng biệt ở giai đoạn này, nhưng chúng có thể được tích hợp thành một sản phẩm tổng thể trong tương lai. Tiến gần hơn tới nền tảng hóa. Ví dụ, nhiều ngành công nghiệp như gọi taxi, giao đồ ăn và đặt vé hiện đang dần tập trung vào một siêu ỨNG DỤNG. Những nhu cầu khác nhau cũng sẽ đặt ra những thách thức đa dạng hơn đối với khả năng của mô hình.

Ngoài ra, AI gốc sẽ phá vỡ mô hình kinh doanh hiện tại. Tiền nóng trong chuỗi công nghiệp sẽ được phân phối lại. Baidu sẽ trở thành kệ tri thức, còn Alibaba sẽ trở thành kệ hàng hóa. Mọi mô hình kinh doanh sẽ quay trở lại phần thiết yếu nhất để đáp ứng nhu cầu thực tế của người tiêu dùng và các quy trình dư thừa sẽ được thay thế.

Trên cơ sở đó, việc tạo ra giá trị là một khía cạnh, còn việc xây dựng lại mô hình kinh doanh đã trở thành vấn đề quan trọng hơn mà các nhà đầu tư và doanh nhân cần suy nghĩ.

Hiện tại, chúng ta vẫn đang ở ngưỡng cửa của sự bùng nổ các ứng dụng AI gốc. Lớp dưới cùng là mô hình lớn cơ bản, lớp giữa là nhà cung cấp dịch vụ mô hình lớn và lớp trên cùng là nhiều công ty khởi nghiệp khác nhau. Chỉ khi có sự phân công lao động rõ ràng và sự hợp tác lành mạnh ở mọi cấp độ thì các ứng dụng AI gốc mới có thể xuất hiện với số lượng lớn.

Tác giả: Luo Ji Tài khoản công khai WeChat: Self-quadrant

<<:  Hơn 40 triệu "thành viên trả phí", phân tích chuyên sâu về hệ thống hoạt động thành viên của Intime Department Store

>>:  Phim ngắn đang rất khốc liệt, các thương hiệu đang thâm nhập thị trường, ai đang kiếm được tiền trên thị trường trị giá hàng tỷ đô la?

Gợi ý

Phương pháp sửa chữa máy bơm nước điều hòa trung tâm (kỹ năng master key)

Nó đạt được hiệu quả điều hòa không khí bằng cách ...

618, các thương hiệu tiêu dùng mới đang hoạt động thế nào?

Vào đầu năm 2023, mọi chủ đề xoay quanh vấn đề ti...

8 xu hướng và giải pháp tiếp thị trong năm 2024

Chỉ còn chưa đầy nửa tháng nữa là chúng ta sẽ bướ...

Tại sao những điểm đau về mặt cảm xúc lại tạo ra cú sốc về mặt văn hóa?

Bài viết này phân tích sự thăng trầm của thị trườ...