Cuộc chiến chống lại AI theo sách giáo khoa của Google

Cuộc chiến chống lại AI theo sách giáo khoa của Google

Bài viết này chủ yếu mô tả một loạt các chiến lược phản công được Google áp dụng để đối mặt với sự cạnh tranh từ OpenAI.

Trước lãnh thổ thương mại rộng lớn của Google, việc chỉ phát hành GPT-4o trước một ngày dường như không mang lại đủ lợi thế cho OpenAI.

Tại hội nghị Google I/O năm 2024, Google đã trình diễn một loạt đột phá về công nghệ AI, bao gồm video do AI tạo ra, công cụ tự động hóa Workspace do AI điều khiển và trợ lý giọng nói có hiệu suất gần bằng GPT-4o. Việc ra mắt nhiều sản phẩm AI đã tạo ra "hiệu ứng bầy sói" theo một nghĩa nào đó, giúp Google đảo ngược tình trạng bị động bắt kịp.

Ngoài ra, khả năng đa phương thức của Gemini và những cải tiến về AI của Android 15 không chỉ cải thiện trải nghiệm của người dùng mà còn tăng đáng kể tính gắn kết của hệ sinh thái Google. So sánh mà nói, OpenAI có thể đi trước một bước về mặt công nghệ, nhưng phạm vi ứng dụng của nó lại tương đối đơn lẻ.

Ngày nay, đòn phản công theo kiểu "khổng lồ" của Google đang ngày càng trở nên sắc bén hơn, và đối với Sam Altman, người vẫn còn thận trọng về thời điểm phát hành GPT-5, thì áp lực đang ngày càng lớn hơn.

1. Chương 1 của giáo trình về phản công của người khổng lồ: Lợi thế khuếch đại

Bố cục chiến lược của các doanh nghiệp lớn thường dựa trên tiền đề liên tục củng cố các hoạt động kinh doanh có lợi thế của họ. Google bắt đầu với dịch vụ tìm kiếm và nổi trội với một loạt dịch vụ bộ ứng dụng văn phòng như Workspace, đã trở thành trọng tâm của hội nghị Google I/O năm 2024.

Khả năng tìm kiếm AI hoàn hảo là điều mà ngành công nghiệp đang háo hức mong đợi. Bản AI Overview do Google phát hành lần này đã nghiên cứu rất nhiều về các vấn đề đa phương thức.

Ví dụ: "Hỏi bằng video" sử dụng khả năng đa phương thức của Gemini kết hợp với Google Lens để thực hiện tìm kiếm bằng video. Chỉ cần quay video, bạn có thể biết được cách người dùng sử dụng máy hát đĩa hoặc thậm chí cách sửa máy ảnh. Google Photos cũng đã ra mắt chức năng AI mới "Hỏi ảnh", có thể tìm ra "nhiều năm học bơi của trẻ" trong số lượng lớn ảnh thông qua các câu hỏi đơn giản.

OpenAI cũng trình diễn một trợ lý AI đa phương thức có tên là Project Astra có thể quan sát và hiểu những gì được nhìn thấy qua camera của thiết bị, ghi nhớ vị trí để đồ của người dùng, giúp người dùng "tìm kiếm" các vật phẩm trong thế giới thực hoặc hoàn thành các tác vụ khác.

Kết quả đầu ra của tìm kiếm AI của Google không còn là danh sách các URL nữa mà là một trang tích hợp mới - giống như một báo cáo được tạo ra để trả lời các câu hỏi của người dùng, không chỉ bao gồm câu trả lời cho các câu hỏi mà còn bao gồm các phỏng đoán và bổ sung cho các câu hỏi mà người dùng có thể đã bỏ qua. Về hình thức sản phẩm, nó cũng giàu hình ảnh và văn bản.

Một công ty trong nước lớn cũng đã ra mắt chức năng tìm kiếm AI, nhưng nó chỉ nhúng kết quả đầu ra của AI tạo ra trên trang tìm kiếm truyền thống, sử dụng khoảng một phần năm không gian trên trang web và chỉ có thể kích hoạt cho các câu hỏi cụ thể. Mức độ hoàn thành chung là thấp, vì vậy nó không được phát hành hoặc quảng bá một cách rầm rộ.

Khi so sánh cả hai, sự đổi mới của Google trong tìm kiếm bằng AI là rõ ràng. Trong một thị trường công cụ tìm kiếm hạn chế, điều này đặt ra một tiêu chuẩn mới. Đối với quảng cáo tìm kiếm, mô hình đã được củng cố trong nhiều năm, vẫn còn nhiều chỗ cho trí tưởng tượng.

Google không tung ra một mô hình năng lực lớn mà đang cố gắng chiếm lại tâm trí người dùng. Hiện tại, tìm kiếm của Google là “Hỏi, Không phải Tìm kiếm”, một phương pháp tương tác đa phương thức chỉ cải thiện thêm khái niệm sản phẩm được xây dựng xung quanh “Hỏi” ở cấp độ người dùng.

Sự chuyển đổi của tìm kiếm chỉ là sự khởi đầu. Google hy vọng rằng tìm kiếm có thể trở thành một siêu cổng thông tin để kích thích nhu cầu AI của người dùng. Ngay cả khi người dùng không biết phải hỏi cụ thể điều gì, Google vẫn có thể đưa ra các đề xuất và giúp người dùng đưa ra ý tưởng. Lúc này, giao diện tìm kiếm sẽ thay đổi hơn nữa và trở thành luồng thông tin, mỗi thẻ có thể được thao tác thêm.

Ngoài tìm kiếm, một lĩnh vực khác mà Google có lợi thế là Workspace. Google vừa phát hành một sản phẩm dành cho Workspace có tính năng rất giống với "nhân viên kỹ thuật số" phổ biến ở Trung Quốc - AI Teammate.

Trước hết, Gemini 1.5 Pro sẽ sớm được nhúng vào thanh bên của tài liệu, bảng tính, trang trình bày, Drive và Gmail của Workspace, bao gồm mọi khía cạnh của hoạt động kinh doanh hàng ngày. Gemini có thể giúp người dùng tìm thông tin doanh nghiệp cụ thể thay vì thông tin chung chung; lấy các tập tin PDF có liên quan trực tiếp từ email; sắp xếp và quản lý biên lai trong email và lưu trữ chúng hoặc trích xuất thông tin từ biên lai và thêm chúng vào biểu mẫu.

Việc bổ sung Gemini vào ứng dụng Gmail cũng cung cấp các gợi ý trả lời chi tiết và theo ngữ cảnh hơn, đồng thời có thể cung cấp cho người dùng bản tóm tắt email.

Đồng thời, Google cũng tích hợp Gemini với lịch, tác vụ và Keep của hệ sinh thái Google, biến sản phẩm AI của mình thành trợ lý kỹ thuật số toàn diện. Google cũng thiết lập cơ chế kiểm tra trước khi Gemini thực hiện nhiệm vụ để đảm bảo tính chính xác của thông tin. Ưu điểm lớn nhất của Google Assistant so với các trợ lý thông minh khác là khả năng tích hợp liền mạch của Gemini với các sản phẩm gốc của Google.

Trong doanh nghiệp, các sản phẩm đầu tiên của nhân viên số sử dụng RPA (tự động hóa quy trình bằng robot) để tự động hóa các tác vụ lặp đi lặp lại, định lượng cao và dựa trên quy tắc. Sự bùng nổ của các mô hình ngôn ngữ lớn trong năm qua đã giúp nhiều công ty phần mềm văn phòng và sản phẩm cộng tác văn phòng nhìn thấy cơ hội. Họ đã tung ra các sản phẩm kỹ thuật số dành cho nhân viên được hỗ trợ bởi các mô hình lớn trong lĩnh vực hội nghị, email, cộng tác và quản lý tài liệu, bao gồm nhiều công ty lớn trong nước.

Sự tham gia của Google vào loại sản phẩm này chắc chắn đã làm tăng cường sự cạnh tranh trong ngành và cũng thiết lập một chuẩn mực "khổng lồ" cho các công ty tập trung vào lĩnh vực này. Với sự hỗ trợ của bộ công cụ đầy đủ của Google, AI của đồng đội không còn là công cụ rời rạc nữa. Chức năng của nó không chỉ đơn thuần là lên lịch, sắp xếp cuộc họp và ghi biên bản cuộc họp.

Với sự hợp tác của toàn bộ nhóm dữ liệu của Google, nhóm AI có thể thực sự hiểu được luồng kinh doanh, hiểu được bối cảnh kinh doanh và đưa ra kết luận. Nó thậm chí có thể giúp đánh giá các doanh nghiệp rủi ro và trả lời liệu dự án có thể hoàn thành đúng tiến độ hay không. Công việc này thậm chí còn gần giống với công việc "trợ lý chủ tịch".

Workspace do Gemini cung cấp sẽ có sẵn cho những người đăng ký trả phí với tư cách là "trợ lý đa năng" vào tháng 6 năm 2024.

AI Search và AI Workspace cùng nhau tạo nên diện mạo ban đầu của phiên bản AI Agents của Google: khả năng đa phương thức mạnh mẽ hơn, xử lý thông tin toàn diện và chuyên sâu trong nhiều tình huống, cùng sự hiểu biết thực sự về quy trình làm việc của doanh nghiệp. Ngược lại, mặc dù GPT-4o của OpenAI có lợi thế về công nghệ AI tạo sinh, nhưng nó vẫn chưa hình thành nên giải pháp toàn diện và hiệu quả trong các tình huống ứng dụng văn phòng.

2. Chương 2 của Sách giáo khoa phản công của Giants: Sử dụng các cú đấm kết hợp

Ngoài những lợi thế kinh doanh cốt lõi, Google còn nâng cấp toàn diện toàn bộ hệ sinh thái tại hội nghị Google I/O năm 2024.

Đầu tiên là không gian video trên YouTube. Google đã ra mắt Veo, đối thủ cạnh tranh của Sora, cũng có thể xuất video ổn định 1080p có độ dài khoảng 1 phút. Google cho biết họ đã cung cấp Veo cho một số nhà sáng tạo để sản xuất video trên YouTube và cũng đang tiếp thị nó tới Hollywood để sản xuất phim. Một số tính năng của Veo sẽ sớm có trong YouTube Shorts.

Google cũng ra mắt Gemini Live, một trợ lý giọng nói "có thể ngắt quãng" cạnh tranh với GPT-4o và cho phép trải nghiệm trò chuyện AI hai chiều mượt mà trên Android. Ngoài ra còn có chatbot nhân vật Gems, tương tự như GPT Store và Character.AI của OpenAI. Gems có thể tạo ra các chatbot ChatGPT tùy chỉnh để hoàn thành các nhiệm vụ nhất định và giữ lại các đặc điểm cụ thể, chẳng hạn như nói chuyện với Einstein hoặc Musk, hoặc thậm chí tự tạo một nhà tâm lý học "giả" cho mình.

Ngoài ra, Google, giống như OpenAI, tập trung vào các tình huống giáo dục.

Google đã ra mắt Circle to Search cho Android, có thể áp dụng vào các tình huống giáo dục gia đình. Cung cấp trải nghiệm giáo dục mang tính cá nhân hóa và tương tác thông qua mô hình đa phương thức. Sản phẩm này không chỉ có thể hiểu và trả lời các câu hỏi của học sinh mà còn điều chỉnh nội dung giảng dạy theo tiến độ học tập, nâng cao tính tương tác và hiệu quả của quá trình giáo dục.

Dịch bệnh đã làm nổi bật giá trị của giáo dục trực tuyến và các bậc phụ huynh bắt đầu chú ý nhiều hơn đến giáo dục gia đình. Phân tích của công ty nghiên cứu MarketsandMarkets chỉ ra rằng quy mô thị trường giáo dục kỹ thuật số toàn cầu dự kiến ​​sẽ tăng từ 19,4 tỷ đô la Mỹ vào năm 2023 lên 66,7 tỷ đô la Mỹ vào năm 2028, với tốc độ tăng trưởng kép hàng năm là 28,0%.

Các sản phẩm như Gems, Circle to Search và Gemini Live chắc chắn có thể cải thiện đáng kể trải nghiệm tương tác của giáo dục trực tuyến và cung cấp các kế hoạch giáo dục cá nhân hóa cho nhiều trẻ em khác nhau dựa trên AI, giải quyết vấn đề mà mô hình giáo dục truyền thống khó có thể đáp ứng được nhu cầu của tất cả học sinh.

Ngoài hệ sinh thái và kịch bản kinh doanh, Google cũng đã nâng cấp cơ sở hạ tầng AI của mình, chủ yếu nhắm vào các vấn đề về chi phí cho các doanh nghiệp ToB mô hình lớn.

Tại hội nghị Google I/O này, Google đã nâng cấp chip AI do mình tự phát triển lên TPU (Bộ xử lý Tensor) Trillium thế hệ thứ sáu. So với thế hệ thứ năm, hiệu suất tính toán của mỗi TPU đã tăng 4,7 lần. Google cũng thông báo rằng họ sẽ là một trong những nhà cung cấp dịch vụ đám mây đầu tiên cung cấp quyền truy cập vào bộ xử lý Blackwell thế hệ tiếp theo của Nvidia.

Tổng giám đốc điều hành Google Sundar Pichai cho biết: "Chúng tôi sẽ tiếp tục đầu tư vào cơ sở hạ tầng để thúc đẩy sự tiến bộ của trí tuệ nhân tạo".

So với mô hình hợp tác giữa OpenAI và Microsoft, Google đã cải thiện khả năng tương thích và khả năng tương tác của Google Cloud và các dịch vụ liên quan đến AI thông qua sự hợp tác chặt chẽ trong hệ sinh thái kinh doanh của riêng mình và cũng cung cấp cho các nhà phát triển các công cụ và hỗ trợ mạnh mẽ hơn, giúp lợi thế cạnh tranh tổng thể về công nghệ và thương mại của Google trở nên rõ ràng hơn.

Tại hội nghị Google I/O này, Google đã đề cập đến AI tổng cộng 124 lần. Từ hệ sinh thái kinh doanh đến các kịch bản ứng dụng và cơ sở hạ tầng, Google đã nâng cấp hầu hết các sản phẩm và khả năng của mình xung quanh AI.

So với OpenAI, mặt trận kinh doanh của Google dài hơn, đây vừa là bất lợi vừa là lợi thế. Với sự kết hợp các biện pháp này, tất cả các bản phát hành của OpenAI từ ngày hôm trước đều trở thành nội dung chương được Google phát hành. Điều này cho phép Google thoát khỏi mức độ so sánh hiệu suất sản phẩm đơn giản và coi thường đối thủ cạnh tranh trên thị trường AI tạo sinh vào đầu năm 2024.

3. Chương 3 của sách giáo khoa về cuộc phản công của những gã khổng lồ: Làm điều gì đó mà các công ty mới không đủ khả năng

Đối với Google, mọi khả năng của phần mềm cuối cùng sẽ được phản ánh trong phần cứng - tại sao không? Google có cả dòng sản phẩm và kinh nghiệm thị trường liên quan. So với dịch vụ phần mềm, bản chất nặng về tài sản của kinh doanh phần cứng rõ ràng hơn và các công ty mới nổi khó có thể chi trả được, nhưng Google lại phát triển mạnh trong lĩnh vực này.

Tại hội nghị này, Google không chỉ khẳng định điện thoại Pixel sẽ có khả năng Gemini gốc, cải thiện đáng kể khả năng đa nhiệm của thiết bị mà còn công bố nhiều tính năng AI sẽ có trên Android 15.

Trên thực tế, Gemini đã được ra mắt trên Android như một ứng dụng độc lập. Lần này, trong cuộc trò chuyện Gemini, người dùng có thể trực tiếp kéo và thả hình ảnh được tạo vào các ứng dụng khác để sử dụng. Trong Android 15, Gemini hỗ trợ chức năng nhận dạng nội dung video YouTube. Gemini có thể trực tiếp trích xuất thông tin có liên quan trong giao diện phát lại video, trả lời nhiều câu hỏi khác nhau của người dùng về video và thậm chí tạo bản tóm tắt nội dung video.

Ngoài ra, người dùng có thể chạy nhiều ứng dụng cùng lúc mà không ảnh hưởng đến hiệu suất, điều mà các điện thoại di động trước đây khó có thể đạt được. Ngoài ra, Gemini AI còn cung cấp các đề xuất được cá nhân hóa dựa trên thói quen của người dùng, giúp việc sử dụng điện thoại di động trở nên gần gũi và thuận tiện hơn. Dịch vụ thông minh này giúp cải thiện sự hài lòng của người dùng và tăng cường khả năng cạnh tranh của Google trên thị trường điện thoại thông minh.

Việc triển khai chức năng trợ lý giọng nói thời gian thực trên hệ thống Pixel và Android cũng sẽ khiến hệ sinh thái trở nên khép kín hơn.

Phiên bản Nano nhẹ được đề cập khi Gemini được phát hành đã được xác nhận là sẽ được sử dụng để cải tiến Chrome. Về các mẫu máy nhẹ, Google đã ra mắt Gemini Flash mới. Hai mô hình Gemini này và mô hình Gemma nguồn mở sẽ tích lũy sức mạnh mô hình cho Google trong các thiết bị AI biên trong tương lai.

So với các cuộc thảo luận trước đây về hiệu suất và bảo mật chip, điện thoại AI của Google hấp dẫn và thiết thực hơn. Mặc dù trình độ phần cứng của điện thoại Pixel luôn tụt hậu so với ngành công nghiệp điện thoại di động, nhưng lợi thế cạnh tranh duy nhất của nó là hệ điều hành Android gốc. Giờ đây, với tư cách là thiết bị Android+AI gốc, Pixel có thể mở ra một mùa xuân mới.

Bản cập nhật Gemini của Android sẽ được triển khai tới "hàng trăm triệu thiết bị trong những tháng tới" và nhiều tính năng theo ngữ cảnh hơn nữa sẽ sớm được ra mắt.

Ưu thế về khả năng sinh thái của Android đã trở nên nổi bật lần đầu tiên và Gemini đã có những đóng góp to lớn vào đó. Đối với Apple, mọi thứ đều chưa được biết trước WWDC. Đối với Huawei Hongmeng mới ra đời, những thách thức thậm chí còn nghiêm trọng hơn.

Điều thú vị là AI không chỉ tìm thấy vô số kịch bản ứng dụng trong các sản phẩm phần cứng chính của Google mà Google còn trình diễn những ứng dụng mới nhất của Google Glass, như muốn nói với thế giới bên ngoài rằng: với sự hỗ trợ của AI, ngay cả những dự án từng bị coi là thất bại trong quá khứ giờ đây cũng có thể cung cấp nền tảng và nguồn cảm hứng cho những đổi mới mới.

Tiếp tục suy ra từ đây, với sự hỗ trợ của Gemini và khả năng phần cứng, ngay cả khi Google muốn thâm nhập vào thị trường PC AI đang nóng nhất thì cũng sẽ cực kỳ "êm đẹp".

IV. Phần kết luận

Bạn đánh giá thế nào về bản phát hành của Google? Trước tiên chúng ta hãy xem Google có thể đe dọa những công ty nào.

Đầu tiên là tìm kiếm bằng AI. Ngoài công ty tìm kiếm AI nổi tiếng PerplexityAI và công cụ tìm kiếm huyền thoại OpenAI, mối đe dọa trực tiếp nhất của Google tất nhiên là các công cụ tìm kiếm truyền thống. Google không chỉ đơn giản thêm bản tóm tắt AI vào kết quả tìm kiếm hoặc thực hiện tìm kiếm trong các cuộc hội thoại bằng ngôn ngữ tự nhiên. Có thể nói rằng tìm kiếm AI đa phương thức của Google đã thay đổi mô hình tìm kiếm, cải thiện trí thông minh tìm kiếm đồng thời cải thiện đáng kể trải nghiệm của người dùng.

Dựa trên bản nâng cấp của Google, cho dù là Bing, được hỗ trợ bởi GPT-4, hay Baidu, sử dụng Wenxin Yiyan để khám phá tìm kiếm AI, họ phải đẩy nhanh tốc độ đổi mới sức mạnh sản phẩm của AI+tìm kiếm để duy trì khả năng cạnh tranh trong lĩnh vực này.

Về phần mềm văn phòng và văn phòng cộng tác. Việc nâng cấp Workspace cho phép Google cung cấp những nhân viên kỹ thuật số "thực sự". Google không chỉ nhắm vào đối thủ lâu năm Microsoft mà còn thách thức tất cả các nhà cung cấp phát triển nhân viên kỹ thuật số, phần mềm văn phòng AI và phần mềm văn phòng cộng tác AI. Các công ty được đại diện bởi DingTalk, Feishu và WPS có thể cần đánh giá lại thế mạnh sản phẩm của mình về mặt xử lý tài liệu, văn phòng, cộng tác, v.v.

Trong ngành công nghiệp điện thoại di động, nhà sản xuất bị ảnh hưởng nhiều nhất bởi AI phải là Apple. Là gã khổng lồ duy nhất tụt hậu trong kỷ nguyên của các mô hình AI lớn, nếu Apple không giới thiệu thêm nhiều cải tiến trong hệ sinh thái iOS, hãng sẽ khó có thể đối phó với cuộc tấn công AI từ phe Android. Đối với các nhà sản xuất điện thoại di động khác, dù họ có quảng bá khái niệm điện thoại di động AI đến đâu thì dưới ảnh hưởng của Android+Gemini, không gian cho các bản nâng cấp AI dựa trên hệ thống sẽ ngày càng thu hẹp. Để duy trì khả năng cạnh tranh, họ chỉ có thể tiết kiệm một số tiền cho phần cứng, chi phí sản xuất và chuỗi cung ứng.

Đối với toàn bộ ngành công nghiệp AI, OpenAI là đơn vị đầu tiên phải gánh chịu hậu quả. Trong năm qua, OpenAI đã duy trì lợi thế dẫn đầu trong ngành AI bằng cách tận dụng lợi thế về dữ liệu lớn, sức mạnh tính toán khổng lồ, thuật toán mạnh và kỹ thuật vững chắc. Tuy nhiên, với sự phổ biến của công nghệ và sự phát triển của các ngành công nghệ khác, cái gọi là lợi thế công nghệ của OpenAI đang trở nên kém hỗ trợ hơn. Công nghệ hàng đầu của OpenAI đang chuyển từ việc bắt chước trong quá khứ sang việc phát hành đồng thời.

Cuộc cạnh tranh về công nghệ giữa các công ty AI đang âm thầm chuyển sang cạnh tranh thương mại và cạnh tranh sản phẩm. Bằng cách tích hợp hệ sinh thái sản phẩm rộng lớn của mình, Google đã đưa công nghệ AI vào nhiều lĩnh vực thực tế hơn như điện thoại di động, phần mềm văn phòng, nhà thông minh và giáo dục trực tuyến. Từng bước, chúng tôi đã xây dựng được một hệ sinh thái kinh doanh lớn mạnh và vị thế dẫn đầu thị trường vững chắc.

Sự cạnh tranh trong tương lai có thể được phản ánh rõ hơn ở tính đa dạng của các kịch bản ứng dụng và cuộc đấu tranh giành quyền thống trị thị trường. Trước khi GPT-5 hoặc các mô hình AI mạnh mẽ hơn ra đời, những bất lợi của các công ty AI như OpenAI trong các tình huống ứng dụng sẽ tiếp tục bị Google khuếch đại.

Ngày nay, Google đang chứng minh theo cách thức mẫu mực về cách chống trả trước sự cạnh tranh khốc liệt của thị trường thông qua phương pháp tiếp cận hai hướng là công nghệ và chiến lược kinh doanh. Đây không chỉ là một cuộc chơi công nghệ mà còn là cuộc cạnh tranh về mô hình kinh doanh và xây dựng hệ sinh thái.

<<:  Xem video dài qua những bộ phim ăn khách: Sự “tái sinh” của ngành công nghiệp, ai đã tận dụng được tâm trạng của thời đại?

>>:  Alibaba tuổi trung niên, giá trị nằm ở sự chăm chỉ

Gợi ý

10 quy tắc tiếp thị World Cup

Giải vô địch bóng đá thế giới bốn năm một lần khô...

Cách đối phó với thanh thiếu niên nổi loạn và cách giao tiếp (thanh thiếu niên nổi loạn)

Nó không chỉ ảnh hưởng đến sức khỏe thể chất và ti...

Tiêu dùng mới (đừng) sợ Chung Học Cao

Bài viết này phân tích sâu sắc bước ngoặt quan tr...

Phương pháp tính LTV và ứng dụng

Vòng đời người dùng là một khái niệm quan trọng m...