OpenAI, Google và Apple tiếp tục cuộc chiến giành quyền thống trị AI. Ai sẽ là vua của kỷ nguyên "Her"?

OpenAI, Google và Apple tiếp tục cuộc chiến giành quyền thống trị AI. Ai sẽ là vua của kỷ nguyên "Her"?

OpenAI, Google và Apple đều sẽ đặt cược vào trợ lý AI và phát hành một loạt các bản cập nhật quan trọng. Tác giả đã chia sẻ những thông tin mới nhất về các sản phẩm AI liên quan, chúng ta hãy cùng xem qua.

Bắt đầu từ tuần tới, những gã khổng lồ công nghệ ở Thung lũng Silicon sẽ phát động một vòng chiến AI mới. OpenAI, Google và Apple đều sẽ đặt cược vào trợ lý AI và phát hành một loạt các bản cập nhật quan trọng. Bạn đã sẵn sàng chưa?

Một vòng chiến tranh AI mới sắp bắt đầu!

Thứ Hai tuần tới, OpenAI sẽ phát sóng trực tiếp để chính thức công bố bản nâng cấp GPT-4, thậm chí còn có cả một siêu "trợ lý AI" đang chờ chúng ta.

"Trưởng bộ phận nghiên cứu AGI âm thanh" của OpenAI, Alexis Conneau đã thay đổi hình nền trang chủ của mình và đồng bộ với Ultraman - chúng ta sẽ chứng kiến ​​Magic vào tuần tới.

Nhà khoa học nghiên cứu của OpenAI, Bowen Cheng thậm chí còn nói rằng điều này tuyệt vời hơn nhiều so với GPT-5.

Tất cả những điều này ám chỉ rằng "Cô ấy" thực sự sắp xuất hiện.

Dưới áp lực từ OpenAI, Google sẽ công bố tiến trình phát triển mô hình mới tại hội nghị I/O vào ngày hôm sau. Có tin đồn rằng hãng này cũng sẽ phát hành một trợ lý kỹ thuật số cá nhân có tên "Pixie" chạy bằng Gemini.

Ngay sau đó, Microsoft sẽ tổ chức hội nghị dành cho nhà phát triển Build vào ngày 21 và rất có thể sẽ tích hợp các khả năng mới nhất của OpenAI vào dòng sản phẩm của riêng mình, thậm chí có thể tiết lộ mô hình lớn MAI-1 với 500 tỷ tham số mới nhất do chính mình phát triển.

Ngoài ra còn có hội nghị Apple WWDC rất được mong đợi, nơi sẽ phát hành hệ thống iOS 18 tích hợp khả năng AI tạo sinh và đưa ChatGPT vào iPhone.

Hàng loạt các bộ phim bom tấn liên tiếp ra mắt khiến các công ty khác không có cơ hội để thở.

Một cư dân mạng đã hỏi: "Liệu Apple có từ bỏ hệ thống trí tuệ nhân tạo 'AJAX' của riêng mình và sử dụng hoàn toàn OpenAI không? Hay OpenAI chỉ là biện pháp tạm thời cho đến khi khả năng AI của họ bắt kịp?"

Người trong cuộc của Apple, Gurman đã tóm tắt chiến lược AI của Apple:

– LLM về phía thiết bị (tự phát triển)

– LLM đám mây (tự phát triển)

- Chatbot (có thể là OpenAI, có thể là Google)

Apple không có kế hoạch tự phát triển chatbot, nhưng họ nhận thấy thị trường có nhu cầu về chatbot nên sẽ mua công nghệ từ bên ngoài. Chiến lược này tương tự như những gì được thực hiện trong tìm kiếm.

Rõ ràng, tình hình hiện tại là OpenAI đang hợp tác với Microsoft và thậm chí cả Apple thông qua AI, khiến Google không thể làm gì.

Tôi tự hỏi ai sẽ thắng hay thua trong cuộc chiến giành quyền thống trị của AI?

1. ChatGPT có thể thực hiện cuộc gọi và thông tin chi tiết hơn sẽ được tiết lộ trong buổi phát sóng trực tiếp vào thứ Hai

Trọng tâm của toàn bộ mạng lưới vẫn tập trung vào OpenAI.

Chủ đề "họ sẽ phát hành những gì" ngày càng trở nên phổ biến hơn và ít người thảo luận về hội nghị Google I/O.

Liên quan đến dự đoán phát hành vào thứ Hai, cư dân mạng Ananay đã có một khám phá mới:

ChatGPT có thể có khả năng thực hiện cuộc gọi.

Trên thực tế, chúng ta có thể thấy chức năng này từ đoạn mã sau, bao gồm các từ khóa như call và reject.

Ngoài ra, OpenAI đã triển khai các máy chủ webRTC mới được cấu hình gần đây để thực hiện chức năng này.

Lúc đầu, cư dân mạng nghĩ rằng OpenAI triển khai máy chủ WebRTC cho chế độ chỉ có giọng nói, nhưng hiện tại có vẻ như không phải vậy.

Bởi vì chức năng này được cung cấp bởi Livekit. (Đây là giải pháp có thể cung cấp truyền thông âm thanh và video thời gian thực)

Cư dân mạng bên dưới bình luận, như vậy có nghĩa là ChatGPT có thể chủ động gọi điện cho tôi mà không cần tôi phải là người chủ động gọi điện trước không?

Ông nêu ra câu hỏi này vì trong bộ phim Her, trợ lý trí tuệ nhân tạo Samantha đã chủ động gọi điện cho nhân vật nam chính để nói với anh điều gì đó.

Hãy tưởng tượng xem sẽ tuyệt vời thế nào nếu trợ lý ChatGPT chủ động gọi điện để nhắc nhở hoặc kiểm tra thói quen sử dụng của bạn.

Tuy nhiên, Ananay cho biết điều này yêu cầu người dùng phải lựa chọn cho phép tính năng này.

Indigo, người đồng sáng lập Hallid.ai, cũng đã đưa ra dự đoán/xu hướng toàn diện.

Theo Indigo, phiên bản mới của GPT-4 sẽ được chia thành nhiều phiên bản theo các thang tham số khác nhau.

Hôm qua, một số cư dân mạng suy đoán rằng có thể sẽ có phiên bản gpt4-lite, gpt4-auto và gpt4-lite-auto được phát hành.

gpt2-chatbot xuất hiện trên diễn đàn LMSYS vài ngày trước có thể là phiên bản mới nhẹ hơn của GPT-4. Hơn nữa, điều này có nghĩa là nhiệm vụ của GPT-3.5 sắp kết thúc, phiên bản nhẹ mới nhất có thể được sử dụng miễn phí và giá API sẽ giảm đáng kể.

Còn về "phép thuật" mà Ultraman nhắc đến, có thể là GPT-4 nâng cấp - gpt4-auto, có khả năng tự động thực hiện nhiệm vụ của tác nhân, trí nhớ và khả năng lập kế hoạch mạnh hơn.

Tất nhiên, "Trợ lý AI" cũng đưa cô ấy vào thực tế.

Nguồn: chàm

Hôm qua, nhà khoa học nghiên cứu về thế hệ video của OpenAI, Will Depue đã đăng một logo về sự ra đời của điểm kỳ dị, có lẽ ám chỉ điều gì đó.

2. Google có thể ra mắt trợ lý AI Pixie

Vào thời điểm quan trọng này trong cuộc cạnh tranh với OpenAI và Microsoft, Google đã tuyên bố rõ ràng rằng mọi nội dung được phát hành tại hội nghị này đều là về AI.

Theo trang web chính thức của Google, hội nghị I/O năm nay sẽ được tổ chức lúc 1 giờ chiều. Giờ miền Đông ngày 14 tháng 5.

Người ta suy đoán rằng Google sẽ tích hợp AI tạo sinh vào công cụ tìm kiếm của mình để cho phép người dùng thực hiện tìm kiếm theo hội thoại.

Google cũng đang thử nghiệm các tính năng tìm kiếm mới, chẳng hạn như thực hành hội thoại AI dành cho người học tiếng Anh và khả năng tạo hình ảnh thử đồ ảo khi mua sắm.

Không chỉ công cụ tìm kiếm, nhiều ứng dụng của Google cũng sẽ tích hợp chức năng AI sâu hơn, chẳng hạn như giúp người dùng tìm nhà hàng, trung tâm mua sắm và trạm sạc xe điện phù hợp trên Google Maps.

Tôi phải làm gì nếu cuộc gọi đến bộ phận chăm sóc khách hàng mất quá nhiều thời gian để chuyển tiếp?

Tính năng AI mới đang được Google thử nghiệm thậm chí có thể giúp bạn tự động chờ cuộc gọi được chuyển tiếp cho đến khi có người trả lời cuộc gọi và sau đó thông báo cho bạn.

Ngoài các ứng dụng khác nhau, hệ điều hành cũng không thể bị bỏ lại phía sau.

Bản xem trước dành cho nhà phát triển của Android 15 đã được phát hành vào tháng trước và Google sẽ giới thiệu thêm các tính năng mới tại hội nghị I/O, có thể sẽ tích hợp sâu hơn vào Gemini.

Hiện tại trong hệ thống Android, chức năng AI tạo sinh chủ yếu được điều khiển bởi Gemini Nano và được sử dụng trong nhiều chức năng phần mềm khác nhau.

Ví dụ, Magice Compose có thể cung cấp các gợi ý trả lời trong các ứng dụng như Google Messages, còn Cinematic Wallpaper sử dụng máy học để giúp người dùng tùy chỉnh hình nền màn hình.

Bạn có thể tưởng tượng được trải nghiệm người dùng được cá nhân hóa hơn như thế nào khi Android có sự tham gia sâu hơn của AI không? Ví dụ, màn hình chính, màn hình khóa và thanh thông báo thông minh hơn trên điện thoại của bạn?

Tại hội nghị I/O năm ngoái, chúng ta đã thấy Gemini, một mô hình ngôn ngữ lớn cạnh tranh với ChatGPT. Năm nay có mẫu mới nào không?

Ngoài phiên bản mới của Gemini, bạn cũng có thể mong đợi các mô hình hình ảnh và video cỡ lớn được Google ra mắt.

Một cư dân mạng trên Reddit tiết lộ rằng Google đang có ba mẫu sản phẩm đang được thử nghiệm nhưng chưa được tung ra thị trường. Dự kiến ​​chúng sẽ ra mắt tại hội nghị I/O năm 2024.

Ba mô hình này là mô hình tạo hình ảnh Imagen 3 và hai mô hình Juno và Miro có thể tối ưu hóa và hoàn thiện hình ảnh.

Người ta nói rằng Miro cũng sẽ có chức năng tạo video.

Ngoài ra, Google có thể sẽ phát hành phiên bản mới của trợ lý AI "Pixie" tại I/O năm nay, có thể thay thế sản phẩm tương tự hiện có là Google Assistant.

Pixie được điều khiển bởi mô hình ngôn ngữ Gemini và được cài đặt trên thiết bị phần cứng Pixel của Google. Chúng tôi không biết liệu nó có mở cho các thiết bị của bên thứ ba khác hay không.

Nhưng có lẽ chúng ta sẽ không thấy phiên bản cập nhật của sản phẩm Pixel tại hội nghị I/O này. Google vừa mới phát hành phiên bản mới, Pixel 8a và hiện người dùng đã có thể đặt hàng trước.

Diện mạo phiên bản mới của Pixel 9 bị rò rỉ trực tuyến

Dự kiến ​​Pixel 9 và Pixel 9 Pro Fold có thể gập lại sẽ được ra mắt vào mùa thu năm nay.

3. Quả táo bám vào ống hút

Cùng lúc đó, trước tác động mạnh mẽ của OpenAI và trợ lý giọng nói AI của Google, cư dân mạng đã hét lên với Apple:

Thời gian của Apple đang cạn dần!

Mặc dù có báo cáo rằng OpenAI và Apple sắp hoàn tất thỏa thuận hợp tác để cho phép cài đặt ChatGPT trên iPhone và cung cấp khả năng AI tạo sinh mới cho hệ thống iOS năm nay.

Nhưng Apple vẫn chưa sẵn sàng từ bỏ Siri của riêng mình.

Gần đây, tờ New York Times đưa tin Apple sẽ nâng cấp và tổ chức lại Siri để cạnh tranh với các đối thủ chatbot khác.

Quyết định này đã được đưa ra.

Vào đầu năm 2023, các giám đốc điều hành của Apple là Craig Federighi và John Giannandrea đã cảm thấy khủng hoảng sâu sắc sau khi dành nhiều tuần thử nghiệm chatbot mới ChatGPT của OpenAI, vốn từng là chatbot phổ biến nhất.

Họ tin rằng sự xuất hiện của trí tuệ nhân tạo sẽ khiến Siri trở nên lỗi thời và lạc hậu.

Siri, trợ lý ảo đầu tiên của Apple đi kèm với mọi chiếc iPhone khi ra mắt vào năm 2011, từ lâu đã bị giới hạn trong việc thực hiện các yêu cầu riêng lẻ và không thể theo kịp các cuộc trò chuyện do người dùng khởi tạo.

Ví dụ, khi ai đó đầu tiên hỏi về thời tiết ở San Francisco rồi sau đó hỏi "New York thế nào?" Siri thường hiểu sai câu hỏi của người dùng.

Nhưng ChatGPT biết rằng người dùng muốn có câu trả lời cho câu hỏi sau.

Sau khi nhận ra rằng công nghệ mới đã vượt qua Siri, gã khổng lồ công nghệ đã tiến hành đợt tái cấu trúc quan trọng nhất trong hơn một thập kỷ.

Apple quyết tâm bắt kịp cuộc đua AI của ngành công nghệ và đã biến AI tạo ra thành một dự án chủ lực nội bộ đặc biệt, tổ chức nhân viên của mình xung quanh sáng kiến ​​diễn ra một thập kỷ một lần này.

1. Siri siêu tiến hóa

Theo ba người trong cuộc của Apple, Apple sẽ phát hành phiên bản Siri cải tiến tại hội nghị dành cho nhà phát triển thường niên vào ngày 10 tháng 6 năm nay.

Công nghệ cơ bản trong phiên bản mới bao gồm trí tuệ nhân tạo mới cho phép Siri trò chuyện với người dùng thay vì trả lời từng câu hỏi một.

Và làm cho Siri trở nên trò chuyện hơn và linh hoạt hơn.

Bản cập nhật Siri là một phần trong nỗ lực tiên phong của Apple trong việc áp dụng hoàn toàn AI tạo ra.

Để hỗ trợ các tính năng Siri mới, Apple cũng đã bổ sung thêm bộ nhớ cho các mẫu iPhone năm nay.

Apple cũng đã thảo luận về khả năng hợp tác với một số công ty, bao gồm Google, Cohere và OpenAI, để tiếp cận các mô hình AI hỗ trợ chatbot.

Mặt khác, các giám đốc điều hành của Apple cũng lo ngại rằng các công nghệ AI mới nổi sẽ thay thế iOS trở thành hệ điều hành chính trong tương lai, đe dọa sự thống trị của Apple trên thị trường điện thoại thông minh toàn cầu.

Hơn nữa, công nghệ mới này cũng có thể tạo điều kiện cho một hệ sinh thái tập trung vào các ứng dụng AI (tác nhân AI).

Điều đó có thể ảnh hưởng đến App Store của Apple, nơi tạo ra doanh thu khoảng 24 tỷ đô la mỗi năm.

Nhưng điều khiến Apple lo lắng hơn là nếu không phát triển được hệ thống AI của riêng mình, iPhone có thể trở thành một "chiếc điện thoại ngu ngốc" khi so sánh với các công nghệ tiên tiến khác và mất thị trường.

iPhone hiện chiếm 85% lợi nhuận từ điện thoại thông minh toàn cầu và tạo ra doanh số hơn 200 tỷ đô la. Có thể thấy rằng sự mất mát này là không thể đo lường được và không thể chấp nhận được đối với Apple.

Cảm giác cấp bách đã thúc đẩy Apple hủy bỏ một khoản đầu tư lớn khác, dự án xe tự lái trị giá 10 tỷ đô la, và chuyển hướng hàng trăm kỹ sư sang làm việc về AI.

Ngoài ra, Apple sẽ tiếp tục duy trì tính nhất quán như thường lệ trong các công cụ xử lý thiết bị và khám phá việc tạo ra các máy chủ chạy bằng bộ xử lý iPhone và Mac.

Theo nguồn tin nội bộ, việc Apple nâng cấp Siri không phải để cạnh tranh với ChatGPT trong việc tạo nội dung như sáng tác thơ, mà là để Siri tập trung vào các nhiệm vụ ban đầu của mình:

Bao gồm cài đặt báo thức, tạo lời nhắc lịch, thêm mục vào danh sách mua sắm và tóm tắt tin nhắn văn bản.

Apple có kế hoạch quảng cáo Siri nâng cấp của mình là cá nhân hơn và tiết kiệm chi phí hơn so với các dịch vụ trí tuệ nhân tạo của đối thủ.

Vì Siri xử lý các yêu cầu trên iPhone nên tránh được tình trạng rò rỉ dữ liệu trên đám mây và chi phí điện toán đám mây.

Nhưng Apple cũng phải đối mặt với rủi ro với các hệ thống AI nhỏ được cài đặt trong iPhone:

Nghiên cứu cho thấy các hệ thống AI nhỏ hơn có thể dễ bị ảo giác hơn các hệ thống lớn hơn. Nhà đồng sáng lập Siri Tom Gruber cho biết:

“Mục tiêu của Siri luôn là tạo ra một giao diện đàm thoại có thể hiểu được ngôn ngữ và ngữ cảnh, nhưng đó là một vấn đề khó. Khi công nghệ thay đổi, chúng ta sẽ có thể làm tốt hơn. Chúng ta có thể tránh được nhiều khó khăn bằng cách không cố gắng giải quyết tất cả các vấn đề bằng cùng một cách tiếp cận.”

Apple có nhiều lợi thế trong lĩnh vực trí tuệ nhân tạo, bao gồm hơn 2 tỷ thiết bị đang được sử dụng trên toàn thế giới và một đội ngũ bán dẫn hàng đầu.

Chúng có thể hỗ trợ Apple quảng bá các sản phẩm AI và hỗ trợ các tác vụ AI đòi hỏi nhiều chip, bao gồm cả nhận dạng khuôn mặt.

2. Liệu Apple có thể xoay chuyển tình thế chỉ trong một tháng không?

Nhưng trong thập kỷ qua, Apple chưa bao giờ phát triển một chiến lược trí tuệ nhân tạo toàn diện và Siri cũng chưa nhận được bất kỳ nâng cấp hay cải tiến lớn nào kể từ khi ra mắt.

Đồng thời, những hạn chế của công ty với tư cách là trợ lý giọng nói cũng làm giảm sức hấp dẫn của HomePod, một loa thông minh, vì nó không thể hoàn thành các tác vụ đơn giản một cách đáng tin cậy, chẳng hạn như phản hồi yêu cầu phát bài hát.

John Burkey, người sáng lập Brighten.ai, một nền tảng AI tạo sinh, sau khi làm việc trong nhóm Siri trong hai năm, cho biết:

"Kể từ khi thành lập, nhóm Siri chưa nhận được sự quan tâm và nguồn lực như các nhóm khác trong Apple. Các phòng ban khác nhau trong Apple thường độc lập với nhau và việc chia sẻ thông tin bị hạn chế. Nhưng thực tế là AI cần được tích hợp vào các sản phẩm để thành công."

Ngoài ra, Apple còn gặp phải sự phản đối đáng kể trong việc tuyển dụng và giữ chân những nhân tài hàng đầu về trí tuệ nhân tạo.

Do tính bảo mật của Apple, có rất ít bài báo nghiên cứu được công bố và ít hội nghị được tham dự, đây là một bất lợi gần như không thể chịu đựng được đối với các nhà khoa học.

Trong những tháng gần đây, Apple đã điều chỉnh một chút chiến lược thông thường của mình để tăng số lượng bài báo về trí tuệ nhân tạo được xuất bản, nhưng các nhà nghiên cứu trong ngành vẫn nghi ngờ về chất lượng của các bài báo này, coi chúng là chiêu trò tiếp thị của Apple.

Nhưng đối với một số nhà nghiên cứu mới vào nghề và đầy tham vọng, việc gia nhập Apple và trở thành thành viên lãnh đạo của một dự án là một lý do quan trọng để họ lựa chọn Apple.

Mặc dù Apple đã điều chỉnh chiến lược phát triển và thu hút rất nhiều nhân lực mới.

Nhưng trong cuộc chiến lớn và khốc liệt này của các trợ lý giọng nói AI, chúng ta vẫn phải chờ xem liệu Apple có thể đảo ngược được bất lợi của mình tại hội nghị dành cho nhà phát triển vào tháng 6 hay không.

Trợ lý giọng nói AI trong tương lai sẽ trông như thế nào và nó sẽ ảnh hưởng đến cuộc sống của chúng ta ra sao?

Câu trả lời cho câu hỏi này đang ngày càng đến gần hơn.

Tài liệu tham khảo:

https://x.com/ai_for_success/status/1789364452640563709

https://www.theverge.com/2024/5/11/24154219/google-io-2024-what-to-expect-where-watch-livestream-ai-android-search-gemini

https://www.nytimes.com/2024/05/10/business/apple-siri-ai-chatgpt.html

Tài khoản công khai WeChat: Trí tuệ mới

<<:  Số phận của người lao động có nằm trong tay người phỏng vấn AI không?

>>:  Bùng nổ ngoại tuyến: Đầu tư 200 nhân dân tệ và kiếm được 400.000 nhân dân tệ

Gợi ý

Tại sao các cửa hàng bán đồ ăn nhẹ bình dân lại được ưa chuộng đến vậy?

Các cửa hàng bán đồ ăn nhẹ bình dân đã nhanh chón...

Cách kết nối với iTunes để cập nhật iPhone (Phương pháp sao lưu iPhone iTunes)

Hãy nhớ cập nhật iTunes nếu iPhone của bạn bị vô h...