Sora đang rất được ưa chuộng, người dùng Tik Tok có hoảng sợ không?

Sora đang rất được ưa chuộng, người dùng Tik Tok có hoảng sợ không?

Sau khi Sora được phát hành, nó đã giải quyết trực tiếp hai vấn đề lớn trong lĩnh vực video văn hóa: tính chính xác và tính nhất quán. Trong tương lai, sẽ có nhiều người tham gia các video ngắn hơn và tính cạnh tranh sẽ gay gắt hơn. Trong tình huống này, các nền tảng video ngắn như Douyin và Kuaishou phản ứng thế nào?

Sora phổ biến như thế nào?

Musk, LeCun, Jia Yangqing, Jim Fan, Xie Saining và những nhân vật lớn khác đều đang thảo luận về vấn đề này, thậm chí Chu Hồng Nghị còn nói rằng sự ra đời của Sora có nghĩa là việc hiện thực hóa AGI (trí tuệ nhân tạo tổng hợp) có thể được rút ngắn từ mười năm xuống còn một hoặc hai năm.

Nhiều "người bình thường" cũng đã ngửi thấy cơ hội kinh doanh trước, và việc kinh doanh kiếm tiền xung quanh Sora trở nên phổ biến đầu tiên. Theo báo cáo của giới truyền thông, một ảnh chụp màn hình được lan truyền trực tuyến cho thấy một tổ chức đã bán được hơn 20.000 bản khóa đào tạo Sora, dễ dàng kiếm được 2 triệu nhân dân tệ.

Hôm nay, đã gần một tuần kể từ khi OpenAI phát hành mô hình video Vincent Sora vào ngày 16 tháng 2, nhưng cuộc thảo luận vẫn còn rất sôi nổi, thực ra là vì nó quá xuất sắc.

Về mặt chức năng, nó có thể tạo ra nội dung video dài tới 60 giây, vượt xa giới hạn từ vài đến hơn mười giây của các công cụ video khác; Nó cũng có thể tự chỉnh sửa và mở rộng, chuyển tiếp hai nội dung không liên quan với nhau, và thay đổi phong cách và môi trường xung quanh nhân vật chính, v.v.

Về mặt triển vọng, Sora không chỉ là một công cụ tạo video mà còn được coi là một công cụ mô phỏng thế giới;

Đội ngũ sáng lập cũng là huyền thoại. Các thành viên chủ chốt bao gồm 12 người. Viện mới được thành lập chưa đầy một năm và được điều hành bởi hai nghiên cứu sinh tiến sĩ mới tốt nghiệp, một số người sinh vào những năm 2000.

Ngoài sự phấn khích, sức mạnh của Sora cũng khiến một số nhà sáng tạo nội dung nhận thức được cuộc khủng hoảng. Một cư dân mạng bình luận: "Những người bạn trong ngành công nghiệp video và trò chơi điện tử dài tập sẽ không vui cả năm đâu".

Nhiều người trong ngành chỉ ra rằng xét theo độ dài hiện tại của các video do Sora tạo ra, sự xuất hiện của nó sẽ tác động đầu tiên đến lĩnh vực video ngắn. Khi được quảng bá trên diện rộng, Sora sẽ hạ thấp đáng kể ngưỡng tạo video ngắn và làm phong phú thêm nguồn cung cấp nội dung cho các nền tảng video ngắn. Tuy nhiên, vấn đề phát sinh là sự gia tăng nội dung do AI tạo ra có thể ảnh hưởng đến hệ sinh thái nội dung của nền tảng. Đồng thời, Sora cũng sẽ cạnh tranh với các công cụ như Jianying và Kuaishou về người dùng, khiến khoản đầu tư lớn trước đây trở nên lãng phí.

Sora đã tạo nên một cú nổ lớn trong lĩnh vực video ngắn và đã đến lúc thử thách những người sáng tạo nội dung và người dùng TikTok và Kuaishou.

1. Sora giảm rào cản gia nhập và tăng tính cạnh tranh

Mặc dù đã có nhiều công cụ tạo video bằng văn bản trên thị trường như Pika và Runway, cho phép người dùng nhập văn bản và nhận được nội dung video dài từ vài giây đến hơn mười giây, nhưng hiện nay chúng vẫn chưa được sử dụng rộng rãi. Lý do chính là vì hiệu quả của chúng chỉ ở mức trung bình.

Dacheng, người đứng đầu một công ty MCN, nói với Dingjiao rằng ông đã sử dụng Runway. "Chúng tôi cũng đã mua vật liệu chất lượng cao từ bên ngoài, nhưng nội dung cuối cùng tạo ra lại không đủ tốt và không thể sử dụng được."

Sau khi nhìn thấy Sora, anh ấy rất phấn khích. “Độ dài có thể lên tới 60 giây và nội dung thì hợp lý. Cảm giác như nó ở một cấp độ khác so với các công cụ trước đây.”

"Sora tốt hơn các sản phẩm tương tự trước đây gấp 10 lần", Niu Xiaobo, một nghiên cứu sinh tiến sĩ về trí tuệ nhân tạo, người đã thực hiện nghiên cứu mô hình quy mô lớn liên quan, cho biết. "Hiệu ứng tạo video ổn định 60 giây hiện tại của Sora sẽ có tác động mang tính cách mạng đến ngành công nghiệp video ngắn."

Ani, người nghiên cứu AI, cũng bày tỏ quan điểm tương tự. "Ngưỡng cho người sáng tạo đã được hạ xuống. Ngay cả khi độ tin cậy của video không cao và có một số lỗi, bạn cũng khó có thể phát hiện nếu không xem xét kỹ. Trong tương lai, công nghệ sẽ được lặp lại nhanh chóng."

Theo nhiều chuyên gia, Sora giải quyết trực tiếp hai vấn đề chính trong lĩnh vực video trực tiếp: độ chính xác và tính nhất quán.

Nhà nghiên cứu AI Cyrus cảm thấy rằng so với các công cụ trước đây, "Sora giống như người Trisolaran chiến đấu với loài người nguyên thủy".

Cái gọi là độ chính xác có nghĩa là video được tạo ra có thể nhận dạng chính xác các yêu cầu về văn bản do người dùng nhập vào. Cái gọi là tính nhất quán có nghĩa là trong quá trình chuyển động, nội dung của nhân vật chính là mạch lạc và sẽ không bị biến dạng trong những thay đổi chuyển động đa góc nhìn, và những thay đổi của nó cũng có thể tuân theo các định luật vật lý. Biểu hiện rõ ràng nhất là sự tương tác giữa nhân vật chính và bối cảnh rất hợp lý.

Một năm trước, Niu Xiaobo và nhóm của ông vẫn đang thảo luận về vấn đề AI tạo sinh không thể hiểu được quy mô không gian, chẳng hạn như kích thước không chính xác của hình ảnh được tạo ra, nhưng họ cảm thấy rằng sự ra đời của Sora đã giải quyết được vấn đề này.

Một số người đã sử dụng video để khôi phục mô hình không gian vật lý và thấy rằng nó cũng phù hợp. Niu Xiaobo cảm thấy điều này chứng minh khả năng tính toán không gian của Sora về cơ bản là chính xác và phần lớn nhận thức về không gian của con người cũng dựa vào thị giác.

Theo góc nhìn này, các video do Sora tạo ra được hỗ trợ bởi logic của không gian vật lý.

Dựa trên ý kiến ​​của nhiều người được phỏng vấn và tuyên bố công khai của nhiều nhà lãnh đạo công nghệ, mặc dù vẫn còn nhiều sai sót, nhưng bước đột phá lớn của Sora trong lĩnh vực video và thậm chí là toàn bộ lĩnh vực trí tuệ nhân tạo là đây là một mô hình thông minh hơn, thậm chí có một số khả năng tư duy nhất định và các video mà nó tạo ra có thể hiểu được các quy luật khách quan của thế giới vật lý.

Điều này cũng khiến một nhóm người làm trong ngành nội dung video ngắn bắt đầu suy nghĩ liệu Sora có cướp mất việc làm của họ hay không.

Chúng tôi chỉ đơn giản chia các video ngắn hiện có thành hai loại. Một danh mục bao gồm những người thật, thường là "tài sản cốt lõi" của một tài khoản hoặc thậm chí là một công ty. Sora không có tác động lớn đến loại nội dung này. Thể loại còn lại là bộ sưu tập vật liệu, dùng để kiểm tra khả năng bắn súng và sáng tạo. Sự xuất hiện của Sora sẽ cải thiện đáng kể hiệu quả sản xuất các video như vậy.

Một số nhà sáng tạo muốn tăng sản lượng đang mong chờ sự xuất hiện của Sora.

Dacheng cho biết những công cụ như vậy có thể thay thế hoàn toàn lực lượng lao động giá rẻ của công ty. "Công ty chúng tôi nhỏ nên chúng tôi thuê nhiều sinh viên đại học để tiết kiệm chi phí. Nhưng họ vừa mới tốt nghiệp và không thể viết được một bản nào trong nửa ngày. Với AI, chúng tôi có thể viết hàng trăm bản chỉ trong vài phút."

Năm ngoái, anh và nhóm của mình đã bắt đầu sử dụng các công cụ AI trên quy mô lớn. "Mặc dù các công cụ này vẫn còn chưa hoàn thiện, nhưng chúng rất hữu ích cho việc xử lý bản thảo và cắt thô. Là một nhà sản xuất video, chúng tôi phải nâng cao hiệu quả", ông nói.

Đối với một số nhóm sáng tạo, họ tin rằng Sora sẽ không gây ra mối đe dọa nào cho họ trong ngắn hạn.

Dak, giám đốc một công ty MCN hàng đầu, nói với Dingjiao, "Sora vẫn chưa bắt đầu thử nghiệm công khai và công nghệ này vẫn còn lâu mới hoàn thiện. Hơn nữa, video của chúng tôi chủ yếu dựa vào sự sáng tạo và động não của mọi người, bao gồm cả việc quay phim, điều này cũng nhấn mạnh vào sự đổi mới. Chúng tôi nghĩ về cách thiết kế các cảnh quay và cách chuyển cảnh. Mặc dù Sora rất mạnh mẽ, nhưng nó không thể đáp ứng được nhu cầu thiết kế sáng tạo hiện tại của chúng tôi". Ông cũng tiết lộ rằng công ty hiện không sử dụng bất kỳ công cụ AI nào.

Tuy nhiên, vấn đề mà những người sáng tạo này phải đối mặt là sự xuất hiện của Sora đã hạ thấp ngưỡng sáng tạo video ngắn và ngày càng có nhiều người tham gia để cạnh tranh với họ về lượng truy cập và cơ hội kiếm tiền.

Một người làm truyền thông mới cho biết họ có khả năng tạo nội dung, nhưng lại thiếu đội ngũ quay và biên tập video phù hợp. Sự xuất hiện của các công cụ mới chính là cơ hội của họ.

Dựa trên ý kiến ​​của nhiều người trong ngành, xét về mặt loại hình, Sora hiện có tác động ít hơn đến các video ngắn có sự góp mặt của người thật, nhưng lại có tác động lớn hơn đến hoạt hình và nội dung bình luận. Nó thậm chí có thể loại bỏ nhiều công ty không có tính sáng tạo và chỉ tìm cách lợi dụng các chủ đề nóng. Về mặt chức vụ, một số người làm công việc máy móc, lặp đi lặp lại có thể bị loại bỏ, nhưng những người sáng tạo sẽ được thăng chức lên vị trí cao hơn.

Tóm lại, trong tương lai, sẽ có nhiều người tham gia sản xuất video ngắn hơn và sự cạnh tranh sẽ gay gắt hơn.

2. Liệu Douyin và Kuaishou có hoảng sợ không?

Sự xuất hiện của Sora sẽ mang lại nguồn cung dồi dào hơn cho các nền tảng video ngắn, nhưng cũng sẽ mang đến những thách thức mới cho Douyin và Kuaishou.

Các chuyên gia cho biết một mặt, quá nhiều video do AI tạo ra sẽ ảnh hưởng đến hệ sinh thái nội dung gốc của các nền tảng video ngắn. Mặt khác, sự nổi tiếng của Sora sẽ cướp đi một số người dùng các công cụ như Douyin, Jianying của Kuaishou và Kuaiying.

Dak nói với Dingjiao rằng nội dung do AI tạo ra cần được gắn nhãn đặc biệt khi tải lên các nền tảng video ngắn.

Vào tháng 5 năm ngoái, Douyin đã phát hành "Thông số kỹ thuật nền tảng Douyin và sáng kiến ​​của ngành về nội dung do AI tạo ra". Sáng kiến ​​này đề xuất rằng nội dung như vậy phải được đánh dấu rõ ràng và người dùng ảo cần phải được xác thực bằng tên thật. Đồng thời, cần áp dụng hình phạt nghiêm khắc đối với hành vi sử dụng công cụ AI để tạo và đăng tải nội dung xâm phạm quyền hình ảnh, gian lận, v.v.

Các nền tảng như Kuaishou và Xiaohongshu cũng có những hạn chế liên quan. Vào tháng 2 năm nay, Xiaohongshu chính thức công bố thông số kỹ thuật cho nội dung do AI tạo ra, yêu cầu người sáng tạo phải chủ động khai báo nội dung do AI tạo ra và không sử dụng nội dung do AI tạo ra để chế tạo trải nghiệm người dùng nhằm mục đích kiếm tiền thương mại.

Nhiều học viên cho biết họ có thể cảm nhận rõ ràng rằng nền tảng này đang kiểm soát nội dung đó và thậm chí hạn chế luồng nội dung đó.

"Nội dung do AI tạo ra có tính đồng nhất cao và không sáng tạo lắm. Khi người dùng thấy quá nhiều nội dung giống nhau, họ sẽ mất kiên nhẫn và thậm chí chuyển sang nền tảng khác", một nhà quan sát ngành Internet cho biết.

Ông cũng cảm thấy rằng "nếu nền tảng không hạn chế loại nội dung này, ngày càng nhiều nhà sáng tạo sẽ sử dụng AI để tiết kiệm công sức, điều này sẽ ảnh hưởng nghiêm trọng đến tỷ lệ các loại nội dung khác nhau trên nền tảng. Điều trực quan nhất là một số video độc đáo và khan hiếm sẽ giảm đi".

Và cũng có khả năng một số lượng lớn video giả sẽ được tạo ra. Sora có thể nhanh chóng tạo ra số lượng lớn video ngắn chân thực, giúp việc tạo nội dung trở nên dễ dàng. Một số người dùng thấy khó phân biệt được tính xác thực của nội dung đó. Một khi họ bị lừa, độ tin cậy của nền tảng sẽ bị ảnh hưởng nghiêm trọng. Năm ngoái, nhiều vụ gian lận sử dụng nội dung do AI tạo ra như thiết kế đồ họa và hoán đổi khuôn mặt bằng AI đã bị phát hiện.

Theo quan điểm của Cyrus, nếu nền tảng này hỗ trợ nội dung do AI tạo ra, thì cũng giống như "may váy cưới cho người khác" và kết quả sẽ ảnh hưởng đến khả năng giữ chân người dùng. "Hãy tưởng tượng nếu Xiaohongshu chứa đầy nội dung do mô hình lớn của ByteDance sản xuất, tại sao người dùng lại không truy cập trực tiếp vào Douyin? Và ngược lại."

Cyrus dự đoán rằng Tik Tok, Kuaishou, Xiaohongshu và Bilibili sẽ không đề xuất nhiều nội dung do AI tạo ra. Trừ khi đó là mô hình lớn của một video văn hóa do chính nền tảng đó tạo ra, nếu không, video đó sẽ được kiếm tiền riêng sau khi được chính nền tảng đó quảng bá trên diện rộng. "Ví dụ, khi được tối ưu hóa ở một mức độ nhất định, nó có thể áp dụng trực tiếp mô hình thanh toán của người dùng, nhưng hiện tại chưa có sản phẩm nào có khả năng này."

Nhiều người trong ngành đã suy đoán rằng khoảng cách giữa Sora và các công cụ tạo video AI khác sẽ ngày càng lớn hơn . Trước đó, chủ đề "Liệu Sora có giết Jianying không" đã gây nên nhiều cuộc tranh luận sôi nổi. Nếu Sora được sử dụng trên diện rộng, hầu hết các công cụ AI có thể bị thị trường từ bỏ và khoản đầu tư ban đầu lớn của các công ty khác sẽ bị lãng phí.

Tại sao khoảng cách ngày càng lớn?

Chu Hồng Nghị từng công khai chỉ ra rằng trình độ phát triển mô hình lớn của Trung Quốc rõ ràng đã gần đạt tới GPT-3.5, nhưng thực tế vẫn còn cách 4.0 một năm rưỡi. Niu Xiaobo giải thích từ góc độ kỹ thuật rằng Sora không phải là công nghệ điểm mà là một hệ thống kỹ thuật phức tạp. Mặc dù thế giới bên ngoài biết rằng công nghệ cốt lõi của nó là thuật toán chú ý của máy biến áp + thuật toán khuếch tán, v.v., nhưng đằng sau nó là sự hỗ trợ tài chính do OpenAI cung cấp và dữ liệu siêu mạnh được tích lũy.

OpenAI đã phát triển một video có thể hiểu nội dung của hình ảnh thông qua mô hình ngôn ngữ chung GPT tích lũy và mô hình tạo hình ảnh DALL-E3. Đến thời của Sora, nó đã cải thiện hơn nữa tính nhất quán và khả năng hiểu biết không gian vật lý. Mỗi bước tích lũy đều không thể thiếu.

Những dự đoán lớn hơn thậm chí còn khiến tương lai của TikTok trở nên khó đoán hơn. Một số người làm trong lĩnh vực điện ảnh và truyền hình tin rằng sau khi Sora được sử dụng rộng rãi, một nền tảng mới lớn hơn TikTok có thể sẽ xuất hiện.

Theo quan điểm của một số người, Sora đã hạ thấp ngưỡng người dùng, điều này chắc chắn sẽ dẫn đến sự gia tăng mạnh mẽ về số lượng người sáng tạo nội dung. Tuy nhiên, rất khó để nói liệu một nền tảng video ngắn như Tik Tok, với quy mô, khả năng tạo nội dung và quy tắc logic đẩy, có thể truyền tải được nội dung như vậy hay không. Rất có thể một nền tảng phù hợp hơn với Sora sẽ ra đời.

Ngưu Hiểu Ba cũng đồng ý với quan điểm này sau khi quan sát sự phát triển của ngành công nghiệp Internet. "Vào những ngày đầu, Internet được sử dụng bởi những người dùng chuyên nghiệp. Sau đó, sự phổ biến của PC đã mở rộng cơ sở người dùng. Sau đó, điện thoại thông minh xuất hiện, cho phép mọi người kết nối với Internet, do đó các nền tảng phục vụ nhu cầu của mọi loại người đã xuất hiện. Có lẽ khi số lượng người sử dụng Sora tăng lên, một hệ sinh thái mới sẽ xuất hiện."

3. Sora có sức ảnh hưởng rất lớn, nhưng anh ấy không cần phải được tôn sùng

Hiện tại, Sora chưa mở bản beta công khai và chỉ một số nghệ sĩ thị giác, nhà làm phim, nhân viên OpenAI và một số người khác mới được cấp quyền truy cập. Một phần của vấn đề là Sora không hoàn hảo. Tác động của nó đối với các video ngắn vẫn chưa được chứng minh đầy đủ.

Chuyên gia đào tạo AI Xiaogang chỉ ra rằng Sora có "vấn đề ảo giác" thường gặp ở các mô hình lớn và vẫn còn khiếm khuyết trong việc hiểu các định luật vật lý và tương tác giữa con người và đồ vật.

Ví dụ, trang web chính thức của OpenAI đã phát hành một số video lỗi, bao gồm một ngọn nến không thể thổi tắt, một quả bóng rổ phát nổ khi rơi xuống khi đang ném bóng và một chiếc ghế đào lên bay trực tiếp, v.v. Điều này là do sự hiểu biết của Sora chưa đủ trưởng thành và anh ta lầm tưởng rằng những thứ đào lên từ cát thường nhẹ hơn.

Khi nói đến ngành công nghiệp video ngắn, Xiaogang tin rằng một trong những thiếu sót quan trọng nhất của Sora là vẫn chưa thể sửa được các nhân vật.

Ví dụ, một người sáng tạo sử dụng Sora để tạo video dài 60 giây với A là nhân vật chính. Tuy nhiên, khi tạo video tiếp theo, nhân vật chính có thể được thay thế bằng B.

So với Pika và Runway, ai cũng thấy Sora có năng lực không gian mạnh mẽ, nhưng dù nội dung có ngắn đến đâu thì cũng vô nghĩa nếu các nhân vật không cố định được. Người dùng tiếp tục xem nội dung trên các nền tảng video ngắn, dù là nội dung thực tế hay hoạt hình, và cần có một nhân vật trung tâm để đảm bảo tính liên tục của câu chuyện.

Ngoài vấn đề về sức mạnh tính toán, nhiều người còn lo ngại về tốc độ phổ biến của Sora. Suy cho cùng, dù đột phá về công nghệ có lớn đến đâu, nếu chi phí quá cao thì công chúng vẫn khó có thể chấp nhận. Nhiều người trong ngành cho rằng đây chính là khó khăn lớn nhất mà Sora đang phải đối mặt hiện nay.

"Hiện tại, OpenAI chưa công bố công suất tính toán cụ thể, yêu cầu tiêu thụ năng lượng và số lượng tham số của Sora. Đánh giá sơ bộ là lượng dữ liệu, công suất tính toán và lượng năng lượng tiêu thụ lớn mà nó yêu cầu sẽ là chi phí rất lớn, điều này chắc chắn sẽ xung đột với việc quảng bá rộng rãi của nó trong giai đoạn tiếp theo." Ngưu Hiểu Ba tin tưởng.

Mỗi khi một công nghệ mới xuất hiện, nó lại gây ra một cuộc thảo luận lớn về việc thay thế công nghệ cũ bằng công nghệ mới.

Khi công nghệ quay phim ảo lần đầu tiên được giới thiệu, nó đã tiết kiệm chi phí quay phim cho ngành công nghiệp phim ảnh và truyền hình, nhưng các phương pháp quay phim truyền thống vẫn tồn tại cho đến ngày nay. Đã hơn một năm trôi qua kể từ khi OpenAI ra mắt ChatGPT và những người thực hành văn bản vẫn chưa có ai thay thế. Thay vào đó, nhiều người đã nhận thức được giá trị của những người sáng tạo nội dung chất lượng cao.

Tương tự như vậy, Sora đã tạo ra tác động đến các công cụ AI tương tự trên thị trường, nhưng dù mạnh mẽ đến đâu, nó cũng sẽ loại bỏ nhiều người làm video ngắn không có khả năng sáng tạo và chỉ muốn tăng khối lượng, hoặc những người không biết cách sử dụng các công cụ như vậy.

Liệu Sora có lật đổ toàn bộ ngành công nghiệp video ngắn hay không và liệu siêu nền tảng tiếp theo có ra đời hay không, mọi người vẫn đang chờ đợi và theo dõi. Điều này phụ thuộc vào việc liệu Sora có thể nhanh chóng giải quyết các vấn đề hiện tại hay không và liệu có đối thủ mới nào xuất hiện trong nước hay không.

* Hình ảnh trong bài viết này được lấy từ trang web chính thức của Sora. Theo yêu cầu của người được phỏng vấn, Dak là bút danh trong bài viết này.

Tác giả: Vương Lục; Biên tập: Wei Jia

Nguồn: Dingjiaoone (ID: dingjiaoone), có ảnh hưởng sâu sắc đến sự đổi mới.

<<:  Sự phát triển của các vở kịch ngắn mộc mạc: hấp dẫn mọi lứa tuổi và tinh tế và phổ biến

>>:  Sora đã ở đây rồi, nhưng đừng lo lắng!

Gợi ý

Đây là phân tích dữ liệu tốt nhất mà tôi từng thấy [Kế hoạch công việc hàng năm]

Làm thế nào để phân tích dữ liệu cụ thể? Làm thế ...

Cách sửa đèn nồi cơm điện (giải quyết vấn đề đèn nồi cơm điện không sáng)

Đèn nồi cơm điện không sáng là một trong những sự ...

Phải làm gì nếu BIOS không tìm thấy mục khởi động USB (BIOS cài đặt khởi động USB)

Tìm mục khởi động và thiết lập USB boot để thiết l...

Ba chìa khóa để vận hành IP - lấy "Tina Tony" làm ví dụ

Lấy "Tina Tony" làm ví dụ, chúng tôi ph...