Video truyền miệng, các nhà sản xuất Trung Quốc tham gia cuộc chiến

Video truyền miệng, các nhà sản xuất Trung Quốc tham gia cuộc chiến

Trong sáu tháng qua, các video do AI tạo ra đã được quảng bá rầm rộ và video truyền miệng cũng đã trở thành một hướng đi chính mà các nhà sản xuất Trung Quốc liên tục tham gia.

Video có thể được tường thuật không? Điều này đang xảy ra ngay bây giờ.

Sau khi phát hành mô hình video người quy mô lớn Sora của OpenAI, các công ty trong nước đã nhanh chóng tham gia thị trường và các mô hình video người quy mô lớn trong nước đã bước vào giai đoạn tăng tốc.

Trong sáu tháng qua, các video được tạo bằng AI đã có những tiến bộ đáng kể.

Vidu, tự nhận là mô hình video lớn đầu tiên do Trung Quốc tự phát triển, và các mô hình thế hệ video tiếp theo do ByteDance, Tencent và nhiều nhà sản xuất trong nước khác tung ra đã thu hút sự chú ý từ thế giới bên ngoài theo thời gian.

Gần đây, một mẫu máy quay video cỡ lớn trong nước khác đã tham gia cuộc chiến và trang web chính thức của mẫu máy quay video cỡ lớn "Keling" của Kuaishou đã chính thức ra mắt.

Vào ngày 21, Kuaishou Keling đã phát hành bản cập nhật lớn: chức năng chuyển đổi hình ảnh thành video chính thức được mở, hỗ trợ chuyển đổi hình ảnh tĩnh thành video 5 giây. Người dùng có thể kiểm soát chuyển động của các đối tượng trong hình ảnh thông qua văn bản nhắc nhở; Đồng thời, chức năng tiếp tục video cũng được ra mắt, hỗ trợ tiếp tục bằng một cú nhấp chuột và nhiều lần tiếp tục liên tiếp các video đã tạo, có thể tạo ra video dài tới khoảng 3 phút.

So với các mẫu video lớn do nhiều công ty phát hành trước đây, chủ yếu dùng để hiển thị video, mẫu video lớn Keling ra mắt lần này không chỉ có hiệu ứng tương tự như Sora mà còn được mở để mời trải nghiệm thử nghiệm trên ứng dụng Kuaiying của Kuaishou.

Theo Kuaishou, mô hình lớn Keling được phát triển bởi nhóm AI Kuaishou. Nó sử dụng lộ trình kỹ thuật tương tự như Sora và kết hợp một số cải tiến công nghệ tự phát triển. Độ phân giải video mà nó tạo ra đạt tới 1080p, độ dài tối đa có thể đạt tới 2 phút (tốc độ khung hình 30fps) và hỗ trợ tỷ lệ khung hình tự do.

Ngoài ra, vị quan chức này còn tuyên bố rằng mô hình lớn Keling có thể tạo ra những chuyển động hợp lý trên quy mô lớn và khiến chúng tuân theo các định luật chuyển động khách quan.

Trong ví dụ video chính thức, một phi hành gia đang chạy trên mặt trăng. Khi máy quay từ từ di chuyển lên cao, dáng đi và bóng của phi hành gia được giữ ở mức hợp lý và phù hợp.

Gần như cùng lúc đó, Meitu cũng thông báo sẽ ra mắt sản phẩm mới MOKI vào cuối tháng 7. Sản phẩm này dựa trên khả năng tạo video của mô hình lớn Meitu và có thể giúp người dùng tạo phim ngắn AI.

Tuy nhiên, cũng có quan điểm cho rằng so với mô hình ngôn ngữ lớn đang xuất hiện hàng loạt, mô hình video lớn chậm phát triển hơn và thiếu sự hiện diện của những gã khổng lồ.

Tại sao lại như vậy?

Các công ty lớn không quan tâm sao?

Đồng thời, ở vòng cuối cùng của cuộc thi mô hình ngôn ngữ lớn, Kuaishou và Meitu có sự hiện diện thấp.

Và trong lĩnh vực mô hình video lớn, lợi thế lớn nhất của hai công ty này là gì?

Liên quan đến vấn đề này, phóng viên tờ Beijing Business Daily Wei Wei và Shu Le đã có cuộc thảo luận. Tôi nghĩ:

Các công ty lớn vẫn đang chuẩn bị cho "kỳ thi tuyển sinh đại học" sẽ không trực tiếp tấn công vào cấp độ "sau tiến sĩ".

Làm video không chỉ đơn thuần là ghép một loạt hình ảnh vào một trang PPT. Các công ty lớn không vội vàng nỗ lực trong lĩnh vực này và điều này không thực tế lắm. Đây chỉ là một màn biểu diễn cơ bắp thôi.

Xét cho cùng, việc tạo ra video không chỉ đơn thuần là việc ghép một loạt các bản vẽ AI lại với nhau thành một bộ phim hoạt hình.

Ngoài việc xem xét thêm các chi tiết như tính nhất quán của hình ảnh, tuân thủ mô tả, phân chia sáng tối, hiệu suất của bảng phân cảnh, v.v., còn có khả năng hiểu và tái tạo cốt truyện.

Tất cả những điều này đều đòi hỏi phải học chuyên sâu ở nhiều lĩnh vực như cấu trúc video, phân tích nội dung, kỹ thuật quay và phương pháp tường thuật.

Độ khó của nó không giống như trò chuyện, vẽ tranh hay chuyên chơi cờ vua, những điều có thể đạt được bằng cách thu thập dữ liệu và sửa lỗi của người dùng.

Ngay cả những bậc thầy trong lĩnh vực phim ảnh và truyền hình cũng thường mắc lỗi. Có thể hình dung được việc thực hiện một bộ phim bằng trí tuệ nhân tạo, vốn vẫn đang trong "giai đoạn thi tuyển sinh đại học" sẽ khó khăn đến mức nào.

Nhưng Kuaishou và Meitu cần phải khoe cơ bắp của mình, ngay cả khi đó chỉ là một màn trình diễn.

Dù là Kuaishou hay Meitu, lợi thế lớn nhất của họ trong lĩnh vực mô hình video lớn là họ có "tài liệu học tập" phong phú để học sâu về trí tuệ nhân tạo.

Dựa vào những "tài liệu học tập" này, chúng ta có thể tránh được một số vấn đề về bản quyền. Ngoài ra, qua nhiều năm tích lũy nội dung, phân đoạn theo chiều dọc và gắn nhãn trong lĩnh vực video, mô hình lớn có thể "thu thập" kiến ​​thức tốt hơn và cũng có một mức độ chuyên nghiệp nhất định về video trong thiết kế thuật toán.

Nhưng chỉ có thế thôi. Về mặt kỹ thuật, chúng ta vẫn chưa có được sự tích lũy ban đầu của các thuật toán trí tuệ nhân tạo.

Ngoài ra, ngay cả khi mô hình video lớn đã trưởng thành thì cũng khó có thể tạo ra bước đột phá lớn trong ngành công nghiệp điện ảnh và truyền hình.

Cho dù đó là một bộ phim ngắn, một quảng cáo, một video dài hay một bộ phim điện ảnh, tất cả đều sẽ có "hiệu ứng đặc biệt bom tấn".

Nhưng điều cuối cùng thu hút khán giả chính là nội dung (từ kịch bản đến chuyển động của máy quay và kỹ năng diễn xuất của diễn viên).

Đây chính là chìa khóa để kiếm tiền thương mại quy mô lớn.

Tôi tin rằng các người mẫu video lớn có thể dễ dàng tìm thấy cơ hội kinh doanh trong lĩnh vực hoạt hình.

<<:  Mâu thuẫn chính hiện tại của Manner là sự không phù hợp giữa định vị boutique và tuyến đường tiết kiệm chi phí.

>>:  Giá của một video là gần 350.000 nhân dân tệ. Công ty kịch ngắn không cạnh tranh bằng đầu tư mà bằng số lượng.

Gợi ý

Bốn mô hình suy luận nhân quả thực sự hiệu quả!

Trong số nhiều thách thức trong phân tích dữ liệu...

Phân tích chuyên sâu về công nghệ màn hình IPS

Màn hình đã trở thành một phần không thể thiếu tro...

Cách chọn tên hay cho bé (thông minh)

Đặt cho con một cái tên đẹp là trách nhiệm và mong...

Bộ phận marketing có thể nâng cao giá trị của mình như thế nào?

Bộ phận tiếp thị của công ty có thể tạo ra giá tr...

Làm thế nào để quảng bá sản phẩm trên Douyin?

Khi nói đến tiếp thị cơ sở, chúng ta có thể thích...