Trước khi bắt đầu bài viết hôm nay, ban biên tập Zhiwei xin long trọng gửi lời tới Sora: Anh ơi, nếu anh không mở bài kiểm tra thì chiếc quạt này sẽ hỏng mất. Bởi vì hôm nay, Runway được mong đợi từ lâu cuối cùng đã chính thức ra mắt phiên bản Gen3. Độ dài của video được tạo ra ở phiên bản thế hệ mới này đã tăng từ 4 giây ban đầu lên 10 giây. Nếu bạn tình cờ lướt qua các bình luận, bạn sẽ thấy tất cả đều đang reo hò và phấn khích. Một số người xem thậm chí còn nói gay gắt: Đây là AI video tốt nhất hiện nay. Đánh giá từ ví dụ được đưa ra trong dòng tweet chính thức này từ Runway, hiệu ứng của phiên bản Gen3 thực sự rất bắt mắt. Với nhiều cách sắp xếp camera khác nhau, kết cấu da có độ phân giải cao và chuyển động tự nhiên của nhân vật, ai có thể phân biệt được giữa ảo và thực? Nhìn thấy cảnh này, người ta không khỏi lo lắng cho Sora nhà bên vẫn chưa có dấu hiệu mở cửa. Bởi vì, trong lĩnh vực video văn hóa, mọi người đều đang cố gắng tung ra những sản phẩm tốt nhất của mình. Từ Pika, đến Luma, rồi đến Kuaishou Keling AI đã phổ biến ở nước ngoài một thời gian trước. Trước đây, người nước ngoài thậm chí còn phải gõ “Xin vui lòng” bằng tiếng Trung để tìm kiếm chứng chỉ kiểm tra Kuaishou Keling AI. Sự mở cửa hoàn toàn của Runway Gen3 lần này đã thu hút sự chú ý của mọi người khỏi Keling. Vì Sora vẫn chưa thể được thử nghiệm, nên lần này ban biên tập Zhiwei đã so sánh Kuaishou Keling AI, một mô hình video văn hóa được công nhận rộng rãi cả trong và ngoài nước, với Runway Gen3, để mọi người có thể thấy được hiệu quả của Runway Gen3. Trước khi thử nghiệm, chúng tôi xin giải thích rằng vì Keling AI đến từ Kuaishou nên nó đặc biệt giỏi trong các cảnh liên quan đến ăn uống. Ngược lại, Runway3 tập trung vào việc thúc đẩy tính hiện thực, trí tưởng tượng và tính thẩm mỹ của ống kính. Bạn có thể xem phim với đặc điểm của cả hai gia đình. Đầu tiên, chúng tôi bắt đầu với Runway Gen3, một chuyên môn mới của người chơi và đưa vào đó một câu chủ chốt có thể mang lại cảm giác điện ảnh: Một người đàn ông cô đơn đang uống đồ uống trong quán bar. (Gợi ý: Cảnh quay tĩnh, cố định, Ánh đèn neon chói gắt, Một bóng người đơn độc ngồi trong quán bar, Nhấp một ngụm đồ uống, nhìn chằm chằm vào khoảng không, Một quán bar đông đúc, ánh sáng mờ nhạt, Cô đơn, u sầu) Trước khi kết quả được công bố, Runway đã giành chiến thắng với một biên độ nhỏ về thời gian tạo ảnh. Bởi vì phải mất vài phút để tạo ra 5 giây nội dung. Nhưng Runway có thể tạo ra một video dài gấp đôi trong vòng chưa đầy một phút. Hơn nữa, mặc dù mất ít thời gian, nhưng làm việc nhanh thực sự có thể tạo ra kết quả tốt hơn. Sau khi máy quay phóng to, người đàn ông quay sang một bên và mở mắt. Một loạt các cảnh quay được sắp xếp khéo léo khiến cho bộ phim này chắc chắn có giá trị sản xuất lên tới hàng triệu đô la. Nếu không phải vì cảnh quay cận cảnh có phần không tự nhiên của cái miệng đang mở, chắc chắn nhiều người sẽ lầm tưởng đây là một đoạn clip trong phim Hollywood. Đường băng Gen3↓ Tuy nhiên, với tư cách là một nhân vật đã chinh phục được người nước ngoài, hiệu quả tạo ra AI của Ke Ling không hề kém cạnh chút nào. Hơn nữa, biểu cảm của nhân vật chính khi nhìn xuống tách trà hoàn toàn phù hợp với bối cảnh của "Loneliness". Keling AI ↓ Vì không có người chiến thắng nên chúng ta hãy chơi lại một vòng nữa. Lần này câu quan trọng là: cảm giác kịch tính của những người lính cứu hỏa đang dập tắt đám cháy. (Gợi ý: Cảnh quay bóng người, Ngọn lửa dữ dội của một tòa nhà đang cháy, Một lính cứu hỏa đang chiến đấu với ngọn lửa, Phun nước, cứu người, Một tòa nhà đang cháy trong đêm, Kịch tính, anh hùng) Đến thời điểm này, lợi thế của Runway Gen3 đặc biệt rõ ràng. Việc xử lý ống kính của hình bóng nhân vật và màu cam làm cho toàn bộ bức ảnh trở nên trang trọng và nồng nàn. Đường băng Gen3 ↓ Mặc dù nội dung được tạo ra vẫn không có vấn đề gì nhưng chuyển động của nhân vật cũng rất chân thực. Tuy nhiên, việc xử lý hình ảnh lại hơi hời hợt, giống như một người dân nhiệt tình vô tình đi ngang qua hiện trường vụ cháy đã dùng điện thoại di động ghi lại cảnh này. Phim rất thực, nhưng tính thẩm mỹ của các cảnh quay chắc chắn không tốt bằng Runway. Keling AI ↓ Vì Ke Ling hơi yếu thế ở vòng đầu tiên, bây giờ chúng ta hãy đổi chỗ và đến với sân nhà của Ke Ling: phát sóng ăn uống. Tuy nhiên, khi đo tại đây đã xảy ra một sự cố nhỏ. Ban biên tập Zhiwei nhận thấy Runway đã trở nên mạnh mẽ hơn, nhưng việc kiểm duyệt cũng trở nên nghiêm ngặt hơn. Ban đầu tôi muốn thử xem một bộ phim kinh điển cũ và mời anh Will Smith đến để anh ấy lại húp mì cho chúng tôi nghe. Thật không may, tôi đã được thông báo rằng [Nội dung này đã được đánh dấu]. Không chỉ người nổi tiếng mà ngay cả phim hoạt hình của Pixar cũng bị liệt vào danh sách cấm. Không còn cách nào khác, chúng ta chỉ có thể đổi chủ đề thành "Một người đàn ông đang ăn mì". (Gợi ý: Ánh sáng ấm áp, hấp dẫn, Người có biểu cảm tập trung, Dùng đũa hoặc nĩa để khéo léo húp mì, Không gian ăn uống bình dân, Thú vị, thỏa mãn) Khi đến sân nhà, Keling AI đã thi đấu ổn định và bất khả chiến bại. Hiệu ứng thậm chí còn thực tế hơn so với lần thử nghiệm đầu tiên của tôi. Tôi có thể cảm nhận được hơi nóng từ sợi mì lan tỏa trên mặt mình. Keling AI ↓ Khi đến Rumway, chúng tôi phát hiện ra những vấn đề cũ của AI, chẳng hạn như mì có thể dịch chuyển tức thời và miệng bị lệch. Nhưng thực tế thì kết quả đã được cải thiện rất nhiều. Ít nhất thì anh ấy cũng biết cách dùng đũa. Thật đáng tiếc khi anh gặp phải vua phát sóng ẩm thực Kha Linh. Đường băng Gen3 ↓ Sau khi thử nghiệm chương trình ăn uống, ban biên tập Trí Vĩ cũng thử nghiệm nhiều câu hỏi về chuyển động cơ thể khác. Thậm chí hãy để trẻ vẽ những thứ không tồn tại trong thực tế, chẳng hạn như: để một con cừu đi xe đạp. (Gợi ý: Cảnh quay góc nhìn vui tươi, theo chân đàn cừu khi chúng cưỡi ngựa, Ngày ấm áp, nắng đẹp, Một chú cừu trắng muốt đậu trên chiếc xe đạp cổ, Đạp xe hăng hái, len lỏi qua vùng nông thôn, Một con đường quê quanh co rợp bóng hoa dại, Kỳ quặc, vui tươi) Trên thực tế, hiệu quả ở cả hai bên đều rất tốt, cả hai con cừu đều đạp rất mạnh. Đường băng Gen3 ↓ Keling AI ↓ Tuy nhiên, ban biên tập Trí Vi càng kiểm tra thì càng phát hiện ra một điều. Nghĩa là: dù AI video có mạnh đến đâu thì cũng không thể vượt qua được engine vật lý thực sự. Ví dụ, tôi đã yêu cầu họ chơi bóng rổ cho tôi. (Gợi ý: Cảnh quay theo dõi động, theo dõi chuyển động của người đàn ông, Ánh sáng tương phản cao với đèn rọi vào quả bóng rổ, Chủ thể Một chàng trai trẻ mặc quần yếm đen sành điệu, Rê bóng rổ một cách khéo léo và chính xác, Sân bóng rổ ngoài trời với nghệ thuật graffiti sống động, Tràn đầy năng lượng) Đường băng cho thấy cảnh nảy bóng trên không và rê bóng rổ bằng chân. Thật khó để biết đó là bóng rổ hay bóng đá. (Chơi bóng rổ có thể là lý do cho sự hiểu biết về mặt ngữ nghĩa, vì từ "Dribbling" có thể được sử dụng cho cả bóng đá và bóng rổ, và AI có thể không phân biệt và hiểu được nó) Đường băng Gen3 ↓ Khi nói đến Keling AI, bối cảnh thậm chí còn kỳ lạ hơn. Quả bóng rổ bị ném ra tách thành hai phần, và người đó cũng mọc ra một bàn tay thứ ba. Keling AI ↓ Bóng rổ ít nhất có thể đảm bảo các chuyển động cơ bản là chính xác, nhưng khi nói đến va chạm, lộn nhào và các động tác tương tự, cả hai bên đều rất trừu tượng và nhất quán, giống như quả trứng mà không ai có thể làm vỡ. (Gợi ý: Quả trứng rơi khỏi bàn và vỡ trên mặt đất,Chuyển động chậm, cảnh quay cận cảnh, Ánh sáng tự nhiên từ cửa sổ, Hồi hộp, tăng dần sự mong đợi) Đường băng Gen3 ↓ Keling AI ↓ Mặc dù tất cả đều có khuyết điểm, nhưng trải nghiệm chung cho thấy Ruwnay3 về cơ bản tốt hơn KeLing AI phổ biến. Trong hầu hết các trường hợp, nó đáp ứng được tuyên truyền chính thức: nó chân thực, nhanh và đủ ổn định, cộng thêm độ dài vượt trội, đảm bảo rằng dù trí tưởng tượng của bạn có phong phú đến đâu, nó cũng sẽ mang lại cho bạn kết quả chất lượng cao. Nó thực sự khiến người xem cảm thấy ranh giới giữa thực tế và ảo đã trở nên mờ nhạt hơn một chút. (Gợi ý: Đi qua một khu rừng rậm rạp và tình cờ gặp một cánh cổng liên chiều cổ xưa, phát sáng, khoa học viễn tưởng, góc nhìn. Không khí đặc quánh bởi sự bí ẩn và âm thanh của động vật hoang dã kỳ lạ. Khi bạn đến gần, cánh cổng phát ra ánh sáng kỳ lạ, kéo bạn lại gần hơn với nguồn năng lượng siêu nhiên của nó.) Đường băng Gen3 ↓ Tuy nhiên, đừng vội cổ vũ cho Runway, vì trò chơi vẫn chưa kết thúc đâu. Ngoài những tác động trên, còn có một vấn đề không thể tránh khỏi khác trong lĩnh vực AI: thương mại hóa. Ban biên tập Trí Vĩ trước đó đã giới thiệu, theo tính toán của các nhà sản xuất trong nước, một video dài khoảng hai phút sẽ có giá ít nhất là 180 nhân dân tệ. . Mức tiêu thụ dung lượng lớn của hố không đáy khiến hầu hết quá trình tạo video bị kẹt ở mức khoảng 5 giây. Ngay cả hiệu ứng thế hệ của nhiều công ty vẫn còn rất trừu tượng, hoàn toàn thiếu đi bối cảnh phát triển thịnh vượng sau khi các mô hình ngôn ngữ lớn xuất hiện. Mặc dù Runway Gen3 đã phá vỡ rào cản 10s lần này nhưng chi phí tương ứng mà người tiêu dùng phải trả lại tăng lên. So với thế hệ trước, chúng ta chi tiêu gần gấp đôi số tiền. Nếu tính theo gói tháng, phí thành viên cơ bản là 15 đô la một tháng và người mua chỉ có thể nhận được 625 điểm. Cần 10 điểm để tạo ra một giây của Runway3. Vì vậy, một video dài 10 giây có giá 2,4 đô la, hoặc khoảng 17 nhân dân tệ. Bạn có thể tính toán được số tiền cần chi trả chỉ cho những trường hợp được nêu trong bài viết này. Không ai có thể ngăn chặn điều này vì đây là xu hướng chung và lợi nhuận là vấn đề mà tất cả các mô hình AI lớn đều phải đối mặt. Vì vậy, mặc dù Runway3 rất mạnh nhưng họ vẫn giành chiến thắng. Vẫn phải thừa nhận là KeLing hoàn toàn miễn phí hấp dẫn hơn. Còn về Sora, chúng ta đã có cảm giác thất vọng rồi. Cho đến khi không còn hữu ích nữa, anh ta chỉ là một bong bóng tưởng tượng đẹp đẽ, 0 điểm. |
<<: Đang hot trên toàn Internet, tại sao “thành phố hay không thành phố” lại phổ biến đến vậy?
>>: Tại sao tài khoản chính thức lại được thiết kế theo cách độc đáo này?
Hội nghị ra mắt dòng sản phẩm Honor 20 chính thức ...
TV Plasma đóng vai trò quan trọng trong cuộc sống ...
Máy nước nóng gas đã trở thành một trong những thi...
Văn hóa quan hệ tình dục đang trở nên thịnh hành ...
Tìm mục khởi động và thiết lập USB boot để thiết l...
Khi một thương hiệu được gắn quá nhiều nhãn hiệu,...
Hầu hết thời gian, sự tham gia của người dùng vào...
Bài viết này đi sâu vào ứng dụng và hạn chế của p...
Với chất lượng âm thanh tuyệt hảo và vẻ ngoài thời...
Xiaomi Mi 4 là điện thoại thông minh hàng đầu được...
Bài viết này chủ yếu thảo luận về hiện tượng và l...
Xiaohongshu gần đây đã tham gia vào chương trình ...
Công ty xây dựng và sản xuất website nào tại Tây A...
Ngày nay, tai nghe Bluetooth đã trở thành phụ kiện...
Bài viết này chia sẻ những thách thức và khó khăn...