Taylor Swift nói tiếng Trung Quốc, liệu điều này có mang lại thay đổi lớn trong lĩnh vực tiếp thị không?

Taylor Swift nói tiếng Trung Quốc, liệu điều này có mang lại thay đổi lớn trong lĩnh vực tiếp thị không?
Bài viết này mở đầu bằng video "Taylor Swift Speaks Mandarin" đang rất được ưa chuộng gần đây và giới thiệu về công nghệ nhân bản giọng nói, thay đổi khuôn mặt bằng AI, phần mềm kỹ thuật số hiện nay, những ưu điểm và vấn đề có thể xảy ra của chúng. Dành cho những ai quan tâm đến công nghệ AI kỹ thuật số của con người.

Gần đây, một video về "bản dịch không có giọng lồng tiếng" đã lan truyền trên Internet. Trong video, Taylor Swift (ca sĩ người Mỹ: Taylor Swift) đã nói tiếng Quan Thoại trôi chảy với người dẫn chương trình. Giọng nói của cô ấy không chỉ liền mạch mà ngay cả chuyển động môi của cô ấy cũng khớp với giọng nói của người dẫn chương trình. Người ta không thể không thở dài khi bản dịch đã đi đến bước này.

Bản dịch của tác giả video gốc "johnhuu dạy tiếng Anh" rất phổ biến, trong khi bản dịch giọng nói mô phỏng và thay đổi miệng bằng AI lại không phổ biến. Kết quả là, nhiều cư dân mạng để lại bình luận: "Tôi tự hỏi từ khi nào tiếng Quan Thoại của Taylor Swift lại trở nên chuẩn mực như vậy". Không chỉ vậy, Musk, Emma Watson và nhiều người khác cũng đang sử dụng công nghệ dịch thuật AI để dấn thân vào con đường “bản địa hóa”.

01 Người đàn ông khiến Taylor Swift nói tiếng Quan Thoại đến từ Trung Quốc

Trên thực tế, thoạt nhìn video này có vẻ kỳ diệu nhưng thực ra không có gì mới mẻ. Có thể chia thành ba khía cạnh: dịch + sao chép giọng nói + thay đổi miệng. Về mặt dịch thuật, hầu hết các phần mềm dịch thuật trên thị trường đều có thể chính xác, nhưng về mặt thẩm mỹ thì vẫn cần phải xử lý thủ công. Ngoài ra còn có khá nhiều công cụ để sao chép giọng nói và thay đổi miệng bằng AI. Ví dụ, phần mềm nhân bản giọng nói phổ biến hiện nay bao gồm Audio Clone, Voice Cloaker, Voice Changer và các ứng dụng thay đổi khuôn mặt bao gồm Faceapp, Openfaceswap, Face Changer Master, v.v.

Sau khi video lan truyền, một số cư dân mạng phát hiện ra rằng blogger này rất có thể đã sử dụng HeyGen, một phần mềm có thể kết hợp trực tiếp chức năng dịch thuật, sao chép giọng nói và thay đổi khẩu hình thành một.

Bạn sẽ không biết được tốc độ phát triển đáng kinh ngạc của HeyGen nếu không tìm hiểu sâu về nó. Theo số liệu thống kê từ nhà phân tích Will của Twitter, lượng truy cập vào trang web đã tăng 92% từ tháng 8 đến tháng 9 và hiện được xếp hạng đầu tiên trong số tất cả các trang web AI độc lập. Nhà phát triển đằng sau phần mềm phổ biến trên Internet này là một nhóm người Trung Quốc thực thụ - Shiyun Technology. “Thi Vân” được trích từ tiểu thuyết của Lưu Từ Hân. Khái niệm cốt lõi "công nghệ không thể thay thế nghệ thuật" trùng khớp với triết lý của người sáng lập Joshua Xu.

Vào tháng 12 năm 2020, Shiyun Technology được thành lập tại Thâm Quyến và chỉ trong vòng ba tháng, công ty đã nhận được khoản tài trợ hạt giống từ 2 đến 3 triệu đô la Mỹ từ Sequoia China và Zhen Fund. Đối với một công ty chỉ mới thành lập được ba tháng, điều họ thực sự cần làm vào thời điểm này là tìm ra sự phù hợp giữa sản phẩm và thị trường.

Trên thực tế, ngay từ khi Từ Trác còn làm việc tại Snapchat, một số công ty thương mại điện tử xuyên biên giới đã tìm đến anh để xin tư vấn về công nghệ "AI thay đổi khuôn mặt", đặc biệt là các thương hiệu quần áo. Các thương hiệu quần áo có SKU lớn và nhiều sản phẩm mới được ra mắt mỗi quý. Việc tìm kiếm những người mẫu có màu da khác nhau để chụp ảnh cho nhiều sản phẩm mới là một công việc tốn thời gian và tốn kém về mặt kinh tế. Được biết, giá của các mẫu xe châu Âu, châu Mỹ cao gấp 2-3 lần so với xe châu Á. Sau khi sử dụng công nghệ thay đổi khuôn mặt bằng AI, các thương nhân chỉ cần thuê người mẫu trong nước rồi thay thế để có được hình ảnh trưng bày người mẫu theo nhiều chủng tộc khác nhau, giúp giảm đáng kể chi phí, nâng cao hiệu quả và giải quyết hiệu quả những điểm khó khăn trong quá trình quốc tế hóa các thương hiệu quần áo.

Tôi nghĩ đây cũng là lý do tại sao HeyGen hiện chủ yếu nhắm vào nhóm B - khi bạn nhấp vào trang HeyGen, khẩu hiệu sẽ là "Cung cấp hỗ trợ cho thế hệ mới của các nhóm giỏi nhất thế giới, từ các công ty khởi nghiệp đến các công ty lớn". So với sản xuất video truyền thống, HeyGen không yêu cầu thiết bị, diễn viên hoặc nhóm bên thứ ba. Nó có thể tạo ra một video mà một đoàn làm phim phải mất nhiều ngày mới làm được chỉ trong vài phút. Điều này thực sự có thể giúp giảm đáng kể chi phí cho nhiều công ty có nhu cầu về video.

Ngoài ra, chúng ta cũng có thể thấy người sáng lập Joshua Xu (Xu Zhuo) quảng cáo trực tuyến rằng "Những gì bạn thấy ở đây là video của tôi được tạo ra 100% bằng AI". Biểu cảm, lời nói và hình ảnh của anh ấy đều rất tự nhiên, thậm chí bạn có thể nhìn thấy cả những chiếc lá bay bên ngoài cửa sổ.

Một số cư dân mạng đã thử dùng HeyGen cho biết đây là công cụ tạo video tốt nhất. Bạn chỉ cần tải lên một video dài hơn mười giây để có được video nói tiếng nước ngoài với giọng nói và hình dạng môi giống hệt bạn. Ngoài ra, bạn có thể chọn giọng nói phù hợp với hình ảnh nhân vật từ hơn 300 gói giọng nói, bao gồm hơn 40 ngôn ngữ. Hiện tại, gói thanh toán hàng tháng cơ bản nhất là 15 điểm (1 điểm tiêu tốn cho 1 phút), có giá là 29 đô la Mỹ (khoảng 200 nhân dân tệ). Bạn có thể tạo một video dài 15 phút bằng cách chi 200 Nhân dân tệ mỗi tháng và mỗi video không dài quá 5 phút. Điều này giúp tiết kiệm rất nhiều thời gian và công sức cho các doanh nghiệp vừa và nhỏ có nhu cầu phát sóng bằng tiếng nước ngoài.

Dựa trên nhu cầu này, Shiyun Technology đã mở ra thị trường thương mại điện tử xuyên biên giới. Tất nhiên, đây chỉ có thể là một ví dụ thu nhỏ về ứng dụng của AIGC trong ngành tiếp thị hoặc về cơ bản AIGC đang trở thành một mô hình mới trong ngành tiếp thị.

02 AI con người số, không gian đầu tiên để giảm chi phí và tăng hiệu quả

Do đó, bản chất của "Taylor Swift nói tiếng Quan Thoại" không gì khác hơn là công nghệ thay đổi khuôn mặt mới nhất cộng thêm một chút sáng tạo, nhưng thứ thực sự được áp dụng trong tiếp thị thương mại là một hệ thống hoàn thiện hơn, chẳng hạn như sao chép hoặc tạo ra một người kỹ thuật số. Nhiều người nổi tiếng ở Trung Quốc đã sử dụng hình đại diện kỹ thuật số trong các chương trình phát sóng trực tiếp và video. Từ loại IP đến loại chức năng, con người kỹ thuật số đang tiến tới một thị trường rộng lớn hơn.

Về mặt này, Lehua Entertainment đã tạo nên tiếng vang lớn nhất. Ngày 22 tháng 5, "Đỗ Hoa" diện làn da hồng cổ điển xuất hiện trong phòng phát sóng trực tiếp. Ngay khi cô mở miệng, người hâm mộ đã vô cùng sửng sốt. Làm sao tiếng Quan Thoại của cô ấy có thể tốt đến thế? Một lúc sau, một Đỗ Hoa trông giống hệt cũng xuất hiện trên màn hình, dùng tiếng Quan Thoại giới thiệu bản sao AI của cô là "Hoa Hoa Tử" bên cạnh. Người hâm mộ cho rằng điều này hoàn toàn đúng. Chỉ trong mười phút, số lượng người xem trong phòng phát sóng trực tiếp đã vượt quá 320.000. Do đó, Lehua đã ra mắt avatar AI của nghệ sĩ Chen Xinwei và người máy kỹ thuật số "Le Le" để giải thích và quảng bá thương hiệu chăm sóc da Dr. JE của cô Du Hua trong phòng phát sóng trực tiếp.

Năm ngoái, Liu Run cũng tiết lộ rằng các video ngắn về nội dung phát biểu của ông đã trở thành bản sao kỹ thuật số. Anh ấy chỉ cần để AI học từ những video trước đó để tạo ra một "bản thân". Sau đó, anh ấy có thể sử dụng âm thanh để điều khiển người kỹ thuật số này sản xuất video, cách này rất hiệu quả. Đối mặt với khối lượng lớn công việc lặp đi lặp lại đòi hỏi "sự hiện diện cá nhân", tất cả họ đều chọn mô phỏng "lực lượng lao động dựa trên silicon".

Chu Tử Tiêu, Marco và những người khác thậm chí còn sử dụng hình đại diện kỹ thuật số của mình để bán hàng trong phòng phát sóng trực tiếp. Hình ảnh AI của Calvin Chen ăn liên tục trong 15 giờ. Mặc dù có nhiều nghi ngờ và khán giả cho biết họ không tin, nhưng làn sóng này đã thu hút được rất nhiều lượt truy cập.

Như chúng tôi đã nói, bản chất của tiếp thị là tạo ra nội dung. Khi AIGC xuất hiện, những thay đổi trong ngành tiếp thị sẽ tự nhiên theo sau. Hiện nay, đã có hàng ngàn người dẫn chương trình kỹ thuật số "cơ bản" đang hoạt động trong phòng phát sóng trực tiếp. Mặc dù kém hấp dẫn hơn nhiều so với "phiên bản người nổi tiếng" trong việc thu hút lượng truy cập, nhưng đây vẫn là một hoạt động kinh doanh có lợi nhuận cho các thương gia.

Theo dữ liệu của iMedia Consulting, quy mô ngành thương mại điện tử phát trực tiếp của Trung Quốc dự kiến ​​sẽ đạt 2,1373 nghìn tỷ nhân dân tệ vào năm 2025 và khối lượng giao dịch tự phát trực tiếp của thương hiệu dự kiến ​​sẽ đạt 50,0% tổng khối lượng giao dịch thương mại điện tử phát trực tiếp trong năm nay.

Làm thế nào để tìm ra sự tăng trưởng trong việc tự phát sóng thương hiệu, không còn dựa vào những người dẫn chương trình hàng đầu để bán hàng, mũi tên hướng đến những người làm kỹ thuật số. Trong sự kiện 618 năm nay, người dẫn chương trình ảo Yan Xi của JD.com đã xuất hiện trong nhiều phòng phát sóng trực tiếp của nhiều thương hiệu. Số lượng đơn vị bán hàng phát sóng trực tiếp tăng gần năm lần so với Ngày hội mua sắm Double Eleven năm ngoái và khối lượng giao dịch thực tế tăng 246% so với tháng trước.

So với neo thực, neo ảo có những ưu điểm sau:

  • Chi phí thấp: Như đã đề cập trước đó, sự phổ biến của HeyGen đã giải quyết được vấn đề chi phí cao của việc sản xuất nội dung theo phương pháp truyền thống. Từ khâu xây dựng bối cảnh đến hậu kỳ, chi phí cho một phòng phát sóng trực tiếp dành cho người thật là 60.000 đến 100.000 nhân dân tệ một năm, trong khi chi phí cho một người dẫn chương trình ảo chỉ bằng một phần mười số đó. Với chi phí cực thấp, chỉ cần kéo dài thời gian thì sẽ có luồng giao dịch và doanh thu.
  • Mọi thời đại: Trong thời đại mà giao thông là vua, bất kỳ ai chiếm được nhiều sự chú ý và thời gian của người dùng hơn sẽ có thể nắm bắt được sự giàu có. Dù người dẫn chương trình thực sự có nổi tiếng đến đâu thì cũng không bao giờ có thể nổi tiếng bằng con người kỹ thuật số làm việc 24 giờ một ngày và luôn tràn đầy năng lượng. Hiện nay, nhiều doanh nghiệp lựa chọn để người dẫn chương trình thực tế phát sóng vào những thời điểm có lượng truy cập cao điểm và sử dụng người dẫn chương trình ảo để phát sóng vào những thời điểm có lượng truy cập thấp.
  • Tính ổn định: Các mỏ neo chất lượng cao luôn là đối tượng cạnh tranh giữa các thương hiệu lớn, đặc biệt là đối với các ngành có tính chuyên nghiệp cao. Người dẫn chương trình có hình ảnh tốt, tính cách tốt và kiến ​​thức chuyên môn vững chắc thường bị các đối thủ cạnh tranh săn đón. Các neo ảo được hỗ trợ bởi dữ liệu lớn và sức mạnh tính toán mạnh mẽ. Miễn là chúng được cấu hình với cơ sở kiến ​​thức và khả năng khái quát hóa AI, chúng có thể bắt đầu làm việc ngay và sẽ không bao giờ "nổi loạn".
  • Linh hoạt hơn: Khi tạo ra một người dẫn chương trình kỹ thuật số, giao diện, giọng nói và ngôn ngữ có thể được lựa chọn theo nhu cầu của người bán và thậm chí có thể thay đổi trong quá trình sử dụng. Theo dữ liệu của iMedia Consulting, quy mô thị trường thương mại điện tử phát trực tiếp xuyên biên giới của Trung Quốc dự kiến ​​sẽ đạt 284,58 tỷ nhân dân tệ vào năm 2023, với tốc độ tăng trưởng hàng năm là 155%. Quy mô thị trường sẽ đạt 828,7 tỷ nhân dân tệ vào năm 2025. Trước nhu cầu xuất khẩu mạnh mẽ, những người dẫn chương trình kỹ thuật số có thể thay đổi hình ảnh và ngôn ngữ đã trở nên rất được ưa chuộng.

AIGC không chỉ đơn giản là sử dụng người dẫn chương trình kỹ thuật số như một mánh lới quảng cáo, mà còn thâm nhập vào toàn bộ quá trình tương tác phát sóng trực tiếp - tiếp cận, thu hút, nhận diện và hướng dẫn mua sắm. Trong toàn bộ quá trình tiếp thị, con người kỹ thuật số không chỉ có thể cung cấp thông tin sản phẩm cho người dùng mà còn đóng vai trò là IP thương hiệu để hiển thị hình ảnh, qua đó thu hút một số lượng người dùng nhất định. Đây cũng là hướng mà các doanh nghiệp nên tập trung vào khi người dẫn chương trình kỹ thuật số trở nên phổ biến rộng rãi.

03 Nguy hiểm và cơ hội song hành, All In Digital People, bạn phải đối mặt...

Ngày nay, việc tập trung toàn lực vào tiếp thị AI đã trở thành sự đồng thuận của ngành và con người kỹ thuật số với các thuộc tính gia nhập AI tạo ra cũng đã trở thành một chiến trường. Nhưng nguy hiểm và cơ hội luôn tồn tại song song, và các ngành công nghiệp đang trong giai đoạn phát triển chắc chắn sẽ gặp phải vấn đề. Hiện nay, vẫn còn bốn vấn đề chính cần giải quyết đối với con người kỹ thuật số:

  • Vấn đề đổi mới: Hiện nay, việc sử dụng con người kỹ thuật số vẫn còn nhiều hạn chế. Hầu hết con người kỹ thuật số không thể thực hiện được quá trình từ con số không đến con số một. Nói cách khác, có thể giảm chi phí và cải thiện hiệu quả, nhưng hầu hết chúng chỉ được sử dụng như giải pháp bổ sung cho các giải pháp thực tế. Rõ ràng đây là một yêu cầu sai lầm khi yêu cầu con người kỹ thuật số đạt được những hiệu ứng mà những người dẫn chương trình ngoài đời thực cùng cấp độ không thể đạt được. Hơn nữa, các cảnh quay kỹ thuật số trong phòng phát sóng trực tiếp đều lấy từ thế giới thực và dựa vào trí tưởng tượng của con người. Vẫn còn một chặng đường dài trước khi chúng ta có thể xây dựng một thế giới ảo dựa trên con người kỹ thuật số.
  • Vấn đề về nền tảng: Là nền tảng phát trực tiếp lớn nhất, Douyin kiểm soát nội dung rất chặt chẽ. Vào ngày 17 tháng 5, nền tảng Douyin đã thay đổi chính sách thu giữ của mình thành "yêu cầu sự tham gia của người thật vào quá trình phát trực tiếp kỹ thuật số". Sima Huapeng, Tổng giám đốc điều hành của Silicon Base Intelligence, bình luận: “Đây là lý do tại sao tài xế không thể rời khỏi vô lăng khi xe tự lái đang hoạt động”. Thống kê cho thấy tỷ lệ khóa tạm thời (khóa 1-3 ngày, không khóa vĩnh viễn) của 100 tài khoản trên nền tảng Douyin là khoảng 30%. Chỉ có 15 trong số 30 tài khoản có thể được nền tảng này thúc đẩy và tạo ra khối lượng giao dịch hàng ngày.
  • Vấn đề về cảm xúc: Chính sách của nền tảng không hỗ trợ điều này và người dùng nền tảng không mấy mặn mà với nó. Bán hàng trực tiếp là hình thức thương mại điện tử theo sở thích và đầy tính ngẫu nhiên. Phần lớn hàng hóa không phải là hàng hóa thiết yếu, việc giao dịch các sản phẩm không theo tiêu chuẩn đòi hỏi phải kích thích nhu cầu tình cảm của người tiêu dùng. So với người thật, con người kỹ thuật số hiện nay thiếu khả năng mở rộng và sự đồng cảm để giao tiếp với mọi người. Do đó, những người làm trong lĩnh vực kỹ thuật số thấy rất khó khăn khi quảng bá các sản phẩm sáng tạo. Khi những người dẫn chương trình thực sự cung cấp dịch vụ chăm sóc kịp thời và chuyển đổi thành tỷ lệ mua hàng, những người làm công nghệ số vẫn giới thiệu các tính năng sản phẩm một cách khô khan. Những sản phẩm có tỷ lệ mua lại cao và thói quen mua hàng đã hình thành là chiến trường chính của những người dùng kỹ thuật số.
  • Vấn đề vi phạm: Vì con người kỹ thuật số được gọi là "con người", nên không chỉ liên quan đến vấn đề kỹ thuật mà vấn đề pháp lý cũng là điểm được công chúng và doanh nghiệp quan tâm nhất. Con người kỹ thuật số 2D ngoài đời thực tạo ra video bằng cách thu thập thông tin video gốc, điều này rõ ràng xâm phạm quyền chân dung của người thật và thậm chí có thể trở thành công cụ phạm tội. Hầu hết các hành vi xâm phạm con người ảo 3D đều liên quan đến vi phạm bản quyền. Vào tháng 4 năm nay, vụ án đầu tiên liên quan đến hành vi xâm phạm "con người kỹ thuật số ảo" đã được giải quyết tại Hàng Châu. Một video do một công ty Internet ở Hàng Châu phát hành đã sử dụng hình ảnh người kỹ thuật số ảo và nội dung liên quan do Công ty Mofa phát hành và cuối cùng bị phát hiện là vi phạm bản quyền.

Hiện nay, các nhà quảng cáo và nhà cung cấp dịch vụ đang thử nghiệm với con người kỹ thuật số. Đường đua AIGC đang trong giai đoạn rào chắn và tổ chức đua ngựa. Hướng đi của thị trường đã dần trở nên rõ ràng, nhưng liệu có thể hình thành được mô hình phát triển lành mạnh sau những nỗ lực lớn hay không còn phụ thuộc vào tư duy và nhận thức chuẩn mực của người chơi.

<<:  Không chỉ có sự hợp tác xuyên biên giới, những vụ việc thương hiệu gần đây cũng khiến giới trẻ phát cuồng!

>>:  Liệu tiếp thị dựa trên sự đau khổ có phải là ngõ cụt?

Gợi ý

Top 10 trò chơi máy tính phổ biến nhất (Trò chơi máy tính được chia sẻ)

Gần đây, nhiều game thủ đã nghĩ đến việc đổi máy t...

Cách xuất ảnh động GIF từ AE (Hướng dẫn xuất ảnh động GIF từ AE)

Những video ngắn, với phương pháp biên tập và cắt ...

Douyin đang nỗ lực trong cùng một thành phố, và Meituan nên lo lắng

Bài viết này thảo luận về mối quan hệ cạnh tranh ...

Sự trở lại của Tiêu Dương Ca lại thất bại lần nữa

Sau khi trải qua hàng loạt sự cố, cựu phát thanh ...

Cách mở khóa Huawei App Lock bằng lệnh buộc (giải pháp và các bước chi tiết)

Với sự phổ biến của điện thoại thông minh, mọi ngư...

Xiaohongshu ban hành quy định quản lý giao thông nghiêm ngặt nhất

Gần đây, Xiaohongshu đã ban hành các quy định quả...

Cách vệ sinh máy hút mùi mà không cần tháo rời (vệ sinh máy hút mùi nhanh chóng)

Sử dụng lâu dài cũng dễ gây ra hỏa hoạn, không chỉ...