Trung Bảo: Công nghệ giúp con người soi chiếu chính mình
Bài Tuan Anh
Khi “Voice Gems: 1000 Year Archive” được xướng tên tại EVSDA 2025, khoảnh khắc đó có ý nghĩa gì với Trung?
Với tôi, bên cạnh cảm giác vinh dự khi một dự án nghệ thuật thể nghiệm như Voice Gems được ghi nhận, điều quan trọng hơn là tôi nhìn thấy một tín hiệu rất tích cực: trong bối cảnh công nghệ phát triển mạnh mẽ, những câu chuyện hướng về con người vẫn có chỗ đứng trong thế giới sáng tạo. Voice Gems xuất phát từ mong muốn làm nổi bật bản sắc cá nhân và đưa sự chú tâm của con người trở lại với giọng nói của chính mình. Việc dự án được nhìn nhận trong khuôn khổ EVSDA khiến tôi tin rằng những sáng tạo Việt hoàn toàn có thể tham gia vào những cuộc đối thoại toàn cầu bằng chính chiều sâu của nó, đồng thời vẫn cập nhật công nghệ mới và góp phần định hình những chuẩn mực thiết kế mới trong ngành. Tôi tin rằng EVSDA tạo ra một không gian nơi các nhà sáng tạo địa phương được khuyến khích thực hành sáng tạo liên ngành, mang tiếng nói của mình ra thế giới với tâm thế tự tin và đầy trách nhiệm. Tôi hy vọng mối kết nối đẹp giữa các giá trị thiết kế Việt Nam và châu Âu sẽ tiếp tục được nuôi dưỡng trong tương lai.
Ý tưởng về Voice Gems bắt đầu như thế nào? Và viên Voice Gem đầu tiên ra đời ra sao?
Voice Gems bắt đầu từ một ý tưởng rất đơn giản: trên thế giới có hơn 8 tỷ giọng nói, và mỗi giọng nói đều là một bản thể độc nhất. Thế nhưng phần lớn thời gian, chúng ta lại không thật sự để ý đến nó. Giọng nói mang theo ký ức và bản sắc cá nhân, nhưng vì chỉ tồn tại dưới dạng âm thanh, nó thường trôi qua rất nhanh và dễ bị bỏ quên.
Viên Voice Gem đầu tiên ra đời từ mong muốn của một người bạn, khi anh ấy muốn cầu hôn bạn đời của mình bằng một tác phẩm điêu khắc được tạo ra từ chính tiếng cười của hai người. Khoảnh khắc đó khiến tôi nhận ra rằng giọng nói hoàn toàn có thể trở thành một hiện vật mang ký ức, thậm chí thay thế những biểu tượng truyền thống vốn có thể tiêu tốn nhiều tài nguyên, như một chiếc nhẫn kim cương. Từ ý niệm đó, chúng tôi phát triển một hệ thống tạo sinh, về bản chất là một tập hợp các quy tắc chuyển hóa những dữ liệu và vi chi tiết cảm xúc trong giọng nói thành hình hài của một viên đá quý độc bản. Giọng nói, từ một hiện tượng vô hình, trở thành một thực thể có thể hiện diện trong đời sống, nơi con người có thể nhìn thấy, chạm vào và kết nối với chính giọng nói của mình bằng nhiều cách khác nhau.
Điều tôi muốn nhấn mạnh là Voice Gems không phải là một dự án về thu thập hay phân tích dữ liệu. Giá trị của dự án không nằm ở dữ liệu, mà nằm ở con người, ở câu chuyện của họ và ở mối liên kết được tạo ra thông qua giọng nói.
Trung có thể giải thích đơn giản cách biến một file ghi âm thành Voice Gem? Và AI có vai trò gì không?
Voice Gems không sử dụng AI theo nghĩa máy học hay trí tuệ nhân tạo tạo sinh. Thay vào đó, chúng tôi phát triển một hệ thuật toán tạo sinh bespoke, điều phối sự kết tinh của 200.000 hạt dữ liệu trong không gian ba chiều để hình thành nên những cấu trúc và dải màu sắc độc bản. Khi một giọng nói được ghi lại, hệ thống lắng nghe và phân tích những yếu tố “paralanguage” nằm ngoài ngôn từ, như nhịp điệu (rhythm), xung âm (transients), cộng hưởng (resonance), mật độ phổ tần (spectral density), dải động (dynamic range), năng lượng (energy) và nhiều yếu tố khác. Từ đó, những cấu trúc ẩn đặc trưng của giọng nói được hé lộ và chuyển hóa thành hình hài của một viên đá quý độc bản, mang theo chất liệu và bảng màu phản ánh bản sắc riêng của từng cá nhân.
Các giọng nói được thu thập như thế nào? Trung có tiêu chí lựa chọn không?
Mỗi Voice Gem đều bắt đầu từ một giọng nói được chia sẻ, chứ không được lấy đi. Cách chúng tôi tuyển chọn luôn giữ vững giá trị minh bạch và tôn trọng với những tiếng nói. Chúng tôi tiếp cận dự án theo phương thức phi khai thác (non-extractive). Mỗi giọng nói trong kho lưu trữ đều được trao tặng tới dự án trực tiếp bởi người sở hữu, hay được ghi lại với sự đồng thuận, hoặc đến từ những mối quan hệ cá nhân, những dự án làm việc cùng cộng đồng, hay những sự hợp tác với các tổ chức văn hóa như Diễn Đàn Kinh Tế Thế Giới (World Economic Forum), Liên Hợp Quốc (United Nations), Berggruen Institute hay Bảo Tàng Victoria and Albert (V&A). Việc tham gia luôn mang tính chất tự nguyện, và mỗi đóng góp được nhìn nhận như một sự hiện diện có ý nghĩa, chứ không phải một nguồn tài nguyên để lấy đi.
Chúng tôi tìm đến những giọng nói độc đáo (unique), đáng chú ý (remarkable) và mong manh (vulnerable). Có những giọng nói mang theo ảnh hưởng và ký ức tập thể, nhưng cũng có những giọng nói rất riêng tư, dễ tổn thương, hoặc đang đứng trước nguy cơ biến mất. Với chúng tôi, cả hai đều quan trọng như nhau. Điều kết nối những giọng nói trong kho lưu trữ này không nằm ở vị thế, mà là chiều sâu của những trải nghiệm con người được gửi gắm trong đó.
Vì vậy, Voice Gems linh hoạt giữa rất nhiều dạng thức tiếng nói khác nhau: từ những tiếng khóc trào đời em bé mới sinh cho tới lời nói cuối cùng của một người đã mất, cho đến giọng nói của những cộng đồng dân tộc thiểu số và những ngôn ngữ đang dần mai một; song song với đó là những giọng nói có sức ảnh hưởng lớn trong đời sống văn hóa và tư tưởng. Trong archive có những đóng góp như tiến sĩ Jane Goodall, đóng góp những thông điệp thông điệp dành cho Trái Đất, như một lời gửi gắm cấp thiết cho các thế hệ tương lai. Herbert W. Franke, một trong những người tiên phong tuyệt đối trong lĩnh vực computational art, đã kết hợp cùng Voice Gems cho tác phẩm cuối cùng trong cuộc đời mình, biến giọng nói thành một dấu ấn khép lại hành trình sáng tạo kéo dài nhiều thập kỷ. Geoff Hurst, người ghi hat-trick trong trận chung kết World Cup 1966, lựa chọn lưu giữ ký ức về khoảnh khắc ấy trong bối cảnh nhiều đồng đội của ông đã mất do chịu ảnh hưởng của bệnh Alzheimer, như một cách bảo tồn ký ức sống trước sự mong manh của thời gian. Và Sadhguru, với giọng nói mang tính chiêm nghiệm, gợi mở những suy tư về ý thức, đời sống nội tâm, và vị trí nhỏ bé của con người trong vũ trụ rộng lớn này.
Trong mọi bối cảnh, dù là cá nhân, cộng đồng hay những tổ chức lớn, chúng tôi luôn tiếp cận giọng nói như một thực thể văn hoá sống. Mỗi một viên đá tiếng nói Voice Gem không đơn thuần là một vật thể, mà là một hành động lưu giữ mang tính cộng tác. Giọng nói con người ở đây không phải là những dữ liệu để được khai thác, mà nó cần có thể được lắng nghe, trân trọng và ghi nhớ lâu dài.
Trong tương lai, Voice Gems sẽ phát triển ra sao? Có thể đi vào đời sống vật lý không?
Với chúng tôi, Voice Gems là một dự án về sự chú tâm. Giọng nói là một khái niệm trừu tượng, vì vậy nó không thể và cũng không nên bị giới hạn trong một hình thức duy nhất. Khi con người có thể nhìn thấy, chạm vào, hoặc bước vào một không gian được tạo ra từ chính giọng nói của mình, mối quan hệ của họ với khái niệm “giọng nói” bắt đầu thay đổi. Mong muốn của chúng tôi là từ trải nghiệm đó, con người có thể soi chiếu và chú tâm trở lại với giọng nói của chính mình.
Hiện tại, Voice Gems tồn tại dưới dạng đá quý kỹ thuật số, với khả năng được khuếch đại ở nhiều quy mô khác nhau: từ những màn hình cá nhân như điện thoại hay máy tính, cho tới những kích thước lớn bằng cả bức tường, thậm chí thay đổi toàn bộ không gian kiến trúc. Chúng tôi đã thử nghiệm những quy mô này trong các triển lãm và sắp đặt không gian lớn, như tại W1 Immersive (London) hay Disseny Hub (Barcelona).
Song song với các phiên bản kỹ thuật số, Voice Gems cũng tồn tại dưới dạng vật lý, nơi giọng nói con người có thể được chạm vào và mang theo bên mình. Năm 2024, một cặp đôi sắp cưới đã tìm đến dự án với mong muốn lưu giữ giọng nói của người cha đã khuất của cô dâu. Từ một bản ghi âm, Voice Gems tạo ra một đôi hoa tai bạc. Khi cô dâu bước lên lễ đường, giọng nói của người cha hiện diện bên cô, như thể ông vẫn đang ở kế bên, đưa con gái mình tiến tới và trao tay cho chú rể. Những khoảnh khắc như vậy củng cố niềm tin của chúng tôi rằng công nghệ sáng tạo và nghệ thuật, khi được sử dụng đúng cách, có thể mang lại những giá trị thật, sâu sắc và mang tính cá nhân cho con người.
Vì sao Trung chọn lưu trữ giọng nói như một dạng “dữ liệu danh tính”? Và “1000 Year Archive” mang thông điệp gì?
Khi đặt câu hỏi với một người rằng “nếu giọng nói của bạn được lưu trữ trong một nghìn năm tới, bạn sẽ nói điều gì”. Đây là một câu hỏi rất thú vị, vì phản xạ đầu tiên thường không phải là nghĩ về thông tin, mà là nghĩ về ý nghĩa. Mọi người thường sẽ chậm lại, suy nghĩ về điều gì thật sự đáng để được giữ lại, không chỉ cho bản thân, mà cho những thế hệ chưa từng gặp mình.
Với chúng tôi, “1000 Year Archive” không phải là một lời hứa về sự bất tử. Nó là một cách để đặt niềm tin vào khả năng của công nghệ trong việc giữ lại dấu ấn của con người và cộng đồng, đặc biệt là những sự đa dạng của giọng nói, trải nghiệm và cách chúng ta tồn tại trong thế giới này. Trong một thời đại mà quá nhiều thứ bị làm phẳng và đồng nhất, việc lưu giữ giọng nói tôn vinh sự độc bản, mong manh nhưng cực kỳ quan trọng của con người.
Với Voice Gems, công nghệ mở ra khả năng gì trong việc thách thức các mô hình giá trị truyền thống và hướng tới bền vững?
Câu chuyện về chiếc nhẫn kim cương đính hôn là một ví dụ rất rõ cho cách chúng ta thường gắn giá trị với sự khan hiếm vật chất. Liệu những giá trị cá nhân có nhất thiết phải được đại diện bằng những vật liệu hay những phương thức khai thác và sản xuất tiêu tốn nhiều tài nguyên hay không?
Thay vì tìm kiếm giá trị trong sự hiếm có của vật chất, Voice Gems hướng tới việc tôn vinh những gì vốn đã tồn tại ở mỗi con người. Một giọng nói, một tiếng cười, một khoảnh khắc thân mật mang theo nhiều tầng ý nghĩa hơn bất kỳ biểu tượng xa xỉ nào. Đối với chúng tôi, đây là một cách tiếp cận bền vững không chỉ về môi trường, mà còn về văn hóa và tâm lý, nơi giá trị được xây dựng từ sự hiện diện, ký ức và mối liên kết giữa con người với nhau, thay vì từ những chuẩn mực dựa trên sở hữu và tiêu dùng.
Quan điểm “không có công nghệ, con người vẫn sáng tạo” của Trung có thay đổi trong kỷ nguyên AI?
Khi tôi nói “không có công nghệ, con người vẫn sáng tạo”, tôi không muốn phủ nhận vai trò của công nghệ, mà muốn nhấn mạnh rằng sáng tạo không sinh ra từ công cụ. Nó bắt nguồn từ những nhu cầu rất bản năng của con người: muốn biểu đạt, muốn kết nối, muốn ghi nhớ và muốn hiểu thế giới xung quanh mình. Quan điểm này của tôi không thay đổi, và trong bối cảnh hiện tại, nó càng trở nên thiết yếu hơn.
AI, cũng như nhiều công nghệ hiện đại trước đó, đã giúp việc tiếp cận thông tin và sáng tạo trở nên rộng mở hơn, và điều đó là tích cực. Nhiều người lần đầu tiên có trong tay công cụ để biểu đạt ý tưởng của mình, điều mà trước đây họ không có cơ hội.
Tuy nhiên, thách thức lớn nhất nằm ở nguy cơ đánh mất sự đa dạng. Khi mọi thứ được tạo ra quá nhanh, quá thuận tiện, và dựa trên những mô hình giống nhau, sáng tạo rất dễ bị làm phẳng. Trong bối cảnh đó, vai trò của nghệ sĩ không phải là chạy theo công nghệ, mà là đặt câu hỏi cho nó, và giữ cho tiếng nói cá nhân không bị hòa tan.
Với tôi, công nghệ chỉ thực sự có ý nghĩa khi nó giúp con người hiểu rõ hơn về chính mình, đồng thời tạo được những không gian cho những sự đồng cảm và lắng nghe. Khi công nghệ mở ra những cách cảm nhận mới, làm sâu sắc trải nghiệm sống và nuôi dưỡng sự kết nối giữa người với người, nó trở thành một công cụ có giá trị. Còn nếu công nghệ bắt đầu nói thay con người hay quyết định thay con người, thì đó là lúc chúng ta cần chậm lại và tự hỏi vì sao mình sáng tạo ngay từ đầu.
Trung phân bổ năng lượng sáng tạo thế nào giữa Voice Gems, Fustic. Studio và các thực hành khác?
Với tôi, thực hành nghệ thuật không tách rời khỏi đời sống. Trình diễn, nghiên cứu, điều hành studio hay làm việc với cộng đồng chỉ là những hình thức khác nhau của cùng một dòng chảy sáng tạo.
Những trải nghiệm sống nuôi dưỡng nghệ thuật, và nghệ thuật quay trở lại định hình cách tôi sống và nhìn thế giới. Tôi cũng chưa bao giờ cố gắng “cân bằng” các vai trò, mà luôn chọn hiện diện một cách trọn vẹn trong từng không gian mình hoạt động.
Visual “immersive” đang ảnh hưởng thế nào đến cách chúng ta nghe nhạc, theo quan sát của Trung?
Visual “immersive” đang dần thay đổi cách chúng ta nghe nhạc, không phải bằng cách thay thế hay lấn át âm thanh, mà bằng cách mở rộng trải nghiệm lắng nghe. Khi được làm đúng thì visual sẽ không chỉ minh họa cho âm nhạc, mà giúp người nghe cảm nhận rõ hơn cấu trúc, không gian và chuyển động của âm thanh, thậm chí là ý niệm trong những tần số đó nữa. Từ đó họ có thể lắng nghe bằng nhiều giác quan hơn, chứ không chỉ bằng tai.
Thách thức lớn nhất là sự tiết chế. Nếu visual lấn át hoặc áp đặt cảm xúc, trải nghiệm sẽ nhanh chóng trở nên nặng nề và xa rời bản chất của âm nhạc. Khi mỗi medium có đủ không gian để thể hiện bản chất riêng, đồng thời hỗ trợ và flow cùng nhau, trải nghiệm có thể trở nên liền mạch, chân thật.
Từ kinh nghiệm của Fustic., Trung thấy những công nghệ visual nào sẽ định hình tương lai trình diễn và triển lãm?
Từ kinh nghiệm của mình, tôi thấy tương lai của các trải nghiệm nghệ thuật đang dịch chuyển theo hướng mở hơn và dễ tiếp cận hơn, đặc biệt trong việc đưa nghệ thuật vào những không gian công cộng (public art). Công nghệ giúp nghệ thuật rời xa những không gian mang nặng tính thể chế và giai cấp, để hiện diện trong đời sống hằng ngày, nơi nhiều người có thể tiếp cận và tham gia một cách tự nhiên và sâu sắc hơn.
Những hệ thống công nghệ tương tác thời gian thực (real-time interactive) cho phép tác phẩm phản hồi trực tiếp với sự hiện diện của con người, từ đó mở ra khả năng cá nhân hóa và đồng sáng tạo. Điều quan trọng nhất với tôi là tiềm năng của những trải nghiệm này không nằm ở việc gây choáng ngợp, mà ở khả năng tạo ra sự chậm lại, sự chủ động và cảm giác được lắng nghe, từ đó dẫn tới những khoảnh khắc soi chiếu.
Cảm ơn Trung đã cùng trò chuyện cùng ELLE Man Việt Nam!
________
Bài: Đ.T
Hình ảnh: NVCC