Image default
Máy Tính

AI Có Thật Sự Tái Tạo Được Ảnh Biểu Tượng Thế Kỷ 20 Một Cách Hoàn Hảo?

Các mô hình AI hiện đại ngày nay dường như có khả năng “phép thuật” trong việc tạo ra hình ảnh, nhưng liệu chúng có thực sự tái tạo được sự rực rỡ và cảm xúc đặc trưng của những bức ảnh được công nhận nhất thế kỷ 20? Đây là câu hỏi mà nhiều người yêu công nghệ và nhiếp ảnh đang băn khoăn. Bài viết này sẽ đi sâu vào thử nghiệm khả năng AI tạo ảnh trong việc phục dựng lại các tác phẩm kinh điển, từ đó đánh giá giới hạn và tiềm năng của công nghệ này.

Với sự phát triển không ngừng của công nghệ AI, đặc biệt là trong lĩnh vực text-to-image generator, chúng ta có thể tạo ra gần như mọi thứ chỉ bằng những câu lệnh phù hợp. Tuy nhiên, khi nói đến việc tái tạo ảnh mang ý nghĩa văn hóa và lịch sử, liệu AI có thể vượt qua ranh giới của sự mô phỏng đơn thuần để chạm tới giá trị nghệ thuật? Mục tiêu của thử nghiệm này là kiểm chứng điều đó, đồng thời mang đến cái nhìn khách quan về khả năng của các công cụ chụp ảnh AI như Fotor AI trên thị trường hiện nay.

I. Tại Sao Lại Thực Hiện Thử Nghiệm Này?

Các mô hình AI tạo ảnh đang trở nên mạnh mẽ đến mức dường như bạn có thể tạo ra bất cứ thứ gì chỉ bằng cách sử dụng các câu lệnh phù hợp – vì vậy, tôi đơn giản muốn kiểm tra xem điều này có đúng hay không. Mặc dù những thử nghiệm tương tự có thể khiến hầu hết các nhà sáng tạo lo sợ, nhưng các nhiếp ảnh gia nói chung vẫn an toàn khỏi sự thống trị trong tương lai của AI vì một lý do đơn giản: họ đang ghi lại thực tại.

Những bức ảnh bạn sẽ thấy trong bài viết này không chỉ là những kỳ quan của nghệ thuật nhiếp ảnh mà còn là một viên nang thời gian của giai đoạn chúng được chụp. Một mô hình AI có thể tạo ra một cái gì đó với cảm giác tương tự, chắc chắn rồi, nhưng thật nực cười khi mong đợi một hình ảnh do AI tạo ra có thể mang bất kỳ giá trị văn hóa quan trọng nào.

Công cụ được lựa chọn cho thử nghiệm này là Fotor AI, một text-to-image generator tương đối đơn giản nhưng thường mang lại kết quả khá tốt. Tuy nhiên, nó không phải là Midjourney và mặc dù rất tốt cho nhiều phong cách nghệ thuật khác nhau, kỹ năng “nhiếp ảnh” của nó đôi khi còn rất sơ sài. Điều này đặc biệt đúng khi cố gắng yêu cầu mô hình khớp với thời kỳ của hình ảnh gốc.

II. Cách AI Xử Lý Chủ Thể Con Người

Dorothea Lange là huyền thoại đầu tiên được AI xử lý. Bức ảnh “Migrant Mother” là một trong những bức ảnh biểu tượng nhất mọi thời đại và tôi đã lầm tưởng rằng Fotor sẽ quen thuộc với nó.

Bức ảnh biểu tượng "Người Mẹ Di Cư" của Dorothea Lange chụp một người mẹ ôm các con trong thời kỳ Đại Suy Thoái, thể hiện sự khó khăn và kiên cường.Bức ảnh biểu tượng "Người Mẹ Di Cư" của Dorothea Lange chụp một người mẹ ôm các con trong thời kỳ Đại Suy Thoái, thể hiện sự khó khăn và kiên cường.

Tuy nhiên, mô hình cụ thể này không giỏi về tên và tôi phải mô tả chi tiết bức ảnh cho đến khi nó hiểu được ý tôi. Kết quả khá ổn:

Ảnh AI tạo ra một người mẹ trong thời kỳ Đại Suy Thoái ôm hai đứa trẻ, với ánh sáng studio hiện đại khác biệt so với ảnh gốc.Ảnh AI tạo ra một người mẹ trong thời kỳ Đại Suy Thoái ôm hai đứa trẻ, với ánh sáng studio hiện đại khác biệt so với ảnh gốc.

Khi kiểm tra kỹ hơn, vấn đề lớn nhất là ánh sáng. Trong ảnh gốc, chủ thể được chiếu sáng bằng ánh sáng tự nhiên, trong khi AI đã chiếu sáng “người mẹ” của chúng ta bằng ánh sáng studio hiện đại. Bức ảnh cũng trông quá “mượt” theo ý kiến của tôi, mặc dù đây không phải là điều mà một chút nhiễu và hạt phim không thể giải quyết.

Về mặt bố cục, đó là một thất bại. Dorothea Lange đã cẩn thận sắp xếp bố cục bức ảnh để kể câu chuyện về một người bị ảnh hưởng bởi cuộc Đại Suy Thoái, với từng chi tiết từ cách cắt ảnh đến ánh sáng đều góp phần vào thông điệp. Mặt khác, AI vẫn còn vật lộn với ý nghĩa ngầm (chúng ta sẽ gặp rắc rối khi nó bước vào giai đoạn tuổi teen), vì vậy không có điều gì trong số đó được chuyển tải vào kết quả cuối cùng.

Fotor cũng cung cấp tùy chọn sử dụng tính năng image-to-image, và điều này mang lại kết quả gần hơn (ít nhất là về bố cục):

Bức ảnh do AI tạo ra từ ảnh gốc, mô tả người mẹ và các con trong thời kỳ Đại Suy Thoái, cho thấy bố cục tương tự nhưng chất lượng kém hơn.Bức ảnh do AI tạo ra từ ảnh gốc, mô tả người mẹ và các con trong thời kỳ Đại Suy Thoái, cho thấy bố cục tương tự nhưng chất lượng kém hơn.

Mặc dù những bức ảnh này khó phân biệt, tôi không hài lòng với kết quả vì Fotor dường như chỉ thêm một bộ lọc làm đẹp chất lượng thấp lên chủ thể. Nhưng còn một cảnh phức tạp hơn thì sao?

Bức ảnh lịch sử cựu Tổng thống Richard Nixon đang dùng đũa ăn tối cùng các quan chức Trung Quốc trong chuyến thăm năm 1972.Bức ảnh lịch sử cựu Tổng thống Richard Nixon đang dùng đũa ăn tối cùng các quan chức Trung Quốc trong chuyến thăm năm 1972.

Đối với thử nghiệm này, chúng ta sẽ quay nhanh đến đầu những năm 70 và cố gắng tái tạo bức ảnh “Nixon ở Trung Quốc” của Oliver F. Atkins. Dưới đây là kết quả của Fotor. Điều đầu tiên bạn sẽ nhận thấy là Fotor rõ ràng không biết Richard Nixon là ai (mô hình có lẽ sẽ “nổ tung” nếu tôi sử dụng câu lệnh “Watergate”).

Ảnh AI tạo ra cảnh một người đàn ông dùng đũa tại bàn ăn, xung quanh là các quan chức Trung Quốc, nhưng không thể hiện được Richard Nixon.Ảnh AI tạo ra cảnh một người đàn ông dùng đũa tại bàn ăn, xung quanh là các quan chức Trung Quốc, nhưng không thể hiện được Richard Nixon.

Ý chính của bức ảnh đã có (bao gồm cả sự bối rối trước miếng thức ăn trên đũa), nhưng bố cục và bối cảnh quá khác biệt. Có lẽ tôi sẽ không thể nhận ra bức ảnh do AI tạo ra dựa trên ảnh gốc nếu tôi chưa từng nhìn thấy ảnh gốc.

Tính năng image-to-image có bố cục tương tự nhưng chất lượng tổng thể bị giảm đi đáng kể. Các khuôn mặt bị biến dạng, một trong nhiều dấu hiệu của ảnh AI chất lượng kém.

Ảnh AI tạo ra từ ảnh gốc "Nixon in China", cho thấy bố cục tương tự nhưng chất lượng hình ảnh và chi tiết khuôn mặt bị biến dạng rõ rệt.Ảnh AI tạo ra từ ảnh gốc "Nixon in China", cho thấy bố cục tương tự nhưng chất lượng hình ảnh và chi tiết khuôn mặt bị biến dạng rõ rệt.

III. Cách AI Xử Lý Cảnh Vật và Vật Thể Vô Tri

Hãy bắt đầu với kiệt tác “Thảm Họa Hindenburg” của Sam Shere. Bức ảnh độc nhất vô nhị này cực kỳ phức tạp, vì vậy nó sẽ là một thử thách tốt cho AI.

Bức ảnh lịch sử ghi lại khoảnh khắc khinh khí cầu Hindenburg bốc cháy và rơi xuống, thể hiện sự khủng khiếp của thảm họa.Bức ảnh lịch sử ghi lại khoảnh khắc khinh khí cầu Hindenburg bốc cháy và rơi xuống, thể hiện sự khủng khiếp của thảm họa.

Fotor ít nhiều đã hiểu những gì tôi yêu cầu nó làm.

Ảnh AI tạo ra cảnh khinh khí cầu Hindenburg đang bốc cháy nhưng vẫn còn nguyên vẹn, khác biệt đáng kể so với hiện thực vụ tai nạn.Ảnh AI tạo ra cảnh khinh khí cầu Hindenburg đang bốc cháy nhưng vẫn còn nguyên vẹn, khác biệt đáng kể so với hiện thực vụ tai nạn.

Tôi sử dụng cụm từ “ít nhiều” vì khinh khí cầu vẫn còn nguyên vẹn mặc dù nó đang bốc cháy. Nó cũng quá gần mặt đất và không thể tái tạo bố cục của ảnh gốc.

Khi sử dụng ảnh gốc làm đầu vào, gần như không thể phân biệt được hai hình ảnh này:

Bản tái tạo thảm họa Hindenburg do AI tạo ra từ ảnh gốc, cho thấy sự tương đồng đáng kinh ngạc nhưng không có sự sáng tạo hay chi tiết mới.Bản tái tạo thảm họa Hindenburg do AI tạo ra từ ảnh gốc, cho thấy sự tương đồng đáng kinh ngạc nhưng không có sự sáng tạo hay chi tiết mới.

Thế còn một cảnh không dễ nhận diện ngay lập tức thì sao? Bức ảnh “Khinh khí cầu xương rồng” của Leon Gimpel hoàn toàn phù hợp.

Bức ảnh hiếm hoi từ đầu thế kỷ 20 của Léon Gimpel, chụp hai khinh khí cầu bên trong Grand Palais ở Paris, với màu sắc độc đáo.Bức ảnh hiếm hoi từ đầu thế kỷ 20 của Léon Gimpel, chụp hai khinh khí cầu bên trong Grand Palais ở Paris, với màu sắc độc đáo.

Đây cũng là một trong những ví dụ hiếm hoi về việc sử dụng nhiếp ảnh màu từ đầu những năm 1900, vì vậy rất thú vị để xem liệu AI có thể tái tạo vẻ ngoài độc đáo đó hay không. Tiết lộ trước: nó không thể.

Ảnh AI tạo ra hai khinh khí cầu trong một không gian kín ở Paris, nhưng bố cục và màu sắc không giống ảnh gốc, thiếu đi tính chân thực.Ảnh AI tạo ra hai khinh khí cầu trong một không gian kín ở Paris, nhưng bố cục và màu sắc không giống ảnh gốc, thiếu đi tính chân thực.

Bối cảnh (Grand Palais, Paris) là chính xác, nhưng bố cục và chủ thể hầu như không giống ảnh gốc. Màu sắc cũng không đúng thời kỳ. Sử dụng ảnh gốc làm câu lệnh đã mang lại kết quả tốt hơn nhiều:

Bản tái tạo do AI tạo ra từ ảnh gốc khinh khí cầu ở Paris, trông giống tranh màu nước/pastel và không mang lại cải thiện về chi tiết.Bản tái tạo do AI tạo ra từ ảnh gốc khinh khí cầu ở Paris, trông giống tranh màu nước/pastel và không mang lại cải thiện về chi tiết.

Tuy nhiên, có một vấn đề nhỏ. Có vẻ như Fotor chỉ đơn giản là tái tạo lại hình ảnh gốc theo phong cách nghệ thuật màu nước/pastel, mặc dù đã sử dụng các câu lệnh phủ định để ngăn mô hình làm như vậy. Do đó, bạn không nên mong đợi nhiều về việc cải thiện hình ảnh ở đây.

IV. AI Có Thể Tái Tạo Phong Cảnh và Cảnh Đô Thị Không?

Do cách Ansel Adams sử dụng bộ lọc đen trắng màu cam và vàng để chơi đùa với độ tương phản cùng cách tiếp cận bậc thầy của ông với phòng tối, phong cách của ông dễ nhận biết ngay lập tức và rất khó để tái tạo.

Bức ảnh đen trắng nổi tiếng "Moonrise, Hernandez, New Mexico" của Ansel Adams, chụp cảnh mặt trăng trên thị trấn sa mạc với độ tương phản cao.Bức ảnh đen trắng nổi tiếng "Moonrise, Hernandez, New Mexico" của Ansel Adams, chụp cảnh mặt trăng trên thị trấn sa mạc với độ tương phản cao.

Vì vậy, tất nhiên, tôi quyết định khiến Fotor phải cảm thấy “tự ti”. Mặc dù cảnh không giống chút nào, độ tương phản lại gợi ý phong cách của Ansel Adams.

Ảnh AI tạo ra cảnh đêm với mặt trăng trên một thị trấn sa mạc, có độ tương phản gợi nhớ phong cách của Ansel Adams nhưng không giống ảnh gốc.Ảnh AI tạo ra cảnh đêm với mặt trăng trên một thị trấn sa mạc, có độ tương phản gợi nhớ phong cách của Ansel Adams nhưng không giống ảnh gốc.

Tính năng image-to-image tốt hơn nhiều về tổng thể nhưng hình ảnh đã mất tất cả các chi tiết nhỏ:

Ảnh AI tạo ra từ ảnh gốc "Moonrise, Hernandez", trông tổng thể tốt hơn nhưng thiếu các chi tiết tinh tế của bức ảnh kinh điển.Ảnh AI tạo ra từ ảnh gốc "Moonrise, Hernandez", trông tổng thể tốt hơn nhưng thiếu các chi tiết tinh tế của bức ảnh kinh điển.

Tôi là một fan hâm mộ lớn của nhiếp ảnh đường phố, nhưng không may, hầu hết các bức ảnh đường phố biểu tượng vẫn chưa thuộc phạm vi công cộng. Do đó, bức ảnh biểu tượng “Kissing the War Goodbye” của Victor Jorgensen sẽ là lựa chọn phù hợp.

Bức ảnh lịch sử "Nụ Hôn Chia Tay Chiến Tranh" của Victor Jorgensen, ghi lại cảnh một thủy thủ hôn y tá tại Quảng trường Thời đại, biểu tượng của sự kết thúc Thế chiến II.Bức ảnh lịch sử "Nụ Hôn Chia Tay Chiến Tranh" của Victor Jorgensen, ghi lại cảnh một thủy thủ hôn y tá tại Quảng trường Thời đại, biểu tượng của sự kết thúc Thế chiến II.

Đúng như bạn có thể mong đợi từ Fotor vào thời điểm này, kết quả cuối cùng khá tốt. Tuy nhiên, có hai vấn đề.

Ảnh AI tạo ra cảnh một thủy thủ hôn y tá ở Quảng trường Thời đại, trông dàn dựng và có nét giống ảnh của Alfred Eisenstadt hơn.Ảnh AI tạo ra cảnh một thủy thủ hôn y tá ở Quảng trường Thời đại, trông dàn dựng và có nét giống ảnh của Alfred Eisenstadt hơn.

Thứ nhất, nó giống một bức ảnh khác về cảnh này của Alfred Eisenstadt, và thứ hai, nó trông 100% đã được dàn dựng (ảnh gốc thì không).

Về mặt kỹ thuật, ánh sáng giống với ánh sáng studio hiện đại và bức ảnh quá tương phản theo ý thích của tôi. Hãy sử dụng hình ảnh gốc làm câu lệnh:

Ảnh AI tạo ra từ ảnh gốc "Kissing the War Goodbye", các chủ thể chính trông tốt nhưng những người ở hậu cảnh bị biến dạng một cách bất thường.Ảnh AI tạo ra từ ảnh gốc "Kissing the War Goodbye", các chủ thể chính trông tốt nhưng những người ở hậu cảnh bị biến dạng một cách bất thường.

Kết quả này là một sự pha trộn. Trong khi tôi yêu thích vẻ ngoài của các chủ thể chính, khuôn mặt của những người ở hậu cảnh giờ đây trông như bước ra từ một bộ phim kinh dị – một vẻ ngoài không hề tốt chút nào.

V. Kết Luận

Tổng quan, tôi khá ấn tượng với một số tác phẩm của Fotor AI, nhưng kết quả quá thiếu nhất quán. Rõ ràng, khi nói đến khả năng tái tạo ảnh hoặc tạo ra những bức ảnh có tính chân thực cao từ các câu lệnh văn bản, các công cụ như Midjourney và DALL-E vẫn vượt trội hơn hẳn.

Thử nghiệm này đã cho thấy rằng dù AI tạo ảnh có những bước tiến đáng kinh ngạc, chúng vẫn còn nhiều hạn chế khi đối mặt với sự tinh tế trong bố cục, ánh sáng tự nhiên, và đặc biệt là khả năng truyền tải cảm xúc, ý nghĩa ngầm hay giá trị văn hóa lịch sử của một bức ảnh. Trong khi AI có thể mô phỏng một cách khá tốt, nó khó lòng thay thế được cái “chất” và khoảnh khắc độc đáo mà một nhiếp ảnh gia tài năng có thể nắm bắt trong thực tế.

Chúng ta vẫn đang ở giai đoạn đầu của sự phát triển nhiếp ảnh AI, và tương lai chắc chắn sẽ mang lại nhiều điều bất ngờ. Tuy nhiên, giá trị cốt lõi của nhiếp ảnh – là một hình thức ghi lại và lưu giữ thực tại cùng những câu chuyện đằng sau đó – vẫn sẽ được duy trì, bất kể công nghệ AI tạo ảnh phát triển đến đâu.

Related posts

Playlists.cloud: Giải Pháp Đồng Bộ Playlist Spotify Và Apple Music Miễn Phí, Hiệu Quả

Administrator

Mật khẩu và mã hóa: Vì sao bạn cần cả hai để bảo vệ dữ liệu?

Administrator

Tối Ưu Windows 11: Khắc Phục 9 Phiền Toái Thường Gặp Để Trải Nghiệm Hoàn Hảo Hơn

Administrator