Disney Research đã công bố LookingGlass , một hệ thống đột phá sử dụng trí tuệ nhân tạo để tạo ra các phiên bản hiện đại của những ảo ảnh quang học có từ hàng thế kỷ được gọi là anamorphoses. Những hình ảnh đặc biệt này có vẻ bị biến dạng khi nhìn bình thường nhưng sẽ tiết lộ những bức tranh ẩn khi được nhìn qua gương hoặc thấu kính đặc biệt.
![]() |
---|
Một bộ sưu tập trình bày các diễn giải nghệ thuật, làm nổi bật tiềm năng sáng tạo của những ảo ảnh quang học được hiện đại hóa thông qua hệ thống LookingGlass |
Công nghệ xem kép cách mạng
Nghệ thuật anamorphic truyền thống có một hạn chế lớn - nó chỉ có ý nghĩa khi được nhìn từ một góc độ cụ thể hoặc thông qua một thiết bị đặc biệt. Cách tiếp cận mới của Disney giải quyết vấn đề này bằng cách tạo ra những hình ảnh trông có ý nghĩa cả khi nhìn trực tiếp và khi được chuyển đổi thông qua các thiết bị quang học. Hệ thống sử dụng các mô hình AI tiên tiến được gọi là latent rectified flow models, kết hợp với một kỹ thuật gọi là Laplacian Pyramid Warping xử lý các mức tần số khác nhau của hình ảnh để duy trì chất lượng hình ảnh cao.
Công nghệ này được xây dựng dựa trên các nghiên cứu trước đó về visual anagrams, mở rộng những khái niệm này thành nội dung do AI tạo ra phức tạp hơn. Điều này cho phép các nghệ sĩ và nhà nghiên cứu tạo ra những ảo ảnh quang học phức tạp mà trước đây không thể thực hiện được bằng tay.
Các Thành Phần Kỹ Thuật Chính:
- Mô hình dòng chảy chỉnh lưu tiềm ẩn cho việc tạo ảnh AI
- Laplacian Pyramid Warping cho xử lý ảnh nhận biết tần số
- Mở rộng phương pháp Visual Anagrams sang các mô hình không gian tiềm ẩn
- Hỗ trợ phạm vi rộng hơn các phép biến đổi không gian so với các phương pháp trước đây
Ứng dụng cộng đồng và tiềm năng sáng tạo
Thông báo này đã thu hút sự quan tâm của các nghệ sĩ kỹ thuật số và nhà nghiên cứu, những người thấy các ứng dụng tiềm năng vượt ra ngoài giải trí. Một số thành viên cộng đồng đã lưu ý những điểm tương đồng với các dự án thao tác pixel của riêng họ, nơi các pixel liền kề trong chuỗi video được hoán đổi có hệ thống để tạo ra hiệu ứng biến hình giữa các hình ảnh khác nhau.
Những người khác đã rút ra những kết nối với các phát triển gần đây trong steganography - nghệ thuật ẩn thông tin một cách rõ ràng. Yêu cầu xem hai tính chất có thể phục vụ như một hình thức mã hóa hình ảnh, trong đó chìa khóa là biết cấu hình gương hoặc thấu kính chính xác cần thiết để tiết lộ nội dung ẩn.
Các Dự Án Liên Quan Trong Lĩnh Vực Ảo Ảnh AI:
- Visual Anagrams : Tạo ra những hình ảnh thay đổi khi được lật hoặc xoay
- Diffusion Illusions : Tạo sinh những hình ảnh câu đố với nhiều cách diễn giải khác nhau
- QRMonster và Illusion Diffusion : Những hình ảnh ẩn được tiết lộ khi nheo mắt hoặc xem từ xa
- Control Net và img2img : Sử dụng các mô hình khuếch tán được tinh chỉnh để tạo sinh hình ảnh có cấu trúc
Lĩnh vực đang phát triển của ảo ảnh quang học được tăng cường bằng AI
LookingGlass đại diện cho một phần của xu hướng rộng lớn hơn trong việc sử dụng AI tạo sinh để tái tưởng tượng các hiệu ứng quang học cổ điển. Các dự án tương tự như Diffusion Illusions và Visual Anagrams đã xuất hiện trong năm qua, mỗi dự án khám phá những cách khác nhau để tạo ra hình ảnh thay đổi ý nghĩa dựa trên cách chúng được xem - dù thông qua xoay, đảo màu, hoặc khoảng cách xem.
Công nghệ này chứng minh cách AI hiện đại có thể thổi hồn mới vào các khái niệm toán học và nghệ thuật có từ thế kỷ 17, mở ra khả năng cho các cài đặt nghệ thuật tương tác, công cụ giáo dục và các hình thức phương tiện kỹ thuật số mới thu hút người xem theo những cách bất ngờ.
Tham khảo: LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
![]() |
---|
Một ảnh chụp màn hình học thuật giới thiệu bài nghiên cứu về LookingGlass , minh họa việc tích hợp AI tạo sinh trong việc tái tưởng tượng các ảo ảnh thị giác |