Technologia z XXIV wieku już z nami jest. Holografia neuronowa z Uniwersytetu Stanforda pozwala na dokładne odwzorowania obrazu 3D w czasie rzeczywistym
Jako pierwszy o technologii, która właśnie powstaje w laboratorium Stanford Computational Imaging Group – holografii dającej złudzenie rzeczywistości – napisał Stanisław Lem w powieści „Obłok Magellana” z 1955 roku. Nazwał ją widownią videoplastyczną.
Potem pomysł pojawiał się w produkcjach spod znaku „Star Trek”. Pomieszczenie nazywane holodekiem umożliwiało kreowanie symulowanej rzeczywistości na podstawie wprowadzonych wcześniej danych. Technologia pozwalała osobie korzystającej z holodeku na pełną interakcję z wirtualnym otoczeniem. W najbardziej rozwiniętej formie koncept ten pojawił się w pilotażowym odcinku serialu „Star Trek: Następne pokolenie” – „Encounter at Farpoint”, którego akcja rozgrywa się w XXIV wieku. Potem nawet w serialu spowszedniał.
Ale czy ta odległa przyszłość nie dzieje się właśnie na naszych oczach? Dzięki zespołowi badaczy ze Stanforda prowadzonemu przez Gordona Wetzsteina będzie możliwe odtwarzanie niezwykle wyraźnych obrazów 3D w czasie rzeczywistym.
Łącząc sztuczną inteligencję z optyką, stworzyli system, który sam się uczy, aby tworzyć algorytmy wystarczająco dobre, aby natychmiast odtwarzać rzeczywiste sceny w całej ich trójwymiarowej, ciągle zmieniającej się złożoności. Nazwali go holografią neuronową Holonet, bo polega na sieci neuronowej, która uczy się, używając „kamery w pętli” do oceny dokładności wyświetlanych obrazów.
Jednym z największych wyzwań dla holografii komputerowej (computer-generated holography, CGH) jest konieczny kompromis między czasem działania algorytmu a uzyskaną jakością obrazu, który uniemożliwia wysokiej jakości syntezę obrazów holograficznych w czasie rzeczywistym. Co więcej, jakość obrazu osiągana przez większość wyświetlaczy holograficznych jest niska ze względu na niedopasowanie między propagacją fali optycznej wyświetlacza a jego symulowanym modelem.
„Opracowujemy algorytmiczny szkielet CGH, który osiąga niespotykaną dotąd wierność obrazu i generowanie klatek w czasie rzeczywistym. Nasz aparat składa się z kilku części, w tym nowej strategii optymalizacji ‘kamery w pętli’, która pozwala nam albo bezpośrednio zoptymalizować hologram, albo wytrenować interpretowalny model propagacji fali optycznej i architektury sieci neuronowej, która reprezentuje pierwszy algorytm CGH zdolny do generowania wielobarwnych obrazów holograficznych wysokiej jakości w rozdzielczości 1080p w czasie rzeczywistym” – piszą naukowcy na stronie swojego projektu.
Nowe podejście to duży postęp zarówno w wytwarzaniu obrazu 3D w czasie rzeczywistym, jak i jego dokładności. Sieć neuronowa zaczyna od próby odtworzenia obrazu 3D. Kamera cyfrowa rejestruje obraz pokazywany na wyświetlaczu i przesyła go z powrotem do systemu, który może porównać projekcje z oryginałami. Z biegiem czasu system staje się coraz lepszy w tworzeniu dokładnych obrazów 3D. W końcu staje się zdolny do odtwarzania nowych obrazów, których nigdy nie napotkał w danych treningowych. Brzmi to prosto, dopóki nie weźmie się pod uwagę oszałamiającej liczby potencjalnych wzorów fal w trójwymiarowym obrazie, który ciągle się zmienia.
Holonet może mieć praktyczne zastosowania w wirtualnej i rozszerzonej rzeczywistości (VR i AR), znacznie wykraczające poza oczywiste obszary gier i wirtualnych spotkań. Holografia w czasie rzeczywistym ma ogromny potencjał w medycynie, edukacji, szkoleniach czy pracy zdalnej.