التكنولوجيا اللازمة لبناء holodeck
عندما زرت والدتي المسنة في ألمانيا مؤخرًا، أدركت أنها قد تكون إحدى المرات الأخيرة التي أراها فيها في المنزل الصغير المريح الذي تعتبره موطنًا لها منذ أكثر من عقدين من الزمن. لذلك فعلت ما قد يفعله أي شخص: أخرجت هاتفي والتقطت الكثير من الصور للمكان للحفاظ على أكبر عدد ممكن من الذكريات: المدفأة الدافئة؛ الرفوف مليئة بالكتب المألوفة؛ مقعد الحديقة القديم المتهالك الذي وقع عليه الجميع خلال احتفال خاص بعيد ميلاد منذ سنوات عديدة.
ثم حاولت شيئًا آخر. لقد فتحت Scaniverse، وهو تطبيق ماسح ضوئي ثلاثي الأبعاد من بوكيمون جو صانع Niantic، والتقطت بعضًا من هذه الأشياء ككائنات ثلاثية الأبعاد، جاثيًا ومتحركًا على رؤوس أصابعي في طريقي حولها بينما كنت أحرك هاتفي ببطء لتسجيل كل زاوية وبوصة. كانت النتائج غير كاملة بعض الشيء حول الحواف، لكنها ما زالت عميقة. عندما فتحت عمليات المسح لاحقًا، سواء على هاتفي أو باستخدام سماعة الرأس VR، تمكنت من النظر إلى مقعد الحديقة المهترئ من جميع الزوايا، كما لو كنت أقف أمامه مباشرة. لقد أثرت هذه التجربة فيّ عاطفياً بطرق لم أكن مستعداً لها.
كانت هذه التجربة ممكنة بفضل تقنية Gaussian splatting، وهي طريقة جديدة لالتقاط الصور ثلاثية الأبعاد تم اختراعها قبل أقل من عامين والتي أحدثت ثورة في صناعة التكنولوجيا بالفعل. يستخدمه كل من Niantic وGoogle لإنشاء منتجات رسم الخرائط الخاصة بهما؛ أضافت شركة Snap دعمًا للبقع – وهو ما يُطلق عليه بالعامية الكائنات التي تم التقاطها باستخدام التناثر الغاوسي – إلى منصة مطوري Lens Studio الخاصة بها، وتريد Meta استخدام اللطخات الغاوسية لإنشاء metaverse يشبه العالم الحقيقي تمامًا.
إن شركات التكنولوجيا مفتونة بالرش الغاوسي لقدرتها على التقاط كائنات ثلاثية الأبعاد بشكل واقعي ثم إعادة إنشائها رقميًا. يمكن أن يسمح قريبًا لأي شخص بمسح غرف بأكملها وتغيير كيفية تصميم التصميمات في هوليوود وخارجها لتسجيل الفيديو ثلاثي الأبعاد. عند دمجها مع الذكاء الاصطناعي التوليدي، فإن لديها القدرة ليس فقط على الحفاظ على المساحات الموجودة ولكن أيضًا على نقلنا إلى عوالم ثلاثية الأبعاد جديدة تمامًا.
قال خبير ومستثمر AR/VR تيباتات تشينافاسين: “إنه تغيير كبير في قواعد اللعبة”. بصفته أحد المؤسسين والشريك العام لصندوق Venture Reality Fund، فإن Chennavasin لديه مصلحة مالية في نجاح هذه التكنولوجيا. باعتباره مهووسًا وفنانًا ثلاثي الأبعاد سابقًا، فقد وقع في حبها، وشبهها بـ ستار تريك هولوديك، والذي سمح لأفراد الطاقم بالدخول إلى محاكاة ثلاثية الأبعاد للمساحات الحقيقية والخيالية. “لقد بدأنا في الوصول إلى صورة ثلاثية الأبعاد حقيقية.”
إنشاء خريطة ثلاثية الأبعاد للعالم، واحدة تلو الأخرى
إن التقاط الأشياء بتقنية ثلاثية الأبعاد، حتى على هاتفك، ليس بالأمر الجديد. ومع ذلك، اعتمدت معظم الجهود السابقة على المضلعات، وهو نوع من الشبكات المثلثة ذات المظهر السيبراني التي رأيتها إذا كنت قد استخدمت تطبيقًا للواقع المعزز على الهاتف المحمول.
يعد الالتقاط وإعادة البناء ثلاثي الأبعاد القائم على شبكة مضلعة أمرًا جيدًا بما يكفي للكائنات الأساسية ذات الأسطح المسطحة، ولكنه قد يواجه صعوبة في التعامل مع الأنسجة التفصيلية والإضاءة المعقدة. غالبًا ما تبدو الأشياء التي يتم التقاطها بهذه الطريقة لدنة وغير حقيقية، ويبدو دائمًا أن البشر الذين تم التقاطهم بتقنية ثلاثية الأبعاد استخدموا الكثير من الجل بدلاً من الحصول على خصلات شعر فردية. وقال تشينافاسين: “لقد كان الأمر واعدًا في ذلك الوقت، ولكن كان دائمًا يعاني من قيود كبيرة”.
تغير كل ذلك في صيف عام 2023، عندما نشرت مجموعة من العلماء الأوروبيين ورقة بحثية حول شيء أسموه “3D Gaussian splatting”. كان أسلوبهم في حل المشكلة هو التخلص من الشبكات وبدلاً من ذلك التقاط كائنات ثلاثية الأبعاد كمجموعة من النقط الغامضة والشفافة، المعروفة أيضًا باسم Gaussians.
يتم التقاط كل واحدة من هذه النقط بمعلومات دقيقة عن لونها وموقعها ومقياسها ودورانها ومستوى شفافيتها – وعندما تجمع الملايين منها، تحصل على صورة أكثر تفصيلاً لكائن ثلاثي الأبعاد توضح أيضًا تفاصيل كيف يبدو من أي زاوية معينة، وذلك بفضل كل هذه البيانات الإضافية. باستخدام التعلم الآلي، تمكنوا من التقاط الأشياء بمزيد من التفاصيل وبدقة أعلى وعرضها في الوقت الفعلي دون الحاجة إلى أجهزة عرض الرسومات الثقيلة.
وقد أذهلت النتائج الخبراء في هذا المجال على الفور. وقال تشينافاسين: “لقد أتيحت لنا أخيرًا الفرصة للحصول على صور ثلاثية الأبعاد حقيقية”. “إنها لحظة JPEG للحوسبة المكانية.”
يعتقد برايان ماكليندون، نائب الرئيس الأول للهندسة في شركة Niantic، أن الرسومات الغاوسية هي التقدم الأكثر عمقًا في مجال الرسومات ثلاثية الأبعاد منذ أكثر من 30 عامًا. وقال: “إننا نعتبره تغييراً أساسياً”.
“نحن نعتبره تغييرا أساسيا.”
وفقًا لماكليندون، فإن الرش الغاوسي سيؤدي إلى إضفاء الطابع الديمقراطي على الالتقاط ثلاثي الأبعاد – وتريد Niantic أن تكون في طليعة هذا التغيير. بعد الاستحواذ على تطبيق Scaniverse في عام 2021، أضافت Niantic تقنية Gaussian splatting كتقنية التقاط في العام الماضي. في أغسطس، أطلقت إصدارًا جديدًا من Scaniverse الذي يضع الرش في المقدمة والوسط. في أكتوبر، قامت الشركة بفتح تنسيق الملف الخاص بها للبقع. وفي ديسمبر، توسعت خدمة Scaniverse لتشمل الواقع الافتراضي، مما أتاح للمستخدمين النظر إلى البقع الضبابية في سماعات الرأس الخاصة بشركة Meta’s Quest.
لدى Niantic أسبابها الخاصة لدفع الرش. بدأ تطبيق Scaniverse كتطبيق لالتقاط التذكارات الشخصية والأشياء الفردية الأخرى، لكن Niantic يشجع الآن الأشخاص على مسح التماثيل والنوافير وغيرها من نقاط الاهتمام العامة أيضًا. ترى الشركة أن عمليات المسح هذه هي مكونات رئيسية للخريطة ثلاثية الأبعاد للعالم التي تقوم ببنائها – نفس الخريطة التي تدعم بوكيمون جو, الزبرجدوألعاب وتجارب الواقع المعزز الجغرافية المكانية المستقبلية. وقال ماكليندون: “نحن نركز بشكل كبير على الخريطة، ونقوم بمسح وإعادة بناء المناطق الخارجية”.
“لدينا بالفعل مئات الآلاف من هؤلاء [types of scans] قال ماكليندون: “في سكانيفيرس الآن”. “نأمل أن نصل إلى المليون قريبًا.”
تعمل Splats على تغيير التقاط الفيديو ثلاثي الأبعاد
البقع الغوسية ليست مخصصة فقط لالتقاط المحتوى الثابت. تستخدم شركة Gracia AI الناشئة في مجال الرؤية الحاسوبية هذه التكنولوجيا لتسجيل مقاطع فيديو ثلاثية الأبعاد، والتي يمكن مشاهدتها على سماعات الرأس Meta Quest. يُظهر أحد هذه المقاطع طاهٍ يقوم بإعداد وجبة، حيث يتمكن المشاهدون من النظر إلى الحدث من جميع الزوايا في الواقع الافتراضي وحتى تكبير الصورة لمشاهدة سكينه وهو يقطع قطعة لامعة من سمك السلمون النيئ.
سجلت غراسيا هذا الفيديو في استوديو تصوير ثلاثي الأبعاد احترافي، باستخدام مجموعة من 40 كاميرا موجهة نحو الشيف من جميع الزوايا. هذه هي الطريقة التي يسجل بها المحترفون محتوى ثلاثي الأبعاد لتجارب الواقع المعزز والواقع الافتراضي لسنوات – ولكن مرة أخرى، يُحدث الانتقال من المضلعات إلى البقع الغوسية فرقًا كبيرًا.
في السابق، قدم التقاط الفيديو ثلاثي الأبعاد سلسلة من التحديات البصرية التي أدت إلى قواعد لباس صارمة للأفراد الذين تم أسرهم: لا توجد أنماط مزدحمة، ولا شيء شفاف، ولا شيء فضفاض أو متدلي يمكن أن يؤدي إلى قطع أثرية غريبة. عندما أسرت شركة مايكروسوفت ديفيد أتينبورو بهذه الطريقة منذ عدة سنوات، اضطرت إلى لصق طوقه على قميصه واستخدام كميات فاحشة من مثبتات الشعر لتجنب أي أطراف سائبة يمكن أن تفسد عملية الالتقاط.
“إنه لأمر مدهش مقدار المرونة الإبداعية التي تحصل عليها باستخدام البقع الغوسية.”
مع البقع الغوسية، اختفت كل هذه القيود. قال جورجي فيسوتسكي، المؤسس المشارك والرئيس التنفيذي لشركة جراسيا، والذي يعد صندوق Venture Reality Fund التابع لـ Chennavasin من بين مستثمري شركته: “لا توجد قيود على الملابس، ولا توجد قيود على الشعر”. بينما كان الجيل السابق من التقاط الفيديو الحجمي يتطلب كميات هائلة من الضوء لإزالة أي ظلال، تمكنت Gracia من تسجيل المشاهد في ظلام دامس تقريبًا. قال فيسوتسكي: “يمكنك ترك كل الظلال واستخدام الإضاءة الفنية”. “إنه لأمر مدهش مقدار المرونة الإبداعية التي تحصل عليها باستخدام البقع الغوسية.”
هذا لا يعني أنه لا تزال هناك تحديات. في الوقت الحالي، لا تزال مقاطع Gaussian المتناثرة تتطلب 9 غيغابايت من البيانات في الدقيقة الواحدة من الفيديو – وهي كمية كبيرة جدًا للبث أو أي شيء يتجاوز عرضًا تقنيًا قصيرًا. وقال فيسوتسكي إن الشركة تعمل الآن على تقليلها إلى 2-3 غيغابايت في الدقيقة، ويمكن أن تتطلب مقاطع فيديو الواقع الافتراضي بحجم 180 درجة أقل من 1 غيغابايت من البيانات في الدقيقة. وهو يتصور أن هذه الأنواع من المقاطع ستحل في النهاية محل تسجيلات المدربين في تطبيقات تمرين الواقع الافتراضي مثل Supernatural أو المحتوى التعليمي الاحترافي لأنها تسمح للمستخدمين بالنظر إلى التعليمات من جميع الزوايا.
خطط ميتا الطموحة للبقع الغوسية
تم إنشاء أحد العروض التوضيحية الأكثر طموحًا للبقع الغوسية حتى الآن بواسطة Meta. Hyperscape، الذي كشفت عنه الشركة في مؤتمر Meta Connect هذا الخريف، هو تطبيق لسماعات Meta’s Quest التي تتيح للمستخدمين استكشاف عروض ثلاثية الأبعاد واقعية. تم إطلاق التطبيق بستة مساحات ممسوحة ضوئيًا، بما في ذلك خمسة استوديوهات للفنانين وقاعة مؤتمرات في حرم ميتا الذي كان بمثابة مكتب مارك زوكربيرج.
يتيح لك Hyperscape التحرك بحرية في هذه المساحات، وهي تجربة رائعة مع هذا النوع من الدقة البصرية. يمكنك تصفح العديد من الأشياء الغريبة في استوديو سان فرانسيسكو الخاص بفنانة الوسائط المختلطة ديان هوفمان، والذي يضم عددًا لا يحصى من الدمى وصندوقًا يحمل اسم “جلد الثعبان والأصداف”. يمكنك أن تتعجب من مجموعة بورش الواسعة للفنان التشكيلي دانييل أرشام، بل ويمكنك أيضًا إلقاء نظرة على السرخس والأشجار خارج نافذة مكتب زوك السابق. تبدو العروض حقيقية للغاية لدرجة أن ميتا شعرت بأنها مضطرة إلى تضمين تحذير بعدم الاتكاء على أي من الأثاث المصور.
في الوقت الحالي، لا يعد Hyperscape أكثر من مجرد عرض تقني مخصص. ومع ذلك، لدى Meta خطط كبيرة للبقع الغوسية، كما أخبرني Meta Horizon OS وQuest VP Mark Rabkin في Meta Connect هذا الخريف. قال رابكين، في إشارة إلى منصة الواقع الافتراضي الاجتماعية الخاصة بشركة Meta: “تعمل ذبذبات غاوسية بالفعل بالنسبة لنا على محرك يشبه إلى حد كبير محرك Horizon”. “لذا فإن المسار التكنولوجي لتشغيله في عالم ما هو قصير جدًا.”
تتصور Meta أن تكون أداة أخرى لمبدعي الواقع الافتراضي لبناء عوالم وتجارب غامرة عوالم الأفق. لدى الشركة أيضًا خطط للسماح لأي شخص في النهاية بمسح منزله ثم تحميل نسخة رقمية منه إلى metaverse. قال رابكين: “بالتأكيد”. “وهذا ما نعمل من أجله.”
“هل لديهم طريق لتوسيع نطاق ذلك؟ لا أعرف.”
من غير الواضح كم من الوقت سيستغرق هذا العمل، وما إذا كان عوالم الأفق سوف يبقى في شكله الحالي حتى ذلك الحين هو سؤال آخر تماما. رفضت Meta المشاركة في مقابلات المتابعة لهذه القصة، لكن McClendon من Niantic حذر من عدم التقليل من تعقيد بناء أداة مسح مثل Hyperscape.
وقال مكليندون: “لقد أنتجوا بشكل أساسي رؤية مثالية”. واقترح أن يقوم Meta على الأرجح بدمج عمليات مسح متعددة لكل غرفة وربما قام أيضًا بقدر كبير من التحرير والتنظيف اليدوي. وبما أن عمليات الفحص الناتجة أكبر من أن تتم معالجتها في الوقت الفعلي على الجهاز، فإن Meta يعرضها في السحابة ويبثها مباشرة إلى سماعات الرأس.
قال ماكليندون: “هذا ليس مقياسًا، لكنه يبدو جيدًا حقًا”. “هل لديهم طريق لتوسيع نطاق ذلك؟ لا أعرف.”
لقطة واضحة لهولوديك
يتقدم تطوير تقنية الرش الغاوسي بوتيرة سريعة. أخبرني ماكليندون أن السرعة التي تظهر بها الأبحاث العلمية الجديدة حول هذا الموضوع تعكس سرعة أبحاث الذكاء الاصطناعي التوليدية. وقال: “يتم نشر الأوراق بسرعة كبيرة في الوقت الحالي”. “الإثارة حقيقية.” وقال تشينافاسين إن التكنولوجيا التي يطورونها يتم تنفيذها بسرعة. “أو تحولت إلى شركات ناشئة.”
أحد المجالات الجاهزة لتحقيق اختراق هو الجمع بين الضربات والذكاء الاصطناعي. يمكن للذكاء الاصطناعي التوليدي أن يحسن التقاط وعرض البقع الغوسية، مما قد يسمح لشركة مثل Gracia AI بالتقاط مقاطع فيديو باستخدام عدد أقل بكثير من الكاميرات. وفي الوقت نفسه، سيؤدي عدد أكبر من الأشخاص الذين يلتقطون كائنات ومشاهد ثلاثية الأبعاد إلى زيادة كبيرة في كمية بيانات التدريب عالية الجودة لنماذج الفيديو ثلاثية الأبعاد التوليدية.
“هذا لا يحدث بين عشية وضحاها. لكنها لقطة واضحة الآن.”
يشير كل هذا إلى مستقبل حيث سيتمكن الأشخاص العاديون من إنشاء مساحات ثلاثية الأبعاد واقعية باستخدام مطالبات الذكاء الاصطناعي، أو التقاطات ضبابية، أو مزيج من الاثنين معا، ثم دخول تلك المساحات باستخدام سماعات الواقع الافتراضي أو نظارات الواقع المعزز.
قال تشينافاسين: “التطبيق القاتل لـ XR هو عبارة عن لعبة ثلاثية الأبعاد متعددة اللاعبين”. “إن الذكاء الاصطناعي التوليدي والبقع الغوسية هي الطريقة التي ننشئها بدقة بصرية لا يمكن تمييزها تقريبًا عن الواقع. هذا لا يحدث بين عشية وضحاها. لكنها لقطة واضحة الآن.”
مثل هذا المستقبل في متناول اليد يثير السؤال: إذا كان لديك هولوديك، ما الذي ستزوره أولاً؟ عروض صور واقعية لأماكن بعيدة لم تتح لك الفرصة للسفر إليها بعد؟ استوديوهات التسجيل الشهيرة والمتاحف والمكتبات؟ أو بالأحرى، عوالم رائعة مثل قلاع القرون الوسطى أو الزنزانات أو مجموعات أفلام Marvel؟
بالنسبة لي، قد يكون مجرد منزل أمي الصغير المريح ومقعد الحديقة المتهالك.