

مرحبًا بكم في سلسلة «أفضل ما قدمه مؤتمر نوريبس»، وهي تذكرة افتراضية تتيح لكم الوصول إلى بعض الأبحاث والرؤى والابتكارات الرائدة التي ميّزت هذا المؤتمر. وبث مباشر من المؤلفين إليكم. 14 يناير 2025 9 صباحًا بالتوقيت الهادئ عبر الإنترنت. **[سجّل حضورك عبر برنامج زوم!](https://voxel51.com/events/best-of-neurips-january-14-2026)** **إيجوإكسور: مجموعة بيانات غرفة العمليات ذات المنظور الذاتي والمحيطي لفهم النشاط الجراحي** تتطلب غرف العمليات (ORs) تنسيقًا دقيقًا بين الجراحين والممرضين والمعدات في بيئة سريعة الوتيرة وغزيرة التعتيم، مما يستدعي نماذج إدراك متقدمة لتعزيز السلامة والكفاءة. وتوفّر مجموعات البيانات الحالية إما مناظر ذات منظور ذاتي جزئي أو سياقًا متعدد المناظر من منظور خارجي متباعد، دون استكشاف التكامل الشامل لكلا المنظورين معًا. ونقدّم هنا «إيجوإكسور»، وهي أول مجموعة بيانات خاصة بغرف العمليات ومجموعة معايير تقييم مصاحبة لها تدمج المنظور الشخصي (الأول) والمنظور الخارجي (الثالث). وتشمل هذه المجموعة ٩٤ دقيقة (٨٤٬٥٥٣ إطارًا بمعدل ١٥ إطارًا في الثانية) من عمليتين جراحيتين مُحاكاتين في مجال جراحة العمود الفقري، وهما: إدخال الإبرة بتوجيه الموجات فوق الصوتية، وجراحة العمود الفقري التنظيرية الأقل توغلًا. وتدمج «إيجوإكسور» بيانات ذات منظور ذاتي (صور RGB، وتتبع اتجاه النظر، وتتبع اليدين، والصوت) من نظارات قابلة للارتداء، وصور RGB وعمق من كاميرات RGB-D ذات منظور خارجي، بالإضافة إلى صور الموجات فوق الصوتية. كما توفّر تسميات رسومية تفصيلية للمشهد تشمل ٣٦ كيانًا و٢٢ علاقةً (٥٦٨٬٢٣٥ ثلاثية)، ما يمكّن من نمذجة قوية للتفاعلات السريرية ويدعم مهامًا مثل التعرّف على الإجراءات والإدراك المرتكز على الإنسان. ونقيم أداء نموذجين معدّلين من أحدث النماذج في توليد الرسوم البيانية السريرية للمشهد، ونقدّم خط أساس جديدًا يستفيد بشكل صريح من الإشارات المتعددة الوسائط والمتعددة المنظورات التي توفّرها «إيجوإكسور». وهذه المجموعة الجديدة من البيانات ومجموعة المعايير المرافقة لها تضع أساسًا جديدًا لإدراك غرف العمليات، وتوفّر مصدرًا غنيًّا ومتعدد الوسائط لتقنيات الإدراك السريري من الجيل القادم. *عن المحاضر* [إيجي أوزسوي](https://www.linkedin.com/in/ege-%C3%B6zsoy-020a5462/) طالب دكتوراه في السنة الأخيرة، ويبحث في رؤية الحاسوب متعددة الوسائط ونماذج الرؤية–اللغة لفهم المشهد الجراحي، مع تركيز خاص على الرسوم البيانية الدلالية للمشهد، وتوظيف الوسائط المتعددة، ونمذجة المنظور الذاتي والمحيطي في غرف العمليات. **سانسا: الكشف عن الدلالات الكامنة في نموذج «سيغمنت أنيثينغ ٢» لتفكيك الأجزاء في حالات التعلّم القليل العيّنات** يتطلّب تفكيك الأجزاء في حالات التعلّم القليل العيّنات التعرّف على فئات كائنات جديدة انطلاقًا من عدد ضئيل جدًّا من الأمثلة المُعلَّبة، وهو ما يتطلّب كلًّا من توليد أقنعة دقيقة وإقامة ارتباط بصري قوي. وعلى الرغم من أن نموذج «سيغمنت أنيثينغ ٢» (SAM2) يوفّر تقسيمًا قائمًا على المطالبات وقدرات ممتازة لمطابقة الميزات المدمجة، فإن تمثيلاته تكون متشابكة مع إشارات محددة لمهمة التتبع، ما يحدّ من القدرة على التعميم الدلالي على المستويات العليا. ونبيّن أن نموذج SAM2 لا يزال يضم بنية دلالية كامنة غنية رغم تدريبه على نحو لا يراعي الفئة. وللاستفادة من هذه البنية، قدّمنا إطار عمل «سانسا» الخفيف الوزن الذي يجعل هذه البنية واضحة ويعمل على تكييف نموذج SAM2 لتفكيك الأجزاء في حالات التعلّم القليل العيّنات مع أقل تعديلات ممكنة. ويحقّق «سانسا» أداءً تعميميًّا رائدًا في المجال، ويتفوّق على أساليب السياق العامة، ويدعم المطالبات المرنة، ويظل أسرع بكثير وأصغر حجمًا من الأساليب السابقة. *عن المحاضر* [كلاوديا كوتانو](https://www.linkedin.com/in/claudia-cuttano/) طالبة دكتوراه في مختبر فاندال بمعهد البوليتكنيكو في تورينو، وتنفذ حاليًّا زيارة بحثية في معهد تكنولوجيا دارمشتات (TU Darmstadt) ضمن مختبر الاستنتاج البصري تحت إشراف البروفيسور شتيفان روته. وتركّز أبحاثها على التجزئة الدلالية، وبخاصة فهم المشهد متعدد الوسائط واستخدام النماذج الأساسية في مهام الرؤية على مستوى البكسل. **التعلّم المتداخل: وهم هندسات التعلّم العميق** نقدّم «التعلّم المتداخل» (NL)، وهو نموذج تعلّم جديد للتعلّم المستمر ينظر إلى نماذج التعلّم الآلي وعملية تدريبها على أنها عبارة عن مجموعة من مشكلات التحسين المتداخلة و/أو المتوازية، وكل منها يمتلك تدفق سياق خاصًّا به، وتكرار تحديث خاصًّا به، وخوارزمية تعلّم خاصة به. وبناءً على هذا النموذج، صمّمنا هندسة جديدة سمّيناها «هوبي» (Hope)، وهي قادرة على التعلّم المستمر وكذلك على تعديل نفسها عند الحاجة. *عن المحاضر* [علي بهروز](www.linkedin.com/in/alibehrouz) طالب دكتوراه في قسم علوم الحاسوب بجامعة كورنيل، ومتدرب باحث في شركة جوجل ريسيرش. وتشمل أبحاثه مواضيع تراوح بين هندسات التعلّم العميق والتعلّم المستمر وعلم الأعصاب، وقد نُشرت في مؤتمرات نوريبس، آي سي إم إل، كي دي دي، دبليو دبليو دبليو، تشيل، في إل دي بي، وغيرها. ونالت أعماله جائزتي أفضل ورقة بحثية، وجائزة تقدير لأفضل ورقة بحثية، وترشيحًا لأفضل ورقة بحثية، بالإضافة إلى عروض شفهية وعروض بارزة.
