




يقود مهندس التعلم الآلي (LLM) تطوير نماذج الذكاء الاصطناعي التي تركز على المهام اللغوية. في هذا المشروع، يقوم بتصميم وضبط النماذج الكبيرة للغة (LLMs) لتفسير لوائح البناء وترجمتها إلى تنسيق يمكن للحاسوب معالجته (مرحلة "استخراج القواعد" في التحقق من الامتثال) mdpi.com. وسيعمل على سد الفجوة بين النصوص غير المنظمة (الكودات، المعايير) والبيانات المنظمة لنماذج معلومات البناء (BIM) من خلال تمكين فهم اللغة الطبيعية للقواعد. ويضمن هذا الدور أن الجمل التنظيمية المعقدة والمتداخلة يمكن للنظام فهمها وربطها ببيانات تعريف النموذج (BIM) لإجراء استعلامات تلقائية. ### **المهام الرئيسية:** * **تفسير نصوص اللوائح:** تطوير وتحسين خطوط أنابيب تعتمد على النماذج الكبيرة للغة (LLMs) لتحليل وفهم النصوص التنظيمية (مثل كودات البناء، المعايير، إلخ)، واستخراج الشروط والمطالب الأساسية. على سبيل المثال، تنفيذ نماذج تعتمد على الموجهات أو الضبط الدقيق (مثل GPT-4) لاستخراج قواعد منظمة من النصوص باستخدام مثال واحد أو أمثلة قليلة mdpi.com. * **تأطير القواعد رسمياً:** تحويل اللوائح المفسرة إلى تمثيلات منظمة (مثل مجموعات كائن-خاصية-شرط-قيمة أو عبارات منطقية) يمكن لمحرك الامتثال استخدامها mdpi.com mdpi.com. ويشمل ذلك تحديد المخطط أو التصنيفات لمكونات القواعد (مثل ما هو العنصر الخاضع للوائح، ما هي الخاصية، المؤثر الشرطي، والقيمة المطلوبة). * **الاستعلام عبر IFC باستخدام معالجة اللغة الطبيعية (NLP):** تمكين النظام من الاستعلام عن بيانات تعريف IFC الخاصة بنموذج البناء (BIM) باستخدام مدخلات لغة طبيعية أو القواعد المستخرجة. وتصميم أساليب تمكن النموذج الكبير للغة (LLM) من ربط متطلبات القواعد بالكيانات والسمات المحددة في IFC. على سبيل المثال، إذا كانت القاعدة تنص على أن "مساحة غرفة المعيشة يجب أن تكون 10 م²"، فتأكد من أن النموذج قادر على تحديد الكائنات من نوع IfcSpace التي تمثل *غرفة المعيشة* واسترجاع خاصية المساحة الخاصة بها. * **التعاون في نماذج المعرفة:** العمل بشكل وثيق مع المهندسين الحاسوبيين ومهندسي النمذجة المعلوماتية للبناء (BIM) لمواءمة مخرجات النموذج الكبير للغة (LLM) مع مخطط بيانات BIM وأساسياته. وضمان تطابق المصطلحات الواردة في اللوائح مع أسماء الفئات أو الخصائص الصحيحة في IFC (مثل ربط مصطلح "ارتفاع السقف" بالسمة الصحيحة في IFC). * **دمج النموذج:** دمج النموذج الكبير للغة (LLM) في خط الأنبوب الكلي، مع استخدام تقنية توليد مدعوم باسترداد المعلومات لجلب المعلومات النموذجية ذات الصلة. على سبيل المثال، استخدام النموذج الكبير للغة (LLM) لتوليد استعلامات أو عوامل تصفية لقاعدة بيانات نموذج BIM بناءً على شرط تنظيمي. * **الاختبار والتحسين:** تقييم تفسيرات النموذج الكبير للغة (LLM) مقابل عينات من اللوائح والنتائج المتوقعة. وتحسين الموجهات، أو بيانات التدريب، أو معايير النموذج لزيادة الدقة في التقاط نية اللوائح. ومعالجة الحالات الشاذة حيث تكون اللوائح غامضة أو تحتوي على شروط متداخلة، وضمان قدرة النموذج الكبير للغة (LLM) على التعامل مع هياكل الجمل المعقدة mdpi.com. ### **المهارات والمؤهلات المطلوبة** * **معالجة اللغة الطبيعية (NLP):** خلفية قوية في معالجة اللغة الطبيعية والنماذج اللغوية، مع خبرة في النماذج الكبيرة للغة (LLMs) القائمة على المحولات (مثل GPT، BERT، إلخ). وفهم لتقنيات هندسة الموجهات والضبط الدقيق للمهام اللغوية الخاصة بمجال معين. * **معرفة المجال التنظيمي:** القدرة على فهم لوائح البناء أو الاستعداد لتعلم المصطلحات. والارتياح في التعامل مع النصوص القانونية/الفنية واستخراج المعاني منها. * **البرمجة وأطر التعلم الآلي:** إتقان لغة بايثون ومكتبات التعلم الآلي (TensorFlow/PyTorch، HuggingFace Transformers). والقدرة على كتابة نصوص لأغراض معالجة البيانات (تنظيف النصوص، التجزئة) وتنفيذ خطوط أنابيب الاستدلال. * **هياكل البيانات والاستعلام:** المعرفة بالتنسيقات المنظمة مثل JSON أو XML أو غيرها لإخراج القواعد. وفهم أساسي لقواعد البيانات أو هياكل الرسوم البيانية ميزة إضافية، لمساعدة صياغة كيفية هيكلة استعلامات بيانات BIM. * **المهارات التحليلية:** مهارات تفكير منطقي ممتازة لتصميم مخططات القواعد والتحقق من أن مخرجات النموذج الكبير للغة (LLM) تتماشى مع المنطق الواقعي. والانتباه للتفاصيل في التعامل مع الوحدات، العتبات، والمنطق الشرطي المستخلص من اللوائح. * **التعاون:** مهارات اتصال جيدة للعمل مع مهندسين من تخصصات أخرى (الهندسة، الخلفية) وضمان أن مخرجات نموذج اللغة قابلة للاستخدام في سياقاتهم. ### **الخبرات المفضلة** * **مشاريع سابقة مع النماذج الكبيرة للغة (LLMs):** خبرة في تنفيذ نموذج كبير للغة في تطبيق عملي، مثل نظام سؤال-إجابة أو مشروع تحويل نص إلى بيانات منظمة. على سبيل المثال، بناء روبوت محادثة أو مساعد ذكاء اصطناعي كان عليه تفسير تعليمات المستخدم. * **معالجة اللغة الطبيعية (NLP) الخاصة بالمجال:** خلفية في معالجة اللغة الطبيعية في مجالات الهندسة المعمارية والبناء والتشييد (AEC) أو مجالات منظمة مشابهة (التمويل، الرعاية الصحية) حيث تكون لغة الامتثال مهمة. * **أساسيات المعرفة / الرسوم البيانية للمعرفة:** خبرة في تمثيل المعرفة (الأساسيات، رسوم RDF البيانية) خاصة فيما يتعلق بربط اللغة بالبيانات. ويمكن أن يساعد ذلك في مواءمة مصطلحات اللوائح مع كيانات BIM (مثل ربط مصطلح "غرفة" بكائن IfcSpace). * **التحقق الآلي من الامتثال:** أي خبرة سابقة بالتحقق الآلي من القواعد في نماذج معلومات البناء (BIM) أو المجالات ذات الصلة، مثل المعرفة بأدوات مثل Solibri، أو محركات القواعد (حتى لو لم تكن تعتمد على التعلم الآلي). يمكن أن يكون فهم كيفية ترميز القواعد وفحصها في الأنظمة الحالية ذا قيمة. * **التعلم من أمثلة قليلة وضبط الموجهات:** خبرة مثبتة في تقليل احتياجات بيانات التدريب من خلال استخدام النماذج المسبقة التدريب بشكل فعال mdpi.com – على سبيل المثال، صياغة موجهات فعالة لنماذج على غرار GPT أو استخدام تقنيات مثل ضبط الموجهات أو الضبط الدقيق باستخدام مجموعات بيانات صغيرة.


