هل يمكن فهم طريقة تفكير الذكاء الاصطناعي؟
12/05/2026





سيرياستيبس 

يتبع الباحثون مجموعة من الأساليب التجريبية في مجال تفسير النماذج اللغوية، تهدف إلى عزل وتحديد أجزاء النموذج المسؤولة عن سلوك أو مهمة معينة. والهدف النهائي هو بناء خرائط دارات شاملة تفسر السلوكيات المعقدة كالاستدلال أو الإبداع أو التحيز أو الخداع، مما يؤدي إلى الوصول إلى نماذج أكثر أماناً وشفافية وقابلية للتحكم.

منذ ظهورها الأول، رافق النماذج اللغوية سؤال جوهري: ماذا تستطيع هذه النماذج أن تفعل؟ أما اليوم، ومع الطفرة النوعية في قدرات نسخها الحديثة، في الكتابة والترجمة والاستنتاج، انزاح التركيز نحو سؤال مختلف تماماً يسبر أغوار آلية عملها وهو، كيف تصنع قراراتها؟

فعلى رغم براعتها، ظلت النماذج تعامل تقنياً كصندوق أسود، مدخلات ومخرجات يكتنف ما بينهما عالم مجهول، نرى نتائجه من دون إدراك العمليات الحيوية داخل الشبكات العصبية أثناء توليد الإجابة.

جذور المفهوم
في أواخر العقد الماضي، اتجه الباحثون لدراسة الشبكات العصبية بمنهجية علم الأحياء، عبر تتبع الوحدات الصغيرة ووظائفها. وأسفرت هذه الدراسات عن اكتشاف تخصصات محددة للعصبونات داخل نماذج الصور، تتنوع بين اكتشاف الحواف أو الألوان أو الأنماط الهندسية. لاحقاً، تبلورت فكرة مفادها أن هذه الوحدات لا تعمل بمنأى عن بعضها، بل ضمن "دارات" مترابطة تؤدي وظيفة متكاملة، ومع ظهور معمارية "المحولات" (Transformers) انتقل هذا المنهج إلى اللغة، حيث شرع باحثو شركة "أنثروبيك" في رسم خرائط لدارات مسؤولة عن مهام فرعية داخل النموذج، ليترسخ مفهوم "الدارة"، بوصفه أداة للهندسة العكسية تهدف لفهم البنية الداخلية للذكاء الاصطناعي.

واليوم تعتمد جميع النماذج اللغوية الكبيرة الحديثة القائمة على المحولات على هذه التقنية، إذ تعتبر الدارات اللبنات الأساسية التي تفسر سلوك النموذج.

عقل الشبكة
لا يعمل الذكاء الاصطناعي بموجب قواعد لغوية جامدة، بل عبر ملايين العمليات الحسابية المتوازية التي تشكل في مجموعها الدارات، والدارة في هذا السياق مفهوم نظري متطور يفكك كيفية معالجة المعلومات داخل النموذج على مستوى المكونات التفاعلية، فهي ليست أسلاكاً نحاسية، بل مجموعة فرعية من العصبونات والروابط التي تتعاون بصورة متناغمة لتنفيذ مهمة محددة، كإدراك صيغ الجمع أو ربط الضمائر أو الاستدلال السببي. وتتضمن هذه الشبكة "رؤوس انتباه" تعمل بمثابة رادارات تتيح للنموذج التركيز على أجزاء محددة في الجملة لفهم السياق.

كيف تفكر النماذج اللغوية
تعد الدارة في الأصل جزءاً من طموح علمي يهدف إلى فهم العمليات الداخلية للشبكات العصبية عبر تحليل الآليات الموجودة في حاسباتها، والهدف منها معرفة كيف ولماذا يتخذ النموذج قراراً ما ولماذا ينتج مخرجات معينة، إضافة إلى اكتشاف أسباب الفشل وإصلاح أخطاء محددة عبر تعديل الدارة الخاطئة، أو تحديد دوائر مسؤولة عن تحيزات أو سلوكيات ضارة وإضعافها، وبناء نماذج أكثر كفاءة وموثوقية بناءً على الفهم العملي.



ومع توسع أبحاث "قابلية التفسير الآلي" تحولت دراسة الدارات إلى أحد أهم ميادين أبحاث الذكاء الاصطناعي المعاصر، كونها الطريق الأقصر لفهم النماذج وضبطها ومنع أخطارها.

وقبل أن ننتقل إلى شرح أعمق، سنقف أولاً عند مفهوم رؤوس الانتباه كواحدة من أهم مكونات هذه الدارات، فهي البوصلة التي تسمح للنموذج بتحديد الكلمات أو الرموز الأكثر أهمية أثناء القراءة، وقد اكتشف الباحثون وجود رؤوس متخصصة في وظائف محددة مثل تتبع الأسماء والتعرف إلى علامات الاقتباس وإكمال الأنماط الرياضية ومتابعة تسلسل الجمل، وهذه الرؤوس حين تتضافر، تشكل دارات وظيفية كاملة، فعند معالجة جملة مثل "استقلت لين سيارة لأن سيارتها معطلة"، تستنفر رؤوس "تتبع العلاقات المرجعية" لربط الضمير في "سيارتها" بـ"لين" بدقة.

ولمعرفة ما تخفيه هذه الدارات، ابتكر الباحثون أساليب تجريبية للنفاذ إلى داخل الشبكة أبرزها ما يعرف بـ"تتبع الدارة".

خرائط التفكير
تتبع الدارة أشبه برسم خريطة للدوائر الكهربائية أثناء العمل الذهني، فأثناء اكتشاف المسار الداخلي الذي أدى إلى نتيجة معينة، يتبع الباحثون مجموعة من الأساليب التجريبية في مجال تفسير النماذج اللغوية، تهدف إلى عزل وتحديد أجزاء النموذج المسؤولة عن سلوك أو مهمة معينة. والهدف النهائي هو بناء خرائط دارات شاملة تفسر السلوكيات المعقدة كالاستدلال أو الإبداع أو التحيز أو الخداع، مما يؤدي إلى الوصول إلى نماذج أكثر أماناً وشفافية وقابلية للتحكم.

فإذا قدم النموذج إجابة خاطئة أو خطرة، يحاول الباحث تتبع الرؤوس والعصبونات المشاركة في إنتاجها باستخدام أدوات عدة منها "وسم التنشيط" (Activation Patching)، وهي تقنية أكثر دقة من التعطيل، فبدلاً من إيقاف المكون نقوم باستبدال "قيم التنشيط" (Activations) في مكون ما أثناء معالجة جملة ما، بقيم من معالجة جملة مرجعية.

تخيل أنك أمام لوحة تحكم كهربائية عملاقة، وهناك مصباح أحمر يضيء، أنت لا تعرف أي مفتاح هو المسؤول عن إضاءته، تبدأ باستبدال الأسلاك واحداً تلو الآخر من لوحة ثانية، وحين يتحول لون المصباح إلى الأخضر، تكون قد وصلت إلى المفتاح الذي تبحث عنه.

هذا بالضبط ما تفعله تقنية "وسم التنشيط" داخل النموذج اللغوي.

وسم التنشيط
ولنقرب الصورة، لنتأمل كيف يميز النموذج بين المذكر والمؤنث، من طريق تشغيل جملتين متطابقتين في بنيتهما مع اختلافهما في النوع، الأولى مرجعية "المهندس في المكتب، يرسم المخطط"، والثانية اختبارية "المهندسة في المكتب، ترسم المخطط". والتحدي هنا يكمن في معرفة أين تخزن معلومة أن "المهندس" مذكر بالضبط داخل طبقات النموذج (ما يجعل النموذج يختار الضمير "هو" وليس "هي")، ولإنجاز هذه المهمة نشغل الجملة الأولى المرجعية (المهندس... هو) ونسجل جميع تنشيطاتها في كل الطبقات، ثم تشغل الجملة الثانية الاختبار (المهندسة... هي)، وعند الطبقة المحددة، نستبدل قيم تنشيط تلك العصبونات ونضع مكانها التنشيطات التي سجلناها من جملة (المهندس).


وعي الآلة ليس أخطر ما في الذكاء الاصطناعي
ما يكشفه هذا الاختبار بالغ الأهمية، إن بقي النموذج على اختياره للضمير المؤنث، على رغم الاستبدال، فهذا يعني أن تلك الطبقة لا علاقة لها بتحديد النوع، بل هي مجرد ممر للمعلومات، وإن تحول فجأة إلى الضمير المذكر، نكون قد وضعنا يدنا على المكان الذي يخزن فيه النموذج الفرق بين "هو" و"هي"، وعلى الدارة المسؤولة عن تحويل المبتدأ إلى ضمير مذكر.

وعبر هذا الوسم التدريجي، طبقة بعد طبقة ورأساً تلو الآخر، توصل الباحثون إلى نتيجة لافتة، أن معلومة النوع لا تعالج عشوائياً في كل أرجاء الشبكة، بل في مسارات ضيقة جداً، وأن هناك رؤوساً محددة تؤدي وظيفة واحدة، هي نقل تلك المعلومة من الاسم إلى موضع الضمير.

وفي النهاية تكشف فكرة الدارة داخل النماذج اللغوية الكبيرة عن تحول جوهري في طريقة تعامل البشر مع الذكاء الاصطناعي، فبعد أعوام من التركيز على بناء نماذج أكثر قوة، بدأ الاهتمام يتجه نحو فهم ما يحدث داخلها فعلاً، في محاولة لإيجاد لغة جديدة لوصف التفكير الاصطناعي نفسه.

هي محاولة للوقوف على الجسر الواصل بين الرياضيات المجردة والسلوك الظاهر، بين الأوزان الرقمية والقرارات التي تتخذها النماذج في سعي لفهم العقل الاصطناعي قبل أن يتجاوز قدرتنا على استيعابه.

اندبندنت عربية 



المصدر:
http://www.syriasteps.com/index.php?d=145&id=205623

Copyright © 2006 Syria Steps, All rights reserved - Powered by Platinum Inc