في نهاية مغامرات أليس في بلاد العجائب -وتحديدا في كتاب “خلال المرآة وما وجدته أليس هناك”- قال “هامتي دامتي” بازدراء “عندما أستخدم كلمة، فإنها تعني فقط ما أردت أن أعنيه، لا أقلّ ولا أكثر”. فتجيبه أليس قائلة “إذن، فالسؤال يتعلق بمدى تَمكُنك من أن تجعل الكلمات تعني أشياء كثيرة مختلفة”.
تحمل الكلمات معاني كثيرة، وهو ما يعرف باسم “الغموض الدلالي” (Semantic ambiguity). ويتَعيّن على العقل البشري تحليل شبكة معقدة من المعلومات واستخدام الحدس الصحيح حتى يدرك المعاني الدقيقة المقصودة بهذه الكلمات.
وتستطيع محركات البحث اليوم وتطبيقات الترجمة وكذلك المساعدون الصوتيون إدراكَ وفهم ما نعنيه، ويرجع الفضل في ذلك إلى برامج معالجة اللغة التي تعطي معنى لعدد مذهل من الكلمات، دون أن نخبرها صراحة بما تعنيه هذه الكلمات. وتستنتج تلك البرامج المعنى من خلال الإحصاءات والخوارزميات التي تستخدمها.
ولكننا الآن أمام عصر جديد من الذكاء الاصطناعي تمكنت فيه الآلة والحاسوب من فهم معطيات معقدة وتحليلها والتنبؤ بمآلاتها المستقبلية. وهنا تظهر مشكلة معقدة أخرى تتعلق بمعاني الكلمات التي يفهمها الذكاء الاصطناعي: هل يمكنه التعرف على معانٍ مختلفة للكلمات؟
ولهذا، يدرس العلماء ما إن كان بإمكان الذكاء الاصطناعي محاكاة العقل البشري في فهم الكلمات بالطريقة نفسها التي يفهمها البشر.
ذكاء اصطناعي يحاكي البشر
وطبقا للبيان الصحفي الذي نشرته جامعة كاليفورنيا، فقد أفادت الدراسة بأن أنظمة الذكاء الاصطناعي يمكنها بالفعل تعلم معانٍ معقدة للغاية. كما أشارت الدراسة إلى أن نظام الذكاء الاصطناعي الذي تمت دراسته استطاع ترميز معاني الكلمات بطريقة وثيقة الصلة بالتقديرات البشرية لدلالات هذه الكلمات.
ومن ثم فإن هذا النهج أمكنه تخصيص معلومات عديدة لكل كلمة مفردة تماما مثل الدماغ البشري، وذلك طبقا لما أورده البيان الصحفي لمعهد ماساشوستس للتكنولوجيا.
وتستمد نماذج اللغة المعنى من خلال تحليل عدد المرات التي اقترن فيها أزواج الكلمات في النصوص المختلفة. ومن ثم تستخدم هذه النماذج تلك العلاقات لتقييم أوجه الشبه بين معاني الكلمات.
وعلى سبيل المثال، تستنتج هذه النماذج أن كلمة “خبز” وكلمة “تفاح” أكثر تشابها مع بعضهما بعضا، مقارنة بتشابهها مع كلمة “دفتر الملاحظات”. ذلك لأن “الخبز” و”التفاح” غالبا ما يقترنان بكلمات أخرى مثل “أكل” أو “وجبة خفيفة”، وذلك على النقيض من كلمة “دفتر الملاحظات” التي لا تقترن معهما.
اختبار فهم نماذج اللغة للكلمات
وقد كانت النماذج جيدة بشكل جلي في قياس التشابه العام للكلمات مع بعضها بعضا. ولكن غالبية الكلمات تحمل أنواعا عديدة من المعلومات، وتعتمد أوجه التشابه بينها على نوعية تقييمها.
ويذكر غابرييل جراند، قائد الدراسة من معهد ماساشوستس، أنه “بإمكان البشر ابتكار مقاييس عقلية مختلفة تساعدهم على تنظيم فهمهم للكلمات. فعلى سبيل المثال، قد تكون الدلافين والتماسيح متشابهة في الحجم، إلا أن أحدهما يعد أخطر بكثير من الآخر”.
حاول الفريق معرفة ما إذا كانت النماذج قادرة على التقاط تلك الفروق الدقيقة كما يفعل البشر. ولو كانوا كذلك، فكيف تنظم هذه النماذج المعلومات؟
ولمعرفة الكيفية التي تترتب بها الكلمات في هذا النموذج مع الفهم البشري للكلمات، طلب الفريق من متطوعين بشر تصنيف الكلمات وفقا لمقاييس مختلفة (المقاييس الدلالية): مثل هل كانت المفاهيم التي تحملها الكلمات “كبيرة أم صغيرة”، “آمنة أم خطرة”، “رطبة أم جافة” إلخ؟ وبعد أن حدد المتطوعون المكان الدقيق لهذه الكلمات طبقا لتلك المقاييس، حاول الباحثون معرفة ما إذا كانت نماذج معالجة اللغة تفعل الشيء ذاته.
ويشير جراند إلى أن نماذج معالجة اللغة تستخدم إحصاءات التكرار لتنظيم الكلمات في مصفوفة ضخمة متعددة الأبعاد. فكلما كانت الكلمات متشابهة مع بعضها بعضا في بعض المقاييس، اقتربت من بعضها داخل المصفوفة.
مصفوفات شاسعة الأبعاد
ويذكر أن أبعاد مساحة هذه المصفوفة شاسعة، ولا يوجد معنى متأصل لهذه الكلمات في بنية المصفوفة. ويضيف جراند أن هناك “مئات الأبعاد لبعض الكلمات المدمجة في المصفوفة، وليس لدينا أي فكرة عما تعنيه هذه الأبعاد”.
وقد نظر العلماء للمقاييس الدلالية التي طُلِب من المتطوعين تصنيف الكلمات وفقا لها، وسألوا أنفسهم إن كانت هذه المقاييس ممثلة أيضا في نماذج معالجة اللغة. فعلى سبيل المثال، تحرى الفريق موقع الدلافين والنمور في مقياس “الحجم”، ثم قارنوا المسافة بينهما مع المسافة في مقياس “الخطر”.
ومن خلال أكثر من 50 مجموعة من التصنيفات والمقاييس الدلالية، استنتج الباحثون أن نماذج معالجة اللغة قد رتبت الكلمات بشكل يشبه إلى حد كبير ما يفعله البشر. فقد صنفت النماذجُ الدلافينَ والنمور بأنها متشابهة من حيث “الحجم”، بينما كانا متباعدين على مقياس “الخطر” و”الرطوبة”. ونظّم نموذج معالجة اللغة الكلمات بطريقة تمنحها أنواعا مختلفة من المعاني، وقد فعل ذلك بشكل كامل استنادا إلى تكرار الكلمات في سياق النصوص التي تعلّم منها.
ومن الملفت للنظر أن نموذج معالجة اللغة صنف اسمي “بيتي” و”جورج” على أنهما متشابهان من ناحية مقياس “القِدَم”، في حين كانا متباعدين على مقياس “الجنس”. كما صنف النموذج كلمة “رفع أثقال” وكلمة “مبارزة” بأنهما متشابهان في كون كليهما رياضات “داخلية”، في حين كانوا مختلفين من حيث مقدار الذكاء المطلوب.
ويشير الفريق إلى أن هذا الأمر يوضح لنا قوة اللغة. فمن خلال هذه الإحصاءات البسيطة يمكننا استعادة كثير من المعلومات الدلالية الغنية، مما يوفّر مصدرا قويا لمعرفة الأشياء التي قد لا يكون لدينا أي خبرة إدراكية مباشرة حيالها.”الجزيرة”