أثرت قدرة الذكاء الاصطناعي على كتابة المقالات وحل المعادلات الرياضية بسرعة كبيرة دهشة الكثيرين. ومع ذلك، فإن هذه الأنظمة الذكية المذهلة قد تتعثر في مهام بسيطة بشكل مفاجئ، مما يذكرنا بأنها ليست بشرية تمامًا.
واحدة من أبرز نقاط ضعف الذكاء الاصطناعي تكمن في فهم المفاهيم الأساسية مثل الحروف والمقاطع. على سبيل المثال، فشلت العديد من نماذج اللغة الكبيرة في تحديد عدد مرات ظهور حرف "R" في كلمة "Strawberry".
تعتمد هذه النماذج على بنية تسمى "المحولات" (Transformers)، والتي تقوم بتحويل النص إلى رموز عددية. هذه الرموز تمثل الكلمات أو المقاطع أو الحروف، ولكنها لا تحتوي على معلومات حول الحروف الفردية.
وأوضح ماثيو غوزدال، الباحث في مجال الذكاء الاصطناعي، أن "المحولات لا تقرأ النص فعليًا. عندما تدخل مطالبة، يتم ترجمتها إلى ترميز. عندما ترى كلمة 'the'، لديها ترميز واحد لما تعنيه 'the'، ولكنها لا تعرف عن 'T' و 'H' و 'E'”.
هذا يعني أن الذكاء الاصطناعي قد يعرف أن "فراولة" تتكون من "فرا" و"ولة"، ولكنها قد لا تفهم أن "فراولة" تتكون من الحروف "ف" و "ر" و "ا" و "و" و "ل" و "ة" بترتيب معين. لذلك، لا يمكنها أن تخبرك بعدد الحروف، ناهيك عن عدد مرات ظهور حرف "ر" في كلمة "فراولة".
تعد هذه المشكلة صعبة الحل، حيث إنها متأصلة في بنية المحولات نفسها.
وبحسب موقع TechCrunch التقني، هذه المشكلة تصبح أكثر تعقيدًا عندما يتعلم الذكاء الاصطناعي لغات متعددة. على سبيل المثال، قد تفترض بعض طرق التجزئة أن مسافة في جملة ستسبق دائمًا كلمة جديدة، ولكن العديد من اللغات مثل الصينية واليابانية والتايلاندية واللاوية والكورية والخمرية وغيرها لا تستخدم المسافات لفصل الكلمات.
وقال شيريدان فوخت، طالب الدكتوراه في جامعة نورث إيسترن، إن "من الأفضل أن تترك النماذج تنظر مباشرة إلى الحروف دون فرض التجزئة، ولكن في الوقت الحالي هذا أمر غير ممكن من الناحية الحسابية للمحولات".
مولدات الصور مثل Midjourney وDALL-E لا تستخدم بنية المحولات التي تستخدمها مولدات النص مثل ChatGPT.
بدلاً من ذلك، تستخدم مولدات الصور عادةً نماذج الانتشار، والتي تعيد بناء صورة من الضوضاء. يتم تدريب نماذج الانتشار على قواعد بيانات كبيرة من الصور، وهي مدفوعة لمحاولة إعادة إنشاء شيء مشابه لما تعلمته من بيانات التدريب.
وأوضح أسملش تيكا هادغو، المؤسس المشارك لشركة Lesan، أن "مولدات الصور تميل إلى الأداء بشكل أفضل في العناصر مثل السيارات ووجوه الأشخاص، وأقل في الأشياء الصغيرة مثل الأصابع والكتابة اليدوية".
قد يكون ذلك لأن هذه التفاصيل الصغيرة لا تظهر بشكل بارز في مجموعات التدريب مثل مفاهيم مثل أن الأشجار عادة ما يكون لها أوراق خضراء. قد تكون مشاكل نماذج الانتشار أسهل في إصلاحها من تلك التي تواجه المحولات. على سبيل المثال، تحسنت بعض مولدات الصور في تمثيل الأيدي من خلال التدريب على المزيد من صور الأيدي البشرية الحقيقية.
وأوضح غوزدال أن "حتى العام الماضي، كانت كل هذه النماذج سيئة حقًا في الأصابع، وهي نفس المشكلة تمامًا مثل النص. إنها تصبح جيدة جدًا محليًا، لذلك إذا نظرت إلى يد بها ستة أو سبعة أصابع، يمكنك أن تقول، 'واو، هذا يبدو وكأنه إصبع'. وبالمثل، مع النص المولد، يمكنك أن تقول، هذا يبدو وكأنه 'ح'، وهذا يبدو وكأنه 'ب'، ولكنها سيئة حقًا في هيكلة هذه الأشياء بأكملها معًا".
لهذا السبب، إذا طلبت من مولد صور الذكاء الاصطناعي إنشاء قائمة طعام لمطعم مكسيكي، فقد تحصل على عناصر عادية مثل "التاكوس"، ولكنك ستكون أكثر عرضة للعثور على عروض مثل "تاميلوس" و"إنشيداا" و"بورهيلتوس".
في الوقت الذي تنتشر فيه هذه الميمات حول عدم قدرة الذكاء الاصطناعي على تهجئة "فراولة"، تعمل OpenAI على منتج جديد للذكاء الاصطناعي يسمى Strawberry، والذي من المفترض أن يكون أكثر قدرة على التفكير. لقد تم تحديد نمو نماذج اللغة الكبيرة من خلال حقيقة أنه ببساطة لا يوجد بيانات تدريب كافية في العالم لجعل منتجات مثل ChatGPT أكثر دقة. ولكن Strawberry يمكن أن تولد بيانات اصطناعية دقيقة لجعل نماذج اللغة الكبيرة من OpenAI أفضل. وفقًا لـ The Information، يمكن لـ Strawberry حل ألغاز الكلمات Connections من New York Times، والتي تتطلب تفكيرًا إبداعيًا وتعرّف الأنماط لحلها، ويمكن أن تحل المعادلات الرياضية التي لم ترها من قبل.
في الوقت نفسه، كشفت Google DeepMind مؤخرًا عن AlphaProof وAlphaGeometry 2، وهما نظامان للذكاء الاصطناعي مصممان للتفكير الرياضي الرسمي. تقول Google إن هذين النظامين حلا أربعة من ست مشكلات من الأولمبياد الرياضي الدولي، وهو أداء جيد بما يكفي للحصول على ميدالية فضية في المسابقة المرموقة.
إنه نوع من التهكم أن الميمات حول عجز الذكاء الاصطناعي عن تهجئة "فراولة" تنتشر في نفس الوقت الذي يتم فيه الإبلاغ عن Strawberry من OpenAI. لكن الرئيس التنفيذي لشركة OpenAI، سام ألتمان، استغل هذه الفرصة لإظهار لنا أنه لديه محصول فراولة رائع في حديقته.