قناة صدى البلد البلد سبورت صدى البلد جامعات صدى البلد عقارات Sada Elbalad english
عاجل
english EN
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل

إعطاء الذكاء الاصطناعي حواس بشرية.. باحث مصري يطور تقنية جديدة في فيسبوك

Image Bind
Image Bind
×

أعلن مارك زوكربيرج رئيس شركة ميتا مؤخرا عن تطوير أداة جديدة بالذكاء الاصطناعي تحت مسمى Image Bind، والتي تهدف إلى بناء صورة تفاعلية كاملة من خلال الذكاء الاصطناعي، بمعنى أنها قادرة على ربط الصورة بصوتها والعكس، ورسم هذه الصورة أو تخليق الصوت.

بينما كان باحث مصري الباحث علاء النوبي، أحد المشاركين في تطوير هذه الأداة، حيث تواصل صدى البلد معه لشرح تفاصيل مشاركته في تطوير أداة جديدة في فيسبوك.

Image Bind

ما هي أداة Image Bind؟

وقال الباحث علاء النوبي أحد المشاركين في تطوير أداة جديدة في الفيسبوك، وهي أداة Image Bind، إنها أول نموذج للذكاء الاصطناعي قادر على ربط الأشياء في الصورة بصوتها، وشكلها ثلاثي الأبعاد، ومدى دفئها أو برودتها، وكيفية تحركها، وذلك بشكل أكثر سلاسة دون الحاجة إلى التدخل البشري لتنظيم البيانات وتصنيفها، موضحا أن شركة ميتا وهي الشركة الأم لـFacebook وInstagram وWhatsapp، تؤكد أن الأداة الجديدة تقربنا خطوة واحدة من تدريب الذكاء الاصطناعي على كيفية تعلم البشر من بيئاتهم من خلال حواسهم.

وأضاف النوبي، خلال تصريحات خاصة لـ "صدى البلد"، أن نموذج الذكاء الاصطناعي بأداة Image Bind يعمل من خلال اكتشاف الأشياء في الصورة وإعطاء معلومات عنها، حيث ستوفر Image Bind معلومات حول مدى سخونة أو برودة جسم ما في الصورة، وما الصوت الذي سينتجه ، وشكله، وكيف سيتحرك، وبالتالي تساعد في تطوير الذكاء الاصطناعي من خلال تمكين جهاز الكمبيوتر من تحليل المعلومات بشكل أفضل على غرار الطريقة التي يدرك بها البشر أو يتخيلون البيئة على سبيل المثال.

الباحث علاء النوبي

إنشاء صور للصوت والعكس

وأوضح أنه بذلك يمكن إنشاء صور من الصوت، مثل إنشاء صورة بناء على أصوات غابة مطيرة أو سوق صاخب، كذلك التعرف على الصوت الذي يتناسب مع صورة معينة أو التنبؤ بعمق مشهد من الصورة، موضحا أن أداة Image Bind تهدف إلى إدخال أساليب جديدة تربط أكبر عدد ممكن من الحواس لإتاحة نماذج أكثر ثراءً للذكاء الاصطناعي، وإنشاء بيئات معقدة من إدخال بسيط مثل نص أو صورة أو تسجيل صوتي (أو مزيج من الثلاثة).

وقال الباحث علاء النوبي أحد المشاركين في تطوير أداة Image Bind، إن الأداة يمكن أن توفر طرقاً غنية لاستعادة الذكريات، وذلك عبر إضفاء روح للصورة من خلال دمجها بأصوات البيئة المحيطة وشكلها ثلاثي الابعاد، أما بالنسبة لما يمكن القيام به بهذه الخاصية الجديدة، فهو متعلق بطموحات Meta الأساسية بالواقع الافتراضي والواقع المختلط والميتافيرس، على سبيل المثال، يمكن لمطوري الألعاب الافتراضية استخدامها لتوفير الكثير من العمل الشاق من عملية التصميم الخاصة بهم.

Image Bind

اقتراح ضوضاء في الخلفية

وتابع: كما يمكن لمنشئي المحتوى إنشاء مقاطع فيديو غامرة بمناظر صوتية واقعية وحركة تعتمد فقط على إدخال النص أو الصورة أو الصوت، حيث يمكن لشخص ما أن يسجل فيديو لغروب المحيط ويضيف على الفور مقطعًا صوتيًا مثاليًا لتحسينه، أو عند مشاهدة مقطع فيديو لكرنفال، يمكن لـ ImageBind اقتراح ضوضاء في الخلفية لمرافقته، كما يمكن أن تفتح خاصية مثل ImageBind أبوابًا جديدة لمساعدة الأشخاص الذين يعانون من إعاقات بصرية أو سمعية على إدراك بيئاتهم المباشرة بشكل أفضل.

وكانت Meta أعلنت مؤخرا أنها ستقدم قريبًا المزيد من تدفقات البيانات التي تربط أكبر عدد ممكن من الحواس ، مثل اللمس والكلام والشم وإشارات الرنين المغناطيسي الوظيفي للدماغ لاتوفير نماذج أكثر ثراءً للذكاء الاصطناعي تتمحور حول الإنسان.

Image Bind
Image Bind