قناة صدى البلد البلد سبورت صدى البلد جامعات صدى البلد عقارات Sada Elbalad english
english EN
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل

لمنافسة ChatGPT.. أمازون تكشف عن الذكاء الاصطناعي الصوتي Nova Sonic

أمازون تكشف عن نموذج الذكاء الاصطناعي الصوتي Nova Sonic
أمازون تكشف عن نموذج الذكاء الاصطناعي الصوتي Nova Sonic

كشفت شركة أمازون Amazon، عن نموذجها الصوتي الجديد القائم على الذكاء الاصطناعي التوليدي Nova Sonic، وهو قادر على معالجة الصوت وتوليد كلام طبيعي أقرب إلى المحادثات البشرية.

وتدعي أمازون أن أداء Nova Sonic قادر على منافسة أبرز النماذج الصوتية المتقدمة من شركتي OpenAI وجوجل، وفقا لمعايير التي تقيس السرعة والتعرف على الكلام وجودة المحادثة.

نموذج صوتي منافس لشات جي بي تي

يأتي Nova Sonic كـ نموذج صوتي من أمازون منافسا للنماذج الصوتية الحديثة، مثل وضع الصوت في شات جي بي تي، الذي بات أكثر سلاسة مقارنة بالنماذج السابقة، مثل الإصدارات الأولى من أليكسا وسيري.

ويتوفر نموذج Nova Sonic عبر منصة أمازون Bedrock المخصصة للمطورين لبناء تطبيقات الذكاء الاصطناعي للمؤسسات، وذلك من خلال واجهة برمجة تطبيقات API جديدة تتيح البث الصوتي في الاتجاهين.

وفي بيان صحفي، وصفت أمازون هذا النموذج بأنه الأكثر كفاءة من ناحية التكلفة في السوق، مشيرة إلى أنه أقل من حيث التكلفة بحوالي 80% مقارنة بنموذج GPT-4o من OpenAI.

وتعمل مكونات Nova Sonic على تشغيل أليكسا بلس، المساعد الصوتي المحسن الذي أطلقته أمازون حديثا.

ويتميز Nova Sonic كذلك بقدرته على الاستجابة في الوقت المناسب في أثناء الحوارات الثنائية، إذ يراعي مدد الصمت والمقاطعات من الطرف الآخر.

كما يمكنه توليد نسخة مكتوبة من كلام المستخدم، ويمكن للمطورين الاستفادة منها في تطبيقات مختلفة، وهو نموذج أقل عرضة لأخطاء الكلام مقارنة بالنماذج الأخرى، إذ يتمكن من فهم نوايا المستخدم حتى في حال تمتمته أو حديثه وسط ضوضاء.

وسجل نموذج Nova Sonic معدل خطأ بلغ 4.2% فقط عند متوسط الأداء عبر اللغات الإنجليزية والفرنسية والإيطالية والألمانية والإسبانية.

وفي الوقت نفسه، تفوق Nova Sonic بنسبة قدرها 46.7% من ناحية معدل الخطأ مقارنة بنموذج GPT-4o-transcribe من OpenAI، كما سجل النموذج سرعة استجابة رائدة بمتوسط تأخير محسوس قدره 1.09 ثانية، مقارنة بـ1.18 ثانية لنموذج Realtime API من OpenAI.

ويعد نموذج Nova Sonic جزءا من إستراتيجية أمازون الواسعة لتطوير الذكاء الاصطناعي العام AGI، الذي تعرفه الشركة بأنه الذكاء الاصطناعي القادر على أداء كافة المهام التي ينفذها البشر عبر الحاسوب.