ميتا تتيح 200 لغة داخل نموذج ذكاء اصطناعي لتوفير ترجمة آلية عالية الجودة

 

أعلنت  Meta AI عن  نموذج ذكاء اصطناعي واحد، وهو NLLB-200، وهو الأول من نوعه في ترجمة 200 لغة مختلفة بأحدث جودة تم التحقُّق منها من خلال تقييمات مكثّفة لكل لغة منها.

 

كما أعلنت عن إنشاء  مجموعة بيانات تقييم جديدة، تُسمَّى FLORES-200، مع القيام بتقييم  أداء نموذج NLLB-200 في كل لغة لضمان جودة الترجمات. ولقد تجاوز نموذج NLLB-200 الحالة السابقة بنسبة 44%.

وأكدت الشركة أنها تستخدِم الآن تقنيات وضع النماذج ونتائج المشروع لتحسين الترجمات وتوسيع نطاقها على فيسبوك وInstagram وويكيبيديا.

 

أشارت إلى أنها ستتيح نماذج NLLB-200 مفتوحة المصدر وFLORES-200 ورمز التدريب النموذجي ورمز إعادة إنشاء مجموعة بيانات التدريب؛ من أجل مساعدة الباحثين الآخرين على تحسين أدوات الترجمة الخاصة بهم وتطوير ما قمنا به.

وقالت ميتا في بيان “تُعبِّر اللغة عن ثقافتنا وهويتنا وتمثِّل شريانًا يمد العالم بالحياة. ولكن نظرًا لعدم وجود أدوات ترجمة عالية الجودة لمئات اللغات، لا يمكن لمليارات الأشخاص اليوم الوصول إلى المحتوى الرقمي أو المشاركة بالكامل في المحادثات والمجتمعات على الإنترنت بلغاتهم المفضلة أو الأصلية. وينطبق ذلك بشكل خاص على مئات الملايين من الأشخاص الذين يتحدثون العديد من لغات قارتي أفريقيا وآسيا”

 

أضاف البيان “لمساعدة الأشخاص على التواصل بشكل أفضل في الوقت الحالي وتمكينهم من أن يصبحوا جزءًا من عالم ميتافيرس في المستقبل، أنشأ باحثو Meta AI برنامج “No Language Left Behind” (NLLB) الذي يشمل جميع اللغات، حيث يمثِّل البرنامج جهدًا لتطوير قدرات الترجمة الآلية عالية الجودة لتشمل أغلب لغات العالم. واليوم، نعلِن عن قفزة مهمة في برنامج NLLB: حيث أنشأنا نموذجًا واحدًا يُطلَق عليه اسم NLLB-200 المعني بترجمة 200 لغة مختلفة بأحدث النتائج. ولم تكُن العديد من تلك اللغات، مثل لغتي الكامبا واللاوية، مدعومة بشكلٍ كافٍ أو على الإطلاق في أفضل أدوات الترجمة الحالية في وقتنا هذا. وفي الوقت الحالي، يوجد أقل من 25 لغة أفريقية مدعومة من أدوات الترجمة شائعة الاستخدام، ويوفِّر العديد منها ترجمة ذات جودة منخفضة. في المقابل، يدعم نموذج NLLB-200 55 لغة أفريقية بنتائج عالية الجودة. إجمالاً، يمكن لهذا النموذج الواحد أن يوفِّر ترجمات عالية الجودة للغات يتحدث بها مليارات الأشخاص حول العالم. وفي المجمل، تحسنت نتائج BLEU “معيار التقييم ثنائي اللغة” لأداء NLLB-200 عن الحالة السابقة بمتوسط 44 بالمائة عبر جميع الاتجاهات البالغ عددها 10 آلاف لمعيار FLORES-101. وبالنسبة لبعض اللغات الأفريقية والهندية، ارتفعت نسبة الزيادة عن 70 % مقارنةً بأنظمة الترجمة الحديثة.”

 

وكشفت “نوفِّر الآن نماذج NLLB-200 مفتوحة المصدر وننشر عددًا كبيرًا من أدوات البحث لتمكين الباحثين الآخرين من توسيع هذا العمل ليشمل المزيد من اللغات وتطوير تقنيات أكثر شمولاً. وتقدِّم Meta AI أيضًا ما يصل إلى 200000 دولار أمريكي من المِنَح للمؤسسات غير الهادفة للربح لتطبيق نموذج NLLB-200 في العالم الحقيقي.”

ستدعم التطورات البحثية من NLLB أكثر من 25 مليار ترجمة يتم عرضها يوميًا على آخر أخبار فيسبوك وInstagram ومنصاتنا الأخرى. تخيل أنك تزور مجموعة مفضلة على فيسبوك، وتجد منشورًا بلغة الإيجبو أو لوغندا، وتكون قادرًا على فهم المنشور بلغتك بنقرة زر واحدة. ويمكن أن تساعد الترجمات عالية الدقة للمزيد من اللغات أيضًا على اكتشاف المحتوى الضار والمعلومات المضللة، وحماية نزاهة الانتخابات، والحد من حالات الاستغلال الجنسي والاتجار بالبشر على الإنترنت. ويتم الآن أيضًا تطبيق تقنيات وضع النماذج والدروس المكتسبة من بحثنا في NLLB على أنظمة الترجمة التي يستخدمها محررو ويكيبيديا.

 

اترك تعليقا