تصبح Google أكثر تعددًا للغات ، ولكن هل ستحصل على فارق بسيط؟

يتحدث حوالي 10 ملايين شخص لغة الكيتشوا ، لكن محاولة ترجمة رسائل البريد الإلكتروني والرسائل النصية تلقائيًا إلى أكثر لغات السكان الأصليين انتشارًا في الأمريكتين كانت مستحيلة.

تغير ذلك يوم الأربعاء ، عندما أضافت Google لغة Quechua ومجموعة متنوعة من اللغات الأخرى إلى خدمة الترجمة الرقمية الخاصة بها.

يقول عملاق الإنترنت إن تقنية الذكاء الاصطناعي الجديدة تمكنه من توسيع نطاق ذخيرة ترجمة Google للغات العالم. وأضافت 24 منها هذا الأسبوع ، بما في ذلك لغة الكيتشوا ولغات السكان الأصليين في أمريكا الجنوبية مثل الغواراني والأيمارا. كما أنها تضيف عددًا من اللغات الأفريقية وجنوب آسيا المنتشرة على نطاق واسع والتي كانت مفقودة من المنتجات التقنية الشهيرة.

وقال إسحاق كاسويل ، عالم الأبحاث في جوجل ، للصحفيين: “لقد نظرنا إلى اللغات التي بها عدد كبير جدًا من السكان المحرومين”.

قد يتم الاحتفال بالأخبار من معرض تكنولوجيا I / O السنوي لشركة كاليفورنيا في العديد من أنحاء العالم. لكن من المحتمل أيضًا أن تثير انتقادات من أولئك الذين أصيبوا بالإحباط من المنتجات التقنية السابقة التي فشلت في فهم الفروق الدقيقة في لغتهم أو ثقافتهم.

كانت الكيتشوا هي اللغة المشتركة لإمبراطورية الإنكا ، والتي امتدت من ما هو الآن جنوب كولومبيا إلى وسط تشيلي. بدأ وضعها في التدهور بعد الغزو الإسباني لبيرو منذ أكثر من 400 عام.

تعد إضافته إلى اللغات المعترف بها من قبل Google انتصارًا كبيرًا لنشطاء لغة Quechua مثل Luis Illaccanqui ، وهو بيروفي أنشأ موقع الويب Qichwa 2.0 ، والذي يتضمن قواميس وموارد لتعلم اللغة.

قال إيلاكانكي ، الذي لم يشارك في مشروع Google: “سيساعد ذلك في وضع لغة الكيتشوا والإسبانية في نفس الوضع”.

قال Illaccanqui ، الذي يعني اسمه الأخير في Quechua “أنت الصاعقة” ، إن المترجم سيساعد أيضًا في الحفاظ على اللغة حية مع جيل جديد من الشباب والمراهقين ، “الذين يتحدثون الكيشوا والإسبانية في نفس الوقت وهم مفتونون بـ الشبكات الاجتماعية.”

وصف كاسويل الأخبار بأنها “خطوة تكنولوجية كبيرة جدًا إلى الأمام” لأنه حتى وقت قريب ، لم يكن من الممكن إضافة لغات إذا لم يتمكن الباحثون من العثور على مجموعة كبيرة من النصوص عبر الإنترنت – مثل الكتب الرقمية أو الصحف أو منشورات وسائل التواصل الاجتماعي – أنظمة الذكاء الاصطناعي للتعلم منها.

لا يتمتع عمالقة التكنولوجيا في الولايات المتحدة بسجل حافل في جعل تكنولوجيا لغتهم تعمل بشكل جيد خارج الأسواق الأكثر ثراءً ، وهي مشكلة جعلت من الصعب عليهم اكتشاف المعلومات الخاطئة الخطيرة على منصاتهم. حتى هذا الأسبوع ، تم تقديم خدمة الترجمة من Google باللغات الأوروبية مثل الفريزية والمالطية والأيسلندية والكورسيكية – كل منها أقل من مليون متحدث – ولكن ليس لغات شرق إفريقيا مثل الأورومو والتغرينية ، التي بها ملايين المتحدثين.

سيتم طرح اللغات الجديدة هذا الأسبوع. لن يفهمها المساعد الصوتي من Google بعد ، مما يقصرها على الترجمات من نص إلى نص في الوقت الحالي. قالت Google إنها تعمل على إضافة التعرف على الكلام وإمكانيات أخرى ، مثل القدرة على ترجمة علامة من خلال توجيه الكاميرا إليها.

سيكون ذلك مهمًا للغات التي يتم التحدث بها إلى حد كبير مثل الكيتشوا ، خاصة في مجال الصحة ، لأن العديد من الأطباء والممرضات البيروفيين الذين يتحدثون الإسبانية فقط يعملون في المناطق الريفية و “غير قادرين على فهم المرضى الذين يتحدثون لغة الكيتشوا في الغالب” ، كما قال إيلاكانكي.

قال أرتورو أونسيفاي ، باحث الترجمة الآلية البيروفي بجامعة إدنبرة الذي شارك في تأسيس تحالف بحثي لتحسين تكنولوجيا اللغة الأصلية عبر الأمريكتين ، “إن التحدي التالي هو العمل على الكلام”. “اللغات الأصلية للأمريكتين هي تقليديًا شفهية.”

حذرت Google في إعلانها من أن جودة الترجمات باللغات المضافة حديثًا “لا تزال متخلفة كثيرًا عن” اللغات الأخرى التي تدعمها ، مثل الإنجليزية والإسبانية والألمانية ، وأشارت إلى أن النماذج “سترتكب أخطاء وستظهر تحيزاتها الخاصة. ” قال كاسويل إن الشركة أضافت لغات فقط إذا حققت أنظمة الذكاء الاصطناعي الخاصة بها حدًا معينًا من الكفاءة.

قال: “إذا كان هناك عدد كبير من الحالات التي يكون فيها خطأ كبير ، فلن نقوم بتضمينه. حتى لو كانت 90٪ من الترجمات مثالية ، ولكن 10٪ هراء ، فهذا كثير جدًا بالنسبة لنا. “

قالت Google إن منتجاتها تدعم الآن 133 لغة. أحدث 24 هي أكبر دفعة منفردة يتم إضافتها منذ أن أدرجت Google 16 لغة جديدة في عام 2010. ما جعل التوسع ممكنًا هو ما تسميه Google نموذج الترجمة الآلية “بدون طلقة” أو “بدون موارد” – نموذج يتعلم الترجمة إلى لغة أخرى دون رؤية مثال على ذلك.

قدمت شركة Meta الأم لفيسبوك وإنستغرام مفهومًا مشابهًا يسمى Universal Speech Translator العام الماضي.

قال كاسويل إن نموذج Google يعمل من خلال تدريب “نموذج واحد عملاق للذكاء الاصطناعي” على حوالي 100 لغة غنية بالبيانات ، ثم تطبيق ما تعلمته على مئات اللغات الأخرى التي لا تعرفها. قال: “تخيل أنك متعدد اللغات ، ثم تبدأ في قراءة الروايات بلغة أخرى ، يمكنك البدء في تجميع ما يمكن أن يعنيه بناءً على معرفتك باللغة بشكل عام”.

وقال إن المجموعة الجديدة تتراوح من لغات أصغر مثل ميزو ، يتحدث بها حوالي 800 ألف شخص في شمال شرق الهند ، إلى لغات أكثر انتشارًا مثل اللينغالا ، التي يتحدث بها حوالي 45 مليون شخص في جميع أنحاء وسط إفريقيا.

منذ أكثر من 15 عامًا – في عام 2006 – حظيت Microsoft ببعض الاهتمام الإيجابي في أمريكا الجنوبية من خلال ميزة برمجية تترجم قوائم وأوامر Microsoft المألوفة إلى لغة Quechua. ولكن كان ذلك قبل الموجة الحالية من تطورات الذكاء الاصطناعي في الترجمة الفورية.

قال أميركو ميندوزا موري ، أستاذ اللغة بجامعة هارفارد ، والذي يتحدث لغة الكيتشوا ، إن جذب انتباه Google يجلب بعض الرؤية المطلوبة للغة في أماكن مثل بيرو ، حيث لا يزال المتحدثون بلغة الكيتشوا يفتقرون إلى العديد من الخدمات العامة. وقال إن بقاء العديد من هذه اللغات “سيعتمد على استخدامها في السياقات الرقمية”.

قال عالم لغة آخر ، روبرتو زاريكي ، إنه يشك في قدرة Google على إنشاء أداة فعالة لتنشيط اللغة للكيشوا أو الأيمارا أو الغواراني دون مشاركة أوثق من مجموعات المجتمع في المنطقة.

قال زاريكي ، عالم لغوي في الجامعة البابوية الكاثوليكية في بيرو: “ترتبط اللغات ارتباطًا وثيقًا بالحياة والثقافات والجماعات العرقية والمنظمات السياسية”. “ينبغي أن يؤخذ هذا في الاعتبار.”

—-

اللغات الجديدة المضافة هي: الأسامية ، الأيمارا ، البامبارا ، البوجبوري ، الديفيهي ، الدوجري ، الإيوي ، الجواراني ، الإيلوكانو ، الكونكاني ، الكريو ، اللينغالا ، اللوغندا ، المايثيلي ، ميتيلون (مانيبوري) ، ميزو ، أورومو ، الكيتشوا ، السنسكريتية ، السبيدي ، السوراني. الكردية والتغرينية والتسونجا والتوي.

© حقوق النشر عام 2022 أسوشيتد برس. كل الحقوق محفوظة. لا يجوز نشر هذه المواد أو بثها أو إعادة كتابتها أو إعادة توزيعها دون إذن.