من المتوقع أن تصل قيمة سوق الذكاء الاصطناعي العالمية إلى نحو 2.575 تريليون دولار أميركي بحلول عام 2032، مرتفعةً من 454.12 مليار دولار أميركي في عام 2022 بمعدل نمو سنوي قدره 19 في المئة من عام 2023 إلى عام 2032، وفقاً لمؤسسة بريسيدينس ريسيرش.
الذكاء الاصطناعي التوليدي
يقول جوناثان سوما رئيس قسم صحافة البيانات في كلية كولومبيا للصحافة بنيويورك، إن نماذج الذكاء الاصطناعي كانت عبارة عن أدوات متخصصة، وكان استخدام الذكاء الاصطناعي في منطقة معينة يعني إنفاق الوقت والمال في إنشاء هذه النماذج خصيصاً لتلك المنطقة فقط، أما الآن فأصبح لدينا الذكاء الاصطناعي التوليدي وهو قادر على توليد النصوص والصور والوسائط الأخرى، على حد قوله.
وأشار إلى أننا الآن نستخدم نماذج وليس أدوات الذكاء الاصطناعي، فالآن المستخدم قادر على بناء نموذج توليدي خاص به من خلال تدريب النموذج، بمعنى إعطاء النموذج معلومات أو أمراً لفعل شيء على أن يتبعه في جميع الملفات اللاحقة، إذ تتعلم نماذج الذكاء الاصطناعي التوليدية أنماط بيانات التدريب المدخلة الخاصة بها ثم تنشئ بيانات جديدة لها خصائص مماثلة.
نماذج النصوص
يُعد تصنيف النص أحد أساليب التعلم الآلي الأساسية والأكثر فائدة، وهي عملية وضع أجزاء من النص في فئات، وهذه الفئات يمكن أن تكون أي شيء يريده المستخدم، النموذج يمكن أن يصنف ملايين التغريدات إلى إيجابية وسلبية، أو تصنيف نوع الكتاب رومانسياً أو خيالاً علمياً أو خيالاً أدبياً أو لغة الوثائق.
وتُستخدم هذه النصوص -خاصة في الصحافة– عندما لا نرغب في قراءة عشرات المليارات من الوثائق، بل نريد فقط رؤية تلك التي من المحتمل أن نهتم بها، فربما توجد تسريبات كبيرة لرسائل البريد الإلكتروني، أو نحن بحاجة إلى البحث في قدر كبير من التشريعات، وربما يكون لدينا مجموعة من التعليقات العامة على وسائل التواصل الاجتماعي حول سياسة الحكومة، ونريد تحليل هذا الكم من المعلومات.
وخطوات إنشاء هذا النموذج هي قراءة جزء من الوثائق، ثم نصنفها إلى فئتين: نعم، نحن مهتمون بهذه الفئة، أو لا لسنا مهتمين بها، نُدخِل هذه المعلومات للنموذج، بعدها سيتعلم النموذج الفرق بين الاثنين، ثم نعرض عليه بقية المستندات، وسيفرزها لنا في فئتين (نعم) و(لا)، وفقاً لما قاله جوناثان.
أيضاً يمكن استخدام نماذج النصوص للكشف عن الأشخاص والأماكن وغيرها، وهي خاصية التعرف على كيان محدد أو بتصنيف الرمز المميز، فبدلاً من تصنيف مستند بأكمله، فإنه يصنف الأجزاء التي قد تكون مهتماً بها مثل الأسماء، وأسماء المنظمات، والأماكن، والأموال، وما إلى ذلك.
خاصية أخرى أيضاً أشار إليها جوناثان هي النماذج التي تجيب على الأسئلة التي تطرحها على الذكاء الاصطناعي للبحث عنها وسط آلاف الوثائق، فالفكرة بشكل عام هي أن يكون لديك مستند وتطرح على النموذج سؤالاً ليتم الإجابة عليه منه.
نماذج الصور
يقول جوناثان إن هناك العديد من المهام المختلفة التي يمكنك فعلها باستخدام نماذج الصور، أكثرها شيوعاً هي تصنيف الصور، يتيح لك تصنيف الصور وضع الصور في فئات عادةً ما تكون هذه الأسئلة بنعم أو لا، مثل هل تُظهر هذه الصورة الفضائية عمليات التعدين غير القانونية؟ هل هذه الصورة بها سيارة؟ ومن السهل إنشاء مصنفات الصور المخصصة بنفسك وحسب احتياجاتك.
تُوجد أيضاً نماذج (اكتشاف الأشياء) وتعني العثور على الأشياء في الصور، ويجيب هذا النموذج عن (هل يوجد ص) في هذه الصورة؟ فمثلاً إذا كنت ترغب في تصفية آلاف الصور لإظهار الصور التي تتضمن سيارة أو فيلا فقط، أو حساب عدد الأشخاص في صورة حشد من الناس، فيمكن لهذا النموذج المساعدة في ذلك.
نموذج آخر أشار إليه جوناثان هو التجزئة الدلالية، ويُستخدم في الإجابة عن أسئلة من نوعية ما مساحة الأراضي الخضراء في منطقة معينة عند استخدام صور الأقمار الصناعية؟ كما توجد نماذج أيضاً لوصف الصور.
أما النموذج الأخير فهو نموذج يجمع بين تحليل النص والصورة، وهو (في كيو إيه) الإجابة المرئية على الصور، وهي طريقة لطرح أسئلة حول الصور، فهو ليس في الواقع نموذجاً للصور، بل هو نموذج متعدد الوسائط يفهم كلاً من الصور والنصوص، وفقاً لجوناثان، فيمكنك طرح أسئلة مثل (هل يوجد شخص آسيوي في هذه الصورة؟) أو (هل هذه صورة للحي الصيني؟).
نماذج الفيديو والصوت
تحويل الصوت إلى نص من أكثر النماذج المستعملة للتعامل مع الصوت، إذ هو أحد أكثر التقنيات المفيدة لتطبيقها على الصوت من خلال الذكاء الاصطناعي، وهذه الخاصية كانت أمراً صعباً للغاية، لكن النماذج أصبحت أفضل بكثير في السنوات الأخيرة، كما توجد نماذج للتعديل على الصوت وإزالة الضوضاء وتنقية الأصوات.
نماذج أخرى للأصوات كشف عنها جوناثان هي نماذج (من قال ماذا؟) وهي قدرة النموذج على تقسيم الأصوات الموجودة في المقطع حسب كل شخص وماذا قال، ويمكن استخدام هذا النموذج من قبل الصحفيين خلال تحليل المقاطع الصوتية للسياسيين والمسؤولين وغيرهم.
أما في نماذج الفيديو فيمكنك استخدام أداة مثل تقسيم مقطع فيديو وتحليله بإطار واحد بسيط في كل مرة، إلا أن هناك أيضاً فرصاً لتحليل الفيديو ككل.
واختتم جوناثان حديثه بأن الباحثين والصحفيين يستطيعون إنشاء نماذج خاصة بهم باستخدام الذكاء الاصطناعي التوليدي تتناسب مع مشاريعهم التي يعملون عليها، وهذه النماذج لا تحتاج معرفة معمقة بالبرمجة والأكواد.