الجزيرة.نت - 12/21/2025 9:05:50 PM - GMT (+3 )
نشرت مجلة "لاتام جورناليزم رفيو" (LatAm Journalism Review) الرقمية 10 مصطلحات في مجال الذكاء الاصطناعي، قالت إن العديد من وسائل الإعلام والصحفيين ليسوا على دراية بها، رغم أهميتها في إطار كيفية إنتاج الصحافة واستهلاكها.
وقدمت المجلة أمثلة على كيفية مساعدة هذه المفاهيم للمؤسسات الإخبارية في تحسين جوانب عملها مثل دقة التحقيقات ومشاركة الجمهور وكفاءة إنتاج الأخبار.
يشير الكيان إلى وحدة معلومات يمكن التعرف عليها ومعالجتها واستخدامها بواسطة أنظمة الذكاء الاصطناعي، وهو أي عنصر واضح يمكن تسميته وتحديده داخل النص، بحيث يفهمه الذكاء الاصطناعي ويتعامل معه كوحدة مستقلة، مثل: شخص، دولة، مؤسسة، مكان، تاريخ، حدث.. الخ.
وتعد الكيانات ضرورية لتفسير وفهم البيانات في خوارزميات الذكاء الاصطناعي، فمن خلال التعرف على الكيانات وتصنيفها، يمكن لأنظمة الذكاء الاصطناعي تحويل البيانات غير المنظمة إلى معلومات منظمة، مما يسهل تحليلها.
مثال في مجال الصحافة
"تايم لارك" (TimeLark) هي أداة تحقيقات صحفية طوّرت في عام 2023 من قبل صحفيين وفنيين من هيئة الإذاعة البريطانية "بي بي سي" (BBC) ومشروع الإبلاغ عن الجريمة المنظمة والفساد (OCCRP) ووكالة رويترز.
وتُستخدم الأداة لتحليل كميات كبيرة من المعلومات واكتشاف الروابط الخفية بين عناصر حدث إخباري معين.
وتعتمد "تايم لارك" (TimeLark) على التعلم الآلي لاستخراج الكيانات من المقالات الإخبارية غير المنظمة، والصلات بينها وعلاقتها بمرور الوقت، ثم يجري رسم المعلومات المستخرجة في شكل رسوم بيانية لتسهيل تحليلها.
واختُبرت الأداة على أكثر من 30 ألف مقال من "بي بي سي" ورويترز بشأن الحرب في أوكرانيا، حيث كانت الكيانات المستخرجة هي القادة السياسيين والبلدان والمنظمات الدولية الفاعلة في الحرب، بالإضافة إلى الشخصيات المحيطة بهم.
إعلان
الهلوسة هي ظاهرة يقوم فيها نموذج الذكاء الاصطناعي، خاصة تلك القائمة على نماذج اللغة الكبيرة (LLMs)، بإنشاء استجابات أو نتائج غير صحيحة أو غير متماسكة.
ويمكن أن تحدث الهلوسة بسبب مجموعة متنوعة من العوامل، مثل إدراك نموذج الذكاء الاصطناعي لأنماط غير موجودة، أو عدم امتلاك النموذج معلومات كافية ذات صلة لإنشاء استجابة مناسبة، ومحاولة سد الفجوة بمعلومات غير ذات صلة.
مثال في الصحافة
في عام 2023، اختبر صحفيو صحيفة نيويورك تايمز دقة "تشات جي بي تي" (Chat GPT) عبر طرح أسئلة مثل.. متى نشرت الصحيفة أول مقال لها عن الذكاء الاصطناعي.
أجابت المنصة بأن المقال هو "العلماء يتوقعون أن الآلات ستكون قادرة على التعلم وحل المشكلات" الذي نُشر على ما يبدو في 10 يوليو/تموز 1956 كجزء من تغطية مؤتمر هام في كلية دارتموث في نيوهامبشير.
وأفادت صحيفة نيويورك تايمز بأن المؤتمر كان حقيقيا، لكن المقال لم يكن موجودا أبدا.
وحذر الخبراء من أن مثل هذه الهلوسات تُظهر أن استخدام الذكاء الاصطناعي التوليدي في مهام الصحافة الآلية يمكن أن يؤدي إلى نشر معلومات خاطئة أو مضللة تبدو صحيحة.
تحويل النص إلى كلام هو تقنية في مجال الذكاء الاصطناعي تسمح بتوليد صوت بشري اصطناعي من نص مكتوب، عبر استخدام خوارزميات معالجة اللغة الطبيعية (NLP) لتفسير النص، إلى جانب نماذج متقدمة لتوليد الصوت.
ومن بين التقنيات الأكثر استخداما الشبكات العصبية العميقة، مثل (Tacotron) و(WaveNet)، القادرة على توليد صوت سلس وطبيعي.
4. التعرف الضوئي على الحروف (Optical character recognition)التعرف الضوئي على الحروف (OCR) هو تقنية تستخدم خوارزميات متخصصة لتحويل المستندات النصية إلى نص قابل للتحرير.
وتسمح هذه التقنية برقمنة المستندات المطبوعة وتمكّن أنظمة الحاسوب من قراءة ومعالجة النص الموجود في الصور أو الملفات الممسوحة ضوئيا.
مثال في الصحافة
أنشأ الاتحاد الدولي للصحفيين الاستقصائيين (ICIJ) أداة (Datashare)، وهي أداة مفتوحة المصدر تتيح للمستخدمين تحميل كميات ضخمة من البيانات والبحث عن المعلومات.
وتتضمن الأداة تقنية (OCR) التي تتيح رقمنة النصوص من المستندات الممسوحة ضوئيا والمستندات المكتوبة بخط اليد.
وكان أحد أبرز استخدامات (Datashare) في تحقيق "وثائق باندورا" Pandor) Papers) الضخم والمستند إلى المصادر الجماعية، حيث ساعدت الأداة في تنظيم وتحليل 11.9 مليون وثيقة مسربة.
وسمحت ميزة (OCR) للصحفيين بالكشف تلقائيا عن الأسماء والمنظمات من الوثائق، بالإضافة إلى استخراج الكيانات إلى قواعد البيانات.
5. استخراج البيانات (Data mining)وهو عملية تحليلية تستخدم تقنيات التعلم الآلي والأساليب الإحصائية وأنظمة قواعد البيانات لاستكشاف مجموعات البيانات الكبرى، والأنماط والاتجاهات والعلاقات المهمة التي لا يمكن رؤيتها على الفور.
مثال في الصحافة
تتطلب التحقيقات الصحفية القائمة على تسريب ملايين الوثائق تحليل كميات كبيرة من البيانات.
ولجأ الصحفيون الذين استدعاهم الاتحاد الدولي للصحفيين الاستقصائيين لإجراء تحقيقات ضخمة مثل أوراق بنما وبارادايس وباندورا إلى (RapidMiner)، وهي أداة تستخدم خوارزميات استخراج البيانات.
6. التحليلات التنبؤية (Predictive analytics)التحليلات التنبؤية في الذكاء الاصطناعي هي نهج يعتمد على النماذج الإحصائية وخوارزميات التعلم الآلي والبيانات التاريخية للتنبؤ بالأحداث المستقبلية.
إعلان
وتسعى هذه التحليلات إلى تحديد الأنماط والاتجاهات في كميات كبيرة من البيانات لتحسين عملية صنع القرار.
وتقوم خوارزميات التحليل التنبؤي بمعالجة البيانات التاريخية من خلال سير عمل يتضمن جمع البيانات وتنظيفها وهيكلتها، ثم يختار النظام المتغيرات الأكثر صلة ويطبق نماذج رياضية عليها لتوليد تنبؤات بناء على الاحتمالات والأنماط المكتشفة في البيانات.
مثال في مجال الصحافة
استخدمت صحيفة نيويورك تايمز خوارزميات التحليل التنبؤي في بعض إستراتيجياتها التجارية والتحريرية، في سبيل تحليل كيفية تحويل القراء إلى مشتركين.
وساعد التحليل التنبؤي أيضا الصحيفة على فهم الموضوعات التي جذبت أكبر عدد من القراء، حتى تتمكن فرق التسويق من معرفة أنواع المقالات التي يجب الترويج لها على وسائل التواصل.
7. البحث الدلالي (Semantic search)وهو تقنية متقدمة للبحث عن البيانات، لكنها تركز على فهم المعنى والغرض من البحث، بدلا من مجرد التفتيش عن مطابقات حرفية للكلمات المفتاحية.
وتستخدم هذه التقنية معالجة اللغة الطبيعية والتعلم الآلي لتحليل اللغات والتقاط الفروق الدقيقة مثل السياق ونية المستخدم، مما يؤدي إلى بحث أكثر دقة وملاءمة.
مثال في الصحافة
(AskFT) هي أداة ذكاء اصطناعي توليدية طوّرتها صحيفة "فايننشال تايمز" البريطانية في عام 2024، وكانت متاحة في البداية لعملائها من الشركات فقط.
8. التعرف على الكيانات المسماة (NER)وهو مجال فرعي من مجالات معالجة اللغة الطبيعية (NLP) يركز على تحديد وتصنيف الكيانات المسماة في النصوص غير المنظمة.
وقد تشمل هذه الكيانات أسماء الأشخاص والمؤسسات والأماكن والكميات والقيم النقدية والنسب المئوية وما إلى ذلك.
ويستخدم (NER) الخوارزميات والنماذج الإحصائية والتعلم العميق للكشف عن الكيانات وتصنيفها، مما يسهّل تحليل ومعالجة النصوص غير المنظمة.
مثال في الصحافة
في عام 2021، قام صحفيون بتطوير (DockIns)، وهي أداة تستخدم تقنيات التعلم الآلي ومعالجة اللغة الطبيعية (NLP) لتحليل وتصنيف المستندات ذات المحتوى غير المنظم، واستخراج المعلومات من هذه المستندات وتحديد الموضوعات والكيانات.
9. التوليد المعزز بالاسترجاع (Retrieval-Augmented Generation)وهو تقنية ذكاء اصطناعي تجمع بين توليد اللغة الطبيعية واسترجاع المعلومات من مصادر أخرى غير البيانات المستخدمة لتدريب النموذج، ويساعد ذلك في تحسين دقة الردود والإجابات وتجنب الهلوسة.
10. تصميم المطالبات (Prompt design)وهو عملية إنشاء وتحسين التعليمات المعطاة لنماذج الذكاء الاصطناعي بحيث تولد ردودا دقيقة ومتسقة ومناسبة لاحتياجات المستخدم.
ولا يؤدي التصميم الجيد للمطالبات إلى تحسين دقة الردود من نماذج لغة كبيرة مثل "تشات جي بي تي" أو "جيميناي" فحسب، بل يتيح أيضا للمستخدمين الاستفادة الكاملة من إمكانات هذه الأدوات.
مثال في الصحافة
نشر جو أمديتيس، الصحفي والأستاذ في جامعة مونتكلير ستيت في نيوجيرسي، كتابا بعنوان "دليل المبتدئين للموجهات: ChatGPT لناشري الأخبار المحلية" في عام 2023.
وفي هذا الكتاب، يعلم أمديتيس الصحفيين كيفية تصميم مطالبات فعالة وكيفية ضبطها لحالات استخدام محددة في غرفة الأخبار.
وتقدم الورقة أجزاء المطالبة الجيدة، وتناقش أهمية الوضوح والتحديد والسياق في تصميم المطالبات، كما تقدم عدة تقنيات يمكن للصحفيين استخدامها، وتتناول أهمية التكرار والتجريب في تصميم المطالبات لتحسين دقة وذاتية الاستجابات.
إقرأ المزيد


