العدد 20– نوفمبر تشرين الثاني 2023

| 142

النصوص المعلمة التي تحتوي على تصنيفات دقيقة للكيانات. بعد التدريب، يمكن للنماذج التعرف بدقة على الكيانات في النصوص الجديدة واستخالصها. برو في 12 قامت شركة شاومي بإطالق هاتف ريدمي " لنفترض أن لدينا جملة: مثال: . في هذه الجملة، يمكن لنظام التعرف على الكيانات االسمية التعرف " 2023 حزيران . 2023 برو، تاريخ: حزيران 12 على الكيانات اآلتية: شركة: شاومي - منتج: ريدمي الستخالص المعلومات المهمة من NER هذا المثال يوضح كيف يمكن اســتخدام

الجمل وتصنيف الكيانات بناء على دورها في السياق. )Reinforcement Learning( . التعلم بالتعزيز 5 )Reinforcement Learning - RL( التعلم بالتعزيز

التعلم بالتعزيز هو أحد فروع الذكاء االصطناعي إذ يتمكن الحاسوب من تعلم كيفية اتخاذ القرارات لتحقيق أهداف معينة في بيئة معينة. يشبه هذا النوع من التعلم الطريقة )25( التي يتعلم بها األفراد من خالل التجربة والتفاعل مع العالم من حولهم. الذي )Agent( التعلم بالتعزيز يعتمد على مفهوم الوكيل عالقته بالذكاء االصطناعي: يتفاعل مع بيئته لتحقيق هدف معين. يتعلم الوكيل من خالل التجارب والتفاعل مع البيئة، ويستخدم العقوبات والمكافآت كمرشد لتحسين قراراته. في مجال األلعاب، يمكن استخدام التعلم بالتعزيز لتدريب وتطوير وكيل ذكي مثال: يمكنه اللعب بشكل مستقل ضد العبين آخرين أو حتى ضد نفسه. على سبيل المثال، في لعبة الشطرنج، يمكن تدريب وكيل ذكي باستخدام التعليم بالتعزيز التخاذ أفضل الخطوات في اللعبة. يمكن للوكيل أن يتعلم من تجاربه السابقة ويحسِّن من أدائه مع مرور الوقت حتى يصبح العبًا محترفًا. : )Q-Learning( العمليات الثنائية هي إحدى تقنيات التعلم العميق في مجال التعلم )Q - Learning( العمليات الثنائية بالتعزيز. يستخدم هذا النوع من التعلم لتدريب وكالء ذكاء اصطناعي التخاذ قرارات ، والتي تمثل تقديرًا للمكافآت المتوقعة من اتخاذ إجراء معين Q من خالل تقدير قيم بناء على التجــارب والمكافآت الملقاة Q فــي حالة معينــة. يتم تحديث هذه القيم )26( للنموذج خالل تفاعله مع البيئة.

Made with FlippingBook Online newsletter