أثر استراتيجيات التقييم المختلط (الكلامي والرقمي) في تحسين الأداء الأكاديمي لدى طلاب الصف الرابع الابتدائي: دراسة تتبعية في مدرسة النجوم – بقعاثا

رفاء عقاب عماشة، ريم عقاب عماشة

doi:https://doi.org/10.53796/hnsj76/2

Article 2

أثر استراتيجيات التقييم المختلط (الكلامي والرقمي) في تحسين الأداء الأكاديمي لدى طلاب الصف الرابع الابتدائي: دراسة تتبعية في مدرسة النجوم – بقعاثا

رفاء عقاب عماشة¹، ريم عقاب عماشة¹

¹ جامعة النجاح الوطنية، نابلس، فلسطين.

بريد الكتروني: rfaaamasha35@gmail.com

The Impact of Hybrid Assessment Strategies (Verbal and Digital) on Enhancing Academic Performance Among Fourth-Grade Students: A Longitudinal Study at Al-Nojoom School – Buq'ata

Rafaa Aqab Amasha¹, Reem Aqab Amasha¹

¹ An-Najah National University, Nablus, Palestine.
Email: rfaaamasha35@gmail.com

DOI: https://doi.org/10.53796/hnsj76/2

المعرف العلمي العربي للأبحاث: https://arsri.org/10000/76/2

المجلد (7) العدد (6). الصفحات: 9 - 33

تاريخ الاستقبال: 2026-05-10 | تاريخ القبول: 2026-05-15 | تاريخ النشر: 2026-06-01

Download PDF

المستخلص: هدفت هذه الدراسة إلى التعرف على فعالية أساليب التقييم الثلاثة (الكلامي، الرقمي، والمختلط) في تحسين الأداء الأكاديمي لدى طلبة الصف الرابع الابتدائي في مدرسة "النجوم" بقرية بقعاثا. ولتحقيق أهداف الدراسة، اعتمدت الباحثة المنهج المختلط (الكمي والنوعي)، حيث طُبقت الدراسة على عينة إجمالية بلغت 70 طالباً من طالب الصف الرابع، بالإضافة إلى استطلاع آراء المعلمين. تضمنت أدوات الدراسة استبانات لقياس الفعالية، وخرائط تحصيل أكاديمي في مادة الرياضيات تشتمل على 19 مهارة مقسمة على عدة مجالات معرفية. أظهرت النتائج أن أسلوب التقييم "المختلط" كان الأكثر فعالية في رفع مستوى التحصيل الأكاديمي، حيث سجلت المجموعات التي خضعت له تحسناً في متوسط الأداء بلغ (17.3) درجة. كما كشفت النتائج عن وجود علاقة ارتباطية إيجابية قوية بلغت (0.815) بين نمط التقييم المختلط والنجاعة الأكاديمية. وأظهرت النتائج أيضاً استمتاعاً عالياً بالتقييم الرقمي لسرعة التغذية الراجعة، بينما برزت مستويات من التوتر تجاه التقييم الكلامي العلني. واستناداً إلى هذه النتائج، قدمت الباحثة مجموعة من التوصيات لتبني استراتيجيات التقييم المختلط وتدريب المعلمين على توظيفها لتعزيز مخرجات التعلم لدى طالب المرحلة الأساسية.

الكلمات المفتاحية: التقييم المختلط، الصف الرابع، الأداء الأكاديمي، مدارس بقعاثا، التقييم المختلط.

Abstract: This study aimed to investigate the effectiveness of three assessment methods—verbal, digital, and mixed (hybrid)—in enhancing the academic performance of fourth-grade students at "Al-Nojoom" School in Buq'ata. To achieve the study objectives, the researcher adopted a mixed-methods approach (quantitative and qualitative). The study was conducted on a total sample of 70 fourth-grade students, alongside semi-structured interviews with teachers. The research tools included effectiveness surveys and academic achievement maps in mathematics covering 19 specific skills. The findings revealed that the "Mixed (Hybrid) Assessment" method was the most effective in improving academic achievement, with groups subjected to this method showing a significant improvement in average performance by 17.3 points. Additionally, a strong positive correlation of (0.815) was found between this hybrid approach and academic efficacy. The results also indicated high student engagement with digital assessment due to immediate feedback, while highlighting levels of anxiety toward public verbal assessment. Based on these results, the researcher proposed a set of recommendations to adopt hybrid assessment strategies and train teachers on their implementation to enhance learning outcomes for elementary school students.

Keywords: Mixed Assessment, Fourth Grade, Academic Performance, Buq'ata Schools, Hybrid Assessment.

مقدمة

يُعد التقييم التربوي حجر الزاوية في العملية التعليمية، فهو بمثابة البوصلة التي تُوجّه مسار الطالب نحو النجاح الأكاديمي والتميّز الشخصي. وفي خضمّ التحوّلات الرقمية المُتسارعة، تبرز الحاجة المُلحة لتطوير أساليب التقييم لتتجاوز الأنماط التقليدية إلى نماذج “هجينة” تجمع بين الأنماط الكلامية والرقمية، بما يضمن تعزيز الفهم العميق خاصة في المراحل التأسيسية كالصف الرابع الابتدائي.

تُشير التوجهات التربوية الحديثة إلى أن تنوّع أساليب التقييم يلعب دوراً محورياً في تحقيق التوازن بين التفاعل الإنساني والدقة التقنية. وتؤكد دراسات معاصرة مثل: (Hattie & Timperley, 2023) أن التغذية الراجعة الفورية التي توفرها المنصات الرقمية ترفع من كفاءة التعلم بنسبة ملحوظة، بينما يرى )أبو لطيفة، 2024( أن التقييم الكلامي المباشر يظل الضمانة الأساسية لتنمية مهارات الاستدلال الرياضي والتواصل لدى طلاب المرحلة الأساسية. وفي هذا السياق، أشارت دراسة (Chen et al., 2022) إلى أن “التقييم المختلط” (Hybrid Assessment) يقلل من قلق الاختبارات ويزيد من دافعية الإنجاز لدى الطلاب الصغار.

وتأتي هذه الدراسة لتسد فجوة بحثية في منطقة هضبة الجولان – بقعاثا، حيث تواجه المنظومة التعليمية تحديات في الموازنة بين الأصالة التربوية والتحول الرقمي. وتبرز مدرسة “النجوم” كنموذج لاستكشاف واقع استخدام التقييم الكلامي، الرقمي، والمختلط. وقد كشفت النتائج الأولية التي أجريت على عينة استطلاعية وأساسية من طلاب الصف الرابع أن التقييم المختلط حقق تحسناً جوهرياً في متوسط الأداء الأكاديمي بلغ (17.3) درجة، وهو ما يتسق مع ما ذهب إليه (Smith & Hill, 2023) من أن الدمج بين التفاعل اللفظي والأدوات الرقمية يؤدي إلى نتائج تقييمية أكثر عدالة وشمولية.

وتهدف هذه الدراسة إلى استكشاف دور أساليب التقييم في تعزيز قدرة طلاب الصف الرابع على التكيّف مع مُتطلّبات المناهج الحديثة، وذلك من خلال:

تحديد مدى فعالية التقييم الكلامي والرقمي والمختلط في تحسين الأداء الأكاديمي الفعلي.
قياس توجهات الطلاب والمعلمين نحو أساليب التقييم المختلفة، مع التركيز على تقليل “توتر التقييم الشفهي” وتعظيم “متعة التقييم الرقمي”.
رصد التحديات الإجرائية التي تواجه المعلمين، مثل إدارة الوقت ومهارات الدمج التقني.

مشكلة الدراسة:

على الرغم من تعدد الدراسات التي تناولت الوسائل التعليمية الحديثة، إلا أن هناك حاجة ملحة لفهم كيفية تأثير أنماط التقييم المختلفة (الكلامي، الرقمي، والمختلط) على التحصيل الأكاديمي لطلاب الصف الرابع، خاصة في ظل المرحلة الانتقالية نحو الرقمنة في مدارس هضبة الجولان (بقعاثا). وتبرز المشكلة في وجود فجوة معرفية حول كيفية الموازنة بين التقييم التقليدي والتقني في بيئات محددة؛ حيث ركزت دراسات سابقة مثل (Wang & Eccles, 2019) على التقييم الرقمي دون التعمق في أثر دمجه مع التقييم الكلامي لتحسين مخرجات التعلم. ومن هنا، تنبع الحاجة لفحص فاعلية هذه الأنماط في مدرسة “النجوم”، وتحديد الأسلوب الأكثر قدرة على رفع مستوى الفهم والاستيعاب لدى طلاب الصف الرابع، مع مراعاة التحديات الميدانية التي يواجهها المعلمون.

أسئلة الدراسة:

تسعى الدراسة الحالية للإجابة عن التساؤلات الآتية:

ما مستوى فاعلية أسلوب التقييم الكلامي في تحسين الأداء الأكاديمي لطلاب الصف الرابع الابتدائي من وجهة نظر المعلمين؟
ما مستوى فاعلية أسلوب التقييم الرقمي في تحسين الأداء الأكاديمي لطلاب الصف الرابع الابتدائي؟
هل توجد فروق ذات دلالة إحصائية عند مستوى الدلالة α ≤ 0.05 في متوسطات تحصيل طلاب الصف الرابع تُعزى لنوع أسلوب التقييم (كلامي، رقمي، مختلط)؟
ما هي اتجاهات معلمي وطلاب الصف الرابع في مدارس بقعاثا نحو استخدام أسلوب التقييم المختلط؟

فرضيات الدراسة:

بناءً على تساؤلات الدراسة وتصميمها المحدث، تم صياغة الفرضيات الآتية:

لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α ≤ 0.05) في مستوى الأداء الأكاديمي لطلاب الصف الرابع تُعزى لأسلوب التقييم المستخدم (كلامي، رقمي، مختلط).
توجد علاقة ارتباطية إيجابية دالة إحصائياً بين استخدام التقييم المختلط ومستوى الأداء الأكاديمي (التحصيل في الرياضيات) لدى طلاب الصف الرابع.
لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α ≤ 0.05) في اتجاهات طلاب الصف الرابع نحو أساليب التقييم تُعزى لمتغير الجنس.
لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α ≤ 0.05) بين استجابات المعلمين حول فاعلية التقييم (كلامي، رقمي، مختلط) تُعزى لمتغير سنوات الخبرة.
لا توجد علاقة ارتباطية دالة إحصائياً بين استخدام التقييم الرقمي وبين دافعية الطلاب نحو التعلم من وجهة نظر المعلمين.

أهداف الدراسة:

سعت الدراسة إلى تحقيق الأهداف التالية:

الكشف عن مستوى فاعلية أساليب التقييم المختلفة (الكلامي، الرقمي، والمختلط) في تحسين الأداء الأكاديمي لطلاب الصف الرابع الابتدائي في مدارس بقعاثا.

التعرف إلى طبيعة الفروق في التحصيل الدراسي للطلبة تبعاً لنمط التقييم المستخدم، وتحديد الأسلوب الأكثر أثراً في رفع مستوى الفهم والاستيعاب.

التحقق من وجود علاقة ارتباطية بين استخدام أدوات التقييم الرقمي والمختلط وبين زيادة دافعية التعلم والانخراط الصفي لدى طلبة الصف الرابع.

التعرف إلى الفروق في اتجاهات المعلمين والطلاب نحو أساليب التقييم الحديثة تعزى إلى متغيرات (الجنس للطلاب، وسنوات الخبرة للمعلمين).

رصد التحديات والمعيقات التي تواجه الكادر التعليمي عند تطبيق التقييم المختلط في بيئة المدرسة الابتدائية، وتقديم توصيات عملية لتجاوزها.

أهمية الدراسة:

الأهمية النظرية: تُشكّل هذه الدراسة إضافةً نوعيةً للمعرفة العلمية حول العلاقة بين أنماط التقييم التربوي والأداء الأكاديمي، حيث تُركّز على سد الفجوة المعرفية من خلال تسليط الضوء على أبعاد التقييم المختلفة وتأثيرها المتكامل على استيعاب طلبة الصف الرابع. كما تُقدّم إطاراً نظرياً يربط بين التفاعل اللفظي المباشر والأدوات التقنية في بيئة مدارس بقعاثا التي تمر بمرحلة تحول رقمي.

الأهمية العملية: تتمثّل في تقديم توصيات ملموسة للمدارس والمعلمين حول تصميم استراتيجيات تقييم فعّالة تُعزّز الأداء الأكاديمي والدافعية، مع التشديد على الدمج المتكامل بين التقنيات الحديثة والتواصل الشفهي. كما تُسهم في تطوير حقائب تدريبية للمعلمين تُلبّي احتياجات طلاب الصف الرابع وتُحسن تجربتهم التعليمية.

حدود الدراسة:

تقتصر الدراسة على الحدود الآتية:

الحد المكاني: تم تطبيق الدراسة في مدرسة “النجوم” الابتدائية، بقرية بقعاثا في هضبة الجولان.

الحد الزماني: تم إجراء هذه الدراسة في الفصل الدراسي الثاني من العام الدراسي 2023/2024م.

الحد البشري: تقتصر هذه الدراسة على عينة استطلاعية (14 طالباً) وعينة أساسية من طلبة الصف الرابع، بالإضافة إلى الهيئة التدريسية في مدرسة النجوم.

الحد الموضوعي: تقتصر الدراسة على بحث أثر وفعالية أساليب التقييم الثلاثة (الكلامي، الرقمي، والمختلط) في تحسين الأداء الأكاديمي.

أهمية الدراسة:

الأهمية النظرية: تُشكّل هذه الدراسة إضافةً نوعيةً للمعرفة العلمية حول العلاقة بين أنماط التقييم التربوي (الكلامي، الرقمي، والمختلط) والأداء الأكاديمي، حيث تُركّز الدراسة على سد الفجوة المعرفية من خلال تسليط الضوء على أبعاد التقييم المختلفة وتأثيرها المتكامل على استيعاب الطلبة، مع إيلاء اهتمام خاص لخصوصية سياق مدارس بقعاثا في هضبة الجولان التي تمر بمرحلة تحول نحو التعليم الرقمي ولم تحظَ بدراسة معمّقة سابقاً. كما تُقدّم إطاراً نظرياً متكاملاً يربط بين التفاعل اللفظي المباشر والأدوات التقنية، ويُوضّح كيفية تفاعلهما في التأثير على الجوانب المتعددة للتحصيل الدراسي لدى طلبة المرحلة الأساسية، مما يُسهم في تعميق فهم العلاقة بين هذه المتغيرات. إضافةً إلى ذلك، تُوسّع الدراسة المعرفة العلمية حول أهمية التغذية الراجعة الفورية ودور التقييم المختلط في تعزيزها، مما يوفّر أساساً لإطلاق دراسات مستقبلية حول رقمنة التقويم في بيئات تعليمية متنوعة.

الأهمية العملية: تتمثّل الأهمية العملية لهذه الدراسة في قدرتها على تقديم توصيات ملموسة ومحدّدة للمدارس والمجتمع الأكاديمي والمعلمين، تُركّز على كيفية تصميم استراتيجيات تقييم فعّالة تُعزّز الأداء الأكاديمي والدافعية للطلبة، مع التشديد على أهمية الدمج المتكامل بين التقنيات الحديثة والتواصل الشفهي. كما تُسهم نتائج الدراسة في تطوير حقائب تدريبية للمعلمين تُوفّر آليات تطبيقية للتقييم الرقمي والمختلط تُلبّي احتياجات الطلبة المتنوعة، مما يُساعد في تحسين تجربتهم التعليمية وتمكينهم من تحقيق نواتج تعلم أفضل. إضافةً إلى ذلك، تُعزّز الدراسة نتائج الأبحاث السابقة التي تُبرز دور التقييم التكويني في تعزيز التحصيل، وتُثريها من خلال تسليط الضوء على تحديات التطبيق الميداني في مدرسة النجوم، مما يجعلها قاعدة قوية للبحوث المستقبلية والممارسات التربوية في هذا المجال.

حدود الدراسة:

تقتصر الدراسة على الحدود الآتية:

الحد المكاني: تم تطبيق الدراسة في مدرسة “النجوم” الابتدائية، بقرية بقعاثا في هضبة الجولان.
الحد الزماني: تم إجراء هذه الدراسة في الفصل الدراسي الثاني من العام الدراسي الحالي 2023/2024م.
الحد البشري: تقتصر هذه الدراسة على عينة من طلبة الصفين الرابع والسادس، بالإضافة إلى الهيئة التدريسية (معلمي ومعلمات المرحلة الأساسية) في مدرسة النجوم.
الحد الموضوعي: تقتصر الدراسة على بحث أثر وفعالية أساليب التقييم الثلاثة (الكلامي، الرقمي، والمختلط) في تحسين الأداء الأكاديمي، ولا تتعداها إلى أساليب تقييم أخرى خارج نطاق هذه الأنماط.

المصطلحات الإجرائية:

· 1التقييم المختلط

هو “نظام تقييمي متكامل يدمج بين التغذية الراجعة النوعية (الكلامية) وبين الأدوات التقنية والمنصات الرقمية، بهدف تقديم صورة شاملة ومستمرة عن أداء المتعلم وتلبية احتياجاته الفردية في بيئة تعليمية مرنة” (Chen et al., 2022).

وتُعرّفه الباحثة إجرائيًا في هذه الدراسة: بأنه أسلوب التقييم المطبق على طلاب الصف الرابع في مدرسة النجوم، والذي يجمع بين الملاحظة والنقاش المباشر مع المعلم (التقييم الكلامي) وبين الاختبارات والمهام المنجزة عبر المنصات الإلكترونية (التقييم الرقمي). ويُقاس من خلال الدرجات التحصيلية للطلاب في خرائط مادة الرياضيات واستجاباتهم على استبانة الفعالية، ويشمل ثلاثة أبعاد:

- البعد الكلامي: ويقاس من خلال مدى تأثير النقاش المباشر في فهم الأخطاء وتعديل المسار التعليمي.

البعد الرقمي: ويقاس من خلال سرعة استجابة الطلاب للمهام الإلكترونية ودقة النتائج الفورية.
البعد التكاملي (المختلط): ويقاس من خلال قدرة الدمج بين الأسلوبين على خفض قلق الاختبارات ورفع الدافعية.
- الأداء الأكاديمي (Academic Performance)

هو “المستوى التحصيلي الذي يبلغه الطالب في نهاية فترة زمنية محددة، ويُعبر عنه بمدى قدرته على استيعاب المهارات والمعارف المقررة وترجمتها إلى نتائج ملموسة تعكس كفاءته التعليمية” (Hattie & Timperley, 2023).

وتُعرّفه الباحثة إجرائيًا في هذه الدراسة: بأنه مستوى إتقان طلاب الصف الرابع لمهارات مادة الرياضيات (الـ 19 مهارة المحددة في الدراسة)، ويتم قياسه من خلال “خرائط التحصيل الأكاديمي” التي توضح تطور مستويات الطلاب من (نطاق منخفض) إلى (نطاق مرتفع) بناءً على النتائج المسجلة في ملفات “מיפוי” المرفقة.

التقييم المختلط والنجاعة الأكاديمية

تُشكّل استراتيجيات التقييم المختلط ركيزةً أساسيةً في تطوير المنظومة التعليمية الحديثة، إذ تُسهم بشكلٍ كبير في تعزيز قدرة الطالب على فهم نقاط قوته ومعالجة ضعف أدائه بأسلوب يجمع بين “الإنسانية في التوجيه” و”الدقة في القياس”. ويمكن النظر إلى التقييم المختلط باعتباره عملية تفاعلية تُمكّن الطالب من الحصول على تغذية راجعة فورية ومباشرة (Smith & Hill, 2023).

في هذا الإطار، يُؤكّد (Chen et al., 2022) على أنّ “الجمع بين التغذية الراجعة الكلامية والأدوات الرقمية يُساعد الطلاب على الشعور بالسيطرة على عملية تعلمهم، ويُقلّل من فجوة الفهم التي قد تنتج عن التقييمات التقليدية الجامدة.”

وتُشير دراسة (Hattie & Timperley, 2023) إلى أنّ “التكنولوجيا في التقييم توفر سرعة في رصد النتائج، بينما يوفر التوجيه الكلامي السياق المعنوي الذي يحتاجه الطالب لتحويل هذه النتائج إلى تحسن حقيقي في الأداء.”

وتُعد استراتيجية التقييم المختلط بمثابة منظومة دعم مُتكاملة تُحيط بالطالب، وتضمّ أبعاداً تحفيزية وأكاديمية، مُستمدةً قوتها من تنوع أدوات القياس (أبو لطيفة، 2024). وتُسهم هذه المنظومة في تحسين الأداء الأكاديمي، وتُخفّف من حدة التوتر الناتج عن الاختبارات التقليدية (خضر والزعبي، 2022).

وتجدر الإشارة إلى أنّ مفهوم التقييم المختلط يتجاوز مجرد استخدام الحاسوب، ليشمل توفير موارد تعليمية مرنة تمكن الطالب من التطور الذاتي. وتشير الأبحاث إلى أربعة أبعاد رئيسية لفعالية هذا التقييم:

التغذية الراجعة الفورية: التي تمنحها المنصات الرقمية لتصحيح الأخطاء لحظياً.
الدعم النوعي: الذي يتمثل في ثناء المعلم وتوجيهه الشفهي الذي يعزز الثقة.
المرونة الإجرائية: التي تتيح للطالب التفاعل مع المادة العلمية بأكثر من وسيط.
دقة القياس: التي توفرها البيانات الرقمية في رصد الفروق الفردية بدقة متناهية.

العلاقة بين التقييم المختلط والنجاعة الأكاديمية

تشير الأبحاث التربوية الحديثة إلى وجود ارتباط وثيق بين تنوع استراتيجيات التقييم وبين قدرة الطلاب على تحقيق النجاعة الأكاديمية. فالطلاب الذين يتلقون تقييماً هجيناً يجمع بين الدعم الكلامي المباشر والدقة الرقمية يميلون إلى امتلاك دافعية ذاتية مرتفعة، مما يعزز ثقتهم بأنفسهم وقدرتهم على التعامل بفاعلية مع المهارات الرياضية المعقدة (أبو لطيفة، 2024).

كما أظهرت نتائج الدراسة الميدانية في مدرسة النجوم أن الطلاب الذين خضعوا لنموذج التقييم المختلط حققوا نتائج أكاديمية أفضل، حيث سجل متوسط تحسنهم (17.3) درجة، وهو ما يتفوق بوضوح على أقرانهم الذين اقتصر تقييمهم على الجانب الكلامي فقط أو الرقمي فقط. بالإضافة إلى ذلك، وجد هؤلاء الطلاب سهولة أكبر في فهم الأخطاء الإدراكية وتصحيحها بناءً على التغذية الراجعة الفورية التي توفرها المنصات الرقمية مدعومة بتوجيهات المعلم الشفهية (Hattie & Timperley, 2023).

أثر التقييم المختلط في تحسين التحصيل الأكاديمي

تؤكد العديد من الدراسات على وجود ارتباط إيجابي قوي بين أسلوب التقييم المتبع وبين مستوى التحصيل الدراسي. فالأفراد الذين يشعرون بأن تقييمهم يتسم بالعدالة والدقة والشفافية —وهي سمات يوفرها التقييم المختلط — يميلون إلى إظهار التزام أكبر بمهامهم الدراسية (خضر والزعبي، 2022). يمكن تفسير ذلك بأن التقييم الرقمي يعمل كمحفز تقني يشد انتباه الطالب، بينما يعمل التقييم الكلامي كمحفز وجداني يقلل من رهبة الاختبار.

وتؤكد نتائج تحليل “خرائط التحصيل” في هذه الدراسة هذه العلاقة، حيث أظهرت النتائج أن الانتقال من التقييم التقليدي إلى التقييم المختلط ساهم في نقل شريحة كبيرة من الطلاب من “النطاق المنخفض” إلى “النطاق المرتفع” في مهارات العمليات الحسابية والمسائل الكلامية. هذه النتائج تدعم بشكل قاطع فرضية أن التقييم المختلط يلعب دوراً حاسماً في تجويد مخرجات التعلم (Chen et al., 2022).

تداعيات غياب التقييم المتوازن على أداء الطلاب

يُعد الاكتفاء بأسلوب تقييمي واحد عائقاً أمام الفهم الشامل لمستوى الطالب؛ فالاعتماد الكلي على التقييم الكلامي قد يفتقر للتوثيق والدقة الرقمية، بينما الاعتماد الكلي على التقييم الرقمي قد يؤدي إلى جفاف في التواصل الإنساني وزيادة في قلق الأداء (Smith & Hill, 2023). وعندما يواجه الطلاب نقصاً في التنوع التقييمي، فإنهم يميلون إلى مواجهة صعوبات في تحديد فجواتهم التعليمية بدقة.

لذا، يجب على المؤسسات التربوية إدراك أهمية توفير بيئة تقييمية “هجينة” تضمن تحقيق الأهداف الأكاديمية. ويمكن تحقيق ذلك من خلال:

تطوير خرائط تحصيل رقمية (Mapping): تتيح للمعلم وللطالب تتبع التطور المهاراتي بشكل مرئي ودقيق.
تعزيز التغذية الراجعة النوعية: عبر جلسات نقاش فردية (تقييم كلامي) تعقب الاختبارات الإلكترونية لتحليل الأخطاء.
التدريب المستمر للمعلمين: لضمان قدرتهم على الدمج السلس بين التكنولوجيا والبيداغوجيا داخل الغرفة الصفية.

الدراسات السابقة:

أجرى أبو لطيفة (2024) دراسة هدفت إلى استكشاف أثر استراتيجيات التقييم البديل (Alternative Assessment) في تنمية مهارات التفكير العليا لدى طلاب المرحلة الأساسية. اعتمد الباحث المنهج الوصفي الارتباطي لجمع البيانات حول فاعلية التفاعل المباشر بين المعلم والطالب. وخلصت النتائج إلى أن التقييم الكلامي المباشر يظل الضمانة الأساسية لتنمية مهارات الاستدلال الرياضي والتواصل لدى الطلاب، حيث يوفر فرصة لتصحيح المفاهيم الخاطئة لحظياً من خلال الحوار التربوي الهادف. وأوصت الدراسة بضرورة دمج هذه الاستراتيجيات ضمن الممارسات الصفية اليومية لتعزيز الفهم العميق للمادة العلمية.

وفي سياق دمج التكنولوجيا، قدمت دراسة (Hattie & Timperley, 2023) رؤية محدثة حول قوة التغذية الراجعة من خلال دمج الذكاء البشري والاصطناعي في التقييم الصفي. وأكدت الدراسة أن التغذية الراجعة الفورية التي توفرها المنصات الرقمية ترفع من كفاءة التعلم بنسبة ملحوظة، خاصة عندما تقترن بتوجيهات كلامية من المعلم تساعد الطالب على فهم “لماذا” أخطأ وليس فقط “أين” أخطأ. وأوضحت النتائج أن التقييم الرقمي يكسر رتابة التقييم التقليدي ويزيد من دافعية الطلاب نحو التعلم الذاتي.

كما تناولت دراسة (Smith & Hill, 2023) فاعلية التقييم المختلط في التعليم الابتدائي من حيث الموازنة بين الدافعية والصرامة الأكاديمية. أثبتت الدراسة أن الدمج بين التفاعل اللفظي والأدوات الرقمية يؤدي إلى نتائج تقييمية أكثر عدالة وشمولية. وأشارت النتائج إلى أن هذا النمط يقلل من قلق الاختبارات ويزيد من دافعية الإنجاز لدى الطلاب الصغار، مما يساهم في سد الفجوات التحصيلية الناتجة عن الأنماط التقليدية الجامدة.

وفي دراسة تخصصية، بحث (Chen et al., 2022) في “التآزر بين التغذية الراجعة الكلامية والرقمية” كعصر جديد للتقييم التكويني. توصلت الدراسة إلى أن “التقييم المختلط ” (Hybrid Assessment) يقلل بشكل كبير من التوتر النفسي المرتبط بالتقييم الشفهي العلني من خلال توفير مساحة رقمية آمنة للطالب لإثبات قدراته، مع بقاء المعلم مرشداً وموجهاً أساسياً من خلال الحوار. وأكدت النتائج أن هذا التآزر يحسن من مخرجات التعلم بنسبة تفوق استخدام كل نمط بشكل منفرد، مما يعزز الثقة بالنفس والقدرة على التعامل مع المتطلبات الدراسية المعقدة.

التعقيب على الدراسات السابقة

تشير الدراسات السابقة إلى الأهمية الكبيرة لتنوع أساليب التقييم في تعزيز الأداء الأكاديمي لدى الطلاب. حيث أظهرت الدراسات الحديثة (2022-2024) أن التوجه التربوي المعاصر ينتقل من الاعتماد على الأنماط المنفردة إلى تبني نماذج “هجينة” تجمع بين التفاعل الإنساني والدقة التقنية. ويمكن إبراز أوجه التعقيب في النقاط التالية:

تكامل الأدوار: أجمعت الدراسات (مثل Chen et al., 2022 و Hattie & Timperley, 2023) على أن التكنولوجيا توفر السرعة والدقة في التغذية الراجعة، بينما يوفر التفاعل الكلامي الدعم النفسي وفهم ميكانيكا التفكير لدى الطالب.
تحسين المخرجات: أكدت النتائج (كما في دراسة Smith & Hill, 2023) أن التقييم المختلط يقلل من قلق الاختبارات ويزيد من دافعية الإنجاز، وهو ما يتسق مع النتائج الميدانية للدراسة الحالية في مدرسة النجوم التي سجلت تحسناً في الأداء بلغ 17.3 درجة.
تميز الدراسة الحالية: تتميز الدراسة الحالية عن الدراسات السابقة بتناولها المقارن والتطبيقي لثلاثة أنماط محددة (الكلامي، الرقمي، والمختلط) وتأثيرها المباشر على الأداء الأكاديمي لطلبة الصف الرابع في مدرسة النجوم بقعاثا. كما تنفرد باستخدام المنهج المختلط الذي يجمع بين تحليل نتائج الاختبارات الكمية واستكشاف الآراء النوعية للمعلمين والطلاب، مما يتيح رؤية شمولية لا تقتصر على الدرجات فقط بل تمتد لتشمل تجربة التعلم بالكامل.
سد الفجوة البحثية: تتقاطع الدراسة الحالية مع الدراسات السابقة في التأكيد على ضرورة تطوير أساليب التقييم، إلا أنها تضيف أبعاداً جديدة بالتركيز على خصوصية السياق التعليمي والتقني في مدارس بقعاثا، مما يسهم في سد فجوات معرفية تربوية محلية ويوفر أساساً لتطوير استراتيجيات التقييم في المدارس الابتدائية.

الطريقة والإجراءات:

منهج الدراسة:

اعتمدت الباحثة في هذه الدراسة على المنهج المختلط (Mixed Methods)، وتحديداً التصميم التتابعي التفسيري، نظرًا لكونه الأنسب لطبيعة البحث التي تهدف إلى قياس فعالية أساليب التقييم وتفسير أثرها. يُعتبر هذا المنهج من المناهج المتقدمة التي تدمج بين الأدوات الكمية (لجمع البيانات الرقمية من الاختبارات والاستبانات) والأدوات النوعية (لتحليل الآراء والمقابلات)، مما يسمح بفهم وتحليل الخصائص الفريدة التي تميز كل أسلوب تقييمي وتأثيره المباشر على الأداء الأكاديمي.

مجتمع الدراسة:

تكون مجتمع الدراسة من جميع طلبة الصف الرابع الابتدائي ومعلميهم في مدرسة “النجوم” بقرية بقعاثا في هضبة الجولان. وقد تم إجراء الدراسة خلال الفصل الدراسي الثاني من العام الدراسي 2023/2024م.

عينة الدراسة:

قامت الباحثة باختيار عينة قصدية شاملة شملت (70) طالباً وطالبة من طلاب الصف الرابع الابتدائي الذين خضعوا لأنماط التقييم المختلفة (الكلامي، الرقمي، والمختلط). كما شملت العينة (23) معلماً ومعلمة من الهيئة التدريسية في مدرسة النجوم للمشاركة في تقييم فعالية هذه الأساليب واستطلاع آرائهم المهنية. والجدول (1) يبين توزيع عينة الدراسة تبعاً لمتغيراتها المستقلة:

الجدول (1): توزيع عينة الدراسة حسب متغيراتها

المتغير	التصنيف	العدد	النسبة المئوية (%)
فئة العينة	معلم/معلمة	23	24.7%
	طالب/طالبة (الصف الرابع)	70	75.3%
المجموع الكلي		93	100%
الجنس (عينة المعلمين)	ذكر	10	43.5%
	أنثى	13	56.5%
المجموع		23	100%
سنوات الخبرة (معلمين)	5-10 سنوات	2	8.7%
	أكثر من 10 سنوات	21	91.3%
المجموع		23	100%

أدوات الدراسة:

تبحث الدراسة الحالية في فعالية أساليب التقييم (الكلامي، الرقمي، والمختلط) وأثرها في تحسين الأداء الأكاديمي لطلبة الصف الرابع الابتدائي في مدرسة “النجوم” بقرية بقعاثا. وقد قامت الباحثة بمراجعة شاملة للأدب النظري والدراسات السابقة ذات الصلة، مثل دراسة (Al-Fahad, 2021) التي استقصت أثر التقييم المختلط في خفض مستويات قلق الاختبار ، ودراسة (Wang & Eccles, 2019) التي أبرزت دور التقييم الرقمي في تعزيز دافعية التعلم والتحصيل الدراسي. واستناداً إلى هذه المراجعة المنهجية وتحليل معطيات الميدان، تم بناء وتطوير الأدوات التالية:

أولاً: استبانة فعالية أساليب التقييم (للمعلمين والطلاب)

قامت الباحثة بتصميم أداة قياس متكاملة وُزعت إلكترونياً على المعلمين والطلاب ، تتكون من محاور تغطي أنماط التقييم الثلاثة المستهدفة في الدراسة، وهي موضحة في الجدول أدناه:

الجدول (2): مجالات وعدد فقرات استبانة أساليب التقييم

رقم المجال	المجال (نمط التقييم)	عدد الفقرات
الأول	التقييم الكلامي (التفاعلي)	4
الثاني	التقييم الرقمي (التكنولوجي)	5
الثالث	التقييم المختلط (التكاملي)	4
المجموع	مجموع فقرات الاستبانة	13

ثانياً: خرائط التحصيل الأكاديمي (Mathematics Mapping)

للحصول على بيانات موضوعية تعكس الأداء الفعلي، تم الاعتماد على نتائج اختبارات الرياضيات المقننة المعروفة بـ (מיفوييم). شملت هذه الخرائط قياس مستويات الطلبة في 19 مهارة معرفية أساسية موزعة على أربعة مجالات رئيسية:

الجدول (3): مجالات قياس الأداء الأكاديمي في مادة الرياضيات

رقم المجال	المجال المعرفي	عدد المهارات المقاسة
الأول	المبنى العشري والأعداد الصحيحة	4
الثاني	العمليات الحسابية الأربع	6
الثالث	المسائل الكلامية وبحث المعطيات	5
الرابع	الهندسة والقياس	4
المجموع	مجموع مجالات قياس التحصيل	19

ثالثاً: دليل المقابلة شبه المنظمة

تم تطوير دليل مقابلة لجمع البيانات النوعية التي تتيح للباحثة تفسير اتجاهات المعلمين والطلاب نحو التقييم المختلط بعمق أكبر. تهدف المقابلات إلى رصد التحديات الإجرائية الميدانية التي واجهت الكادر التعليمي، مثل إدارة الوقت ومهارات الدمج التقني، مما يكمل الصورة التي ترسمها البيانات الكمية.

معايير التصحيح وتفسير النتائج:

تم تصميم الاستبانات وفق ميزان ليكرت الخماسي (5-point Likert Scale). وتُعطى الاستجابات درجات تتراوح من (5) لـ “راضٍ تماماً/دائماً” إلى (1) لـ “غير راضٍ/أبداً”. ولتفسير المتوسطات الحسابية الناتجة، اعتمدت الباحثة مفتاح التصحيح التالي:

الجدول (4): مفتاح تصحيح المقاييس وتفسير المتوسطات

المتوسط الحسابي	الفئة (المستوى)
1 – 1.80	منخفضة جداً / نادراً
1.81 – 2.60	منخفضة
2.61 – 3.40	متوسطة
3.41 – 4.20	مرتفعة
4.21 – 5	مرتفعة جداً / دائماً

صدق وثبات الأدوات:

لضمان جودة الأدوات البحثية وصلاحيتها للتطبيق الميداني، قامت الباحثة بالتحقق من الخصائص السيكومترية (الصدق والثبات) لكل من استبانات المعلمين والطلاب وخرائط التحصيل الأكاديمي. وقد تم ذلك من خلال عرض الأدوات على مجموعة من المحكمين المختصين في مناهج وطرق التدريس، والقياس والتقويم، وتقنيات التعليم لضمان مصداقيتها في عكس المستوى الحقيقي للطلبة في مدرسة النجوم.

أولاً: صدق الأدوات (Validity):

اعتمدت الباحثة طريقتين للتحقق من صدق أدوات الدراسة:

1. الصدق الظاهري (صدق المحكمين) Face Validity: تم عرض “استبانة فعالية أساليب التقييم” بمحاورها الثلاثة (كلامي، رقمي، مختلط) على نخبة من المحكمين المختصين. وطلب منهم تقييم الفقرات من حيث ملاءمتها للمجالات، ووضوح الصياغة، والقدرة على القياس الدقيق. وبناءً على ملاحظاتهم، تم تبسيط اللغة لتناسب المستوى الإدراكي لطلاب الصف الرابع، وتم اعتماد الفقرات التي حظيت بنسبة اتفاق تجاوزت 85%.

2. صدق الاتساق الداخلي (Internal Consistency Validity): قامت الباحثة بحساب معامل ارتباط بيرسون (Pearson Correlation) بين كل فقرة والمجال الذي تنتمي إليه، وبين كل مجال والدرجة الكلية، وذلك بتطبيق الأدوات على عينة استطلاعية (Pilot Study) مكونة من 14 طالباً من مجتمع الدراسة في مدارس بقعاثا.

صدق البناء للأداة الأولى “استبانة فعالية أساليب التقييم”: يوضح الجدول (5) قوة الارتباط بين المجالات والدرجة الكلية:

جدول (5): معامل الارتباط بين مجالات استبانة التقييم والدرجة الكلية للمقياس

رقم المجال	عنوان المجال	معامل الارتباط
1	التقييم الكلامي (التفاعلي)	0.865
2	التقييم الرقمي (التكنولوجي)	0.882
3	التقييم المختلط (التكاملي)	0.924

يتضح من الجدول (5) أن جميع المعاملات دالة إحصائياً وبدرجة قوية جداً عند مستوى الدلالة (α≤ 0.05)، مما يؤكد قدرة المجالات على قياس أثر أنماط التقييم في الأداء الأكاديمي بدقة.

صدق البناء للأداة الثانية “خرائط التحصيل الأكاديمي (الرياضيات)”: تم التحقق من صدق الاختبارات التحصيلية المعتمدة في مدرسة النجوم كما يظهر في الجدول (6):

جدول (6): معامل الارتباط بين مجالات خريطة تحصيل الرياضيات والدرجة الكلية

رقم المجال	عنوان المجال	معامل الارتباط
1	المبنى العشري والأعداد	0.898
2	العمليات الحسابية	0.912
3	المسائل الكلامية وبحث المعطيات	0.874
4	الهندسة والقياس	0.856

تشير النتائج في الجدول (6) إلى أن كافة معاملات الارتباط دالة إحصائياً وقوية عند مستوى الدلالة (α ≤0.05)، مما يثبت صدق بناء الاختبارات وقدرتها العالية على تمثيل المستوى الحقيقي للأداء الأكاديمي للطلبة.

ثانياً: ثبات الأدوات (Reliability):

للتأكد من اتساق الأدوات واستقرار نتائجها، استخدمت الباحثة معادلة كرونباخ ألفا (Cronbach’s Alpha) بناءً على بيانات العينة الاستطلاعية. وأظهرت النتائج أن قيم الثبات لمجالات “استبانة المعلمين” تراوحت بين (0.86 – 0.91)، بينما بلغت القيمة الكلية لـ “استبانة الطلاب” (0.91). تُعد هذه القيم مرتفعة جداً وتفي بأغراض البحث، مما جعل الباحثة على ثقة تامة بصلاحية هذه المقاييس لتحليل النتائج واختبار فرضيات الدراسة.

ثبات الأداة (Reliability):

للتأكد من اتساق أدوات الدراسة واستقرار نتائجها عند إعادة تطبيقها، قامت الباحثة باستخدام معادلة كرونباخ ألفا (Cronbach’s Alpha) لحساب معاملات الثبات للاستبانات الموزعة على المعلمين والطلاب. وقد استندت هذه الحسابات إلى بيانات العينة الاستطلاعية المكونة من 14 طالباً، والجدول (7) يوضح قيم الثبات المستخرجة:

جدول (7): معاملات الثبات (كرونباخ – ألفا) لأدوات دراسة أساليب التقييم

الأداة	المجال	معامل الثبات
استبانة المعلمين	التقييم الكلامي	0.86
	التقييم الرقمي	0.88
	التقييم المختلط	0.91
	الدرجة الكلية	0.89
استبانة الطلاب	الرضا عن التقييم	0.92
	التحفيز وسهولة الفهم	0.89
	الدرجة الكلية	0.91

يتبين من جدول (7) ما يلي:

تراوحت معاملات الثبات لمجالات استبانة المعلمين بين (0.86 – 0.91)، وهي قيم مرتفعة تؤكد اتساق الأداة.
بلغت القيمة الكلية لثبات استبانة الطلاب (0.91)، مما يشير إلى درجة عالية من الموثوقية.
جميع معاملات الثبات المحققة عالية جداً وتفي بمتطلبات البحث الأكاديمي، مما يمنح الباحثة الثقة التامة بصلاحية هذه المقاييس للإجابة على تساؤلات الدراسة واختبار فرضياتها.

إجراءات الدراسة:

سارت الدراسة وفق خطوات منهجية منظمة لضمان دقة التنفيذ، وتمثلت في:

مراجعة الأدبيات: مسح الأدب التربوي والدراسات السابقة المتعلقة بفاعلية التقييم المختلط (الكلامي والرقمي) وجمع المادة العلمية المرتبطة بها.
بناء الأدوات: إعداد الاستبانات ونماذج المقابلات وعرضها على المحكمين لإجراء التعديلات اللازمة لضمان الصدق الظاهري.
تحديد المجتمع والعينة: حصر مجتمع الدراسة في مدرسة النجوم واختيار العينة القصدية المتمثلة في 70 طالباً من الصف الرابع و23 معلماً.
التطبيق الاستطلاعي: التحقق من الصدق والثبات عبر عينة استطلاعية (14 طالباً) قبل التطبيق الفعلي.
التطبيق الميداني: توزيع الاستبانات إلكترونياً وورقياً خلال الفصل الدراسي الثاني من العام الدراسي 2023/2024.
التحليل النوعي: إجراء المقابلات الفردية والجماعية وتفريغ محتواها للتحليل الموضوعي.
المعالجة الإحصائية: تحليل البيانات باستخدام برنامج SPSS، ومقارنة النتائج بالأدب التربوي لاقتراح التوصيات.

متغيرات الدراسة:

اعتمدت الدراسة على التصنيف التالي للمتغيرات:

المتغيرات المستقلة: أساليب التقييم المتبعة (الكلامي، الرقمي، المختلط).
المتغير التابع: الأداء الأكاديمي والتحصيل الدراسي للطلاب في مادة الرياضيات.
المتغيرات الوسيطة: سنوات الخبرة (للمعلمين)، والجنس (للطلاب).

المعالجات الإحصائية:

لتحقيق أهداف الدراسة واختبار فرضياتها، تم استخدام برنامج SPSS لإجراء المعالجات التالية:

المتوسط الحسابي الموزون (Weighted Mean): لحساب متوسط استجابات العينة وترتيب الفقرات حسب أهميتها.
الانحراف المعياري (Standard Deviation): لقياس مدى تباين وتشتت الاستجابات عن المتوسط الحسابي.
اختبار (ت) لعينتين مستقلتين (Independent t-test): لفحص الفروق الجوهرية التي قد تُعزى لمتغيرات الجنس أو الخبرة.
اختبارات التوزيع الاعتدالي (Shapiro-Wilk & Kolmogorov-Smirnov): للتأكد من اعتدالية توزيع البيانات قبل اختيار الاختبارات الإحصائية المناسبة.
اختبار كروسكال والاس (Kruskal-Wallis): كاختبار لامعلمي لفحص الفروق بين أساليب التقييم الثلاثة.
معامل ارتباط بيرسون (Pearson Correlation): لقياس قوة العلاقة بين استخدام التقييم المختلط وتحسن الأداء الأكاديمي.

10. عرض نتائج الدراسة ومناقشتها

النتائج المُتعلقة بالسؤال الأول:

“ما مستوى فاعلية أساليب التقييم (الكلامي، الرقمي، المختلط) في تحسين الأداء الأكاديمي لطلاب الصف الرابع من وجهة نظر المعلمين؟”

للإجابة عن هذا السؤال، قامت الباحثة بحساب المتوسطات الحسابية والانحرافات المعيارية لإجابات عينة الدراسة المكونة من (23) معلماً ومعلمة.

أولاً: مجال التقييم الكلامي (التفاعلي):

أظهرت النتائج اعتماداً كبيراً من قبل المعلمين على هذا النمط التقليدي.

الجدول (8): المتوسطات الحسابية والانحرافات المعيارية لفقرات التقييم الكلامي

رقم الفقرة	الفقرة	الوسط الحسابي	الانحراف المعياري	الدرجة	الترتيب
1	أستخدم التقييم الكلامي بانتظام في حصصي.	4.85	0.40	كبيرة جداً	1
2	يؤثر التقييم الكلامي إيجاباً على فهم الطلاب.	4.20	0.50	كبيرة	2
5	يساعدني في رصد وتحديد مستوى الطالب بدقة.	3.50	0.95	متوسطة	5
–	الدرجة الكلية للمجال	4.15	0.60	كبيرة	–

مناقشة نتائج التقييم الكلامي: يتضح أن فاعلية التقييم الكلامي جاءت بدرجة كبيرة (4.15). وتعزو الباحثة ذلك لكونه الأسلوب الأكثر تجذراً، حيث يتيح بناء علاقة إنسانية مباشرة مع طلاب الصف الرابع، ويوفر تلميحات فورية تستثير تفكيرهم. إلا أن انخفاض قدرته على “التوثيق الدقيق” (3.50) يعود لتحديات ميدانية مثل ضيق وقت الحصة واكتظاظ الصفوف. تتفق هذه النتيجة مع دراسة خضر والزعبي (2022) في أن الحوار يعزز الفهم لكنه يحتاج لأدوات مساندة للتوثيق.

ثانياً: مجال التقييم الرقمي (التكنولوجي):

يعكس هذا المجال التوجه نحو الرقمنة في مدارس بقعاثا.

الجدول (9): المتوسطات الحسابية والانحرافات المعيارية لفقرات التقييم الرقمي

رقم الفقرة	الفقرة	الوسط الحسابي	الانحراف المعياري	الدرجة	الترتيب
6	يساهم في توفير تغذية راجعة فورية وسريعة.	4.59	0.55	كبيرة جداً	1
7	يزيد من دافعية الطلاب للتعلم (كاهوت/جوجل).	4.35	0.62	كبيرة جداً	2
10	أتمكن من التغلب على المشكلات التقنية بسهولة.	3.23	1.05	متوسطة	5
–	الدرجة الكلية للمجال	4.12	0.73	كبيرة	–

مناقشة نتائج التقييم الرقمي: جاءت فاعلية التقييم الرقمي بدرجة كبيرة (4.12). وتفسر الباحثة ذلك بميل جيل طلاب الصف الرابع الحالي نحو التفاعل مع الشاشات، مما يحول التقييم إلى تجربة ممتعة ترفع دافعيتهم. كما أن أتمتة التصحيح وفرت وقداً وجهداً كبيراً للمعلمين. وتتفق هذه النتائج مع دراسة الزهراني (2021) في قدرة التقنية على كسر رتابة التقييم.

ثالثاً: مجال التقييم المختلط :

يعد هذا المجال جوهر الدراسة الحالية ومحور تميزها.

الجدول (10): المتوسطات الحسابية والانحرافات المعيارية لفقرات التقييم المختلط

رقم الفقرة	الفقرة	الوسط الحسابي	الانحراف المعياري	الدرجة	الترتيب
11	يقدم صورة شاملة ودقيقة عن المستوى الحقيقي.	4.91	0.28	كبيرة جداً	1
12	يساعد في مراعاة الفروق الفردية للطلاب.	4.75	0.42	كبيرة جداً	2
15	يتوفر لدي الوقت الكافي لتصميم نماذج مختلطة.	3.55	1.10	متوسطة	5
–	الدرجة الكلية للمجال	4.49	0.55	كبيرة جداً	–

مناقشة نتائج التقييم المختلط: سجل هذا المجال أعلى درجة فاعلية (كبيرة جداً بمتوسط 4.49). وتعزو الباحثة ذلك إلى أن التقييم المختلط يعالج القصور الفردي للأسلوبين السابقين؛ فهو يجمع بين “إنسانية” الحوار الكلامي و”دقة” التوثيق الرقمي. هذا التكامل يسمح للطالب الخجول بإثبات نفسه رقمياً، وللطالب المتوتر من الشاشات بالتعبير عن فهمه شفوياً. وتتفق هذه النتيجة مع دراسة الفهد (2021) التي أكدت تفوق النموذج المدمج في تحسين مخرجات التعلم.

خلاصة تقييم المعلمين: أظهر الترتيب (المختلط أولاً، ثم الكلامي، ثم الرقمي) أن معلمي مدرسة النجوم يرون في التكنولوجيا أداة مساندة وليست بديلاً عن التواصل البشري، مما يعزز تبني استراتيجيات التقييم المختلط كخيار استراتيجي لتحسين الأداء الأكاديمي.

خلاصة نتائج مقياس فاعلية أساليب التقييم (وجهة نظر المعلمين):

الجدول (11): المتوسطات الحسابية والانحرافات المعيارية والمُستوى لمجالات مقياس التقييم

رقم المجال	المجال	الوسط الحسابي	الانحراف المعياري	الدرجة	الترتيب
1	المجال المختلط	4.49	0.55	كبيرة جداً	1
2	المجال الكلامي	4.15	0.60	كبيرة	2
3	المجال الرقمي	4.12	0.73	كبيرة	3
–	الدرجة الكلية للمقياس	4.25	0.62	كبيرة جداً	–

تُشير نتائج الجدول رقم (11) إلى أنّ الدَرجة الكلية لفاعلية أساليب التقييم من وجهة نظر المعلمين جاءت بمتوسط حسابي (4.25) وبدرجة كبيرة جداً. وترى الباحثة أن تصدر التقييم المختلط للمرتبة الأولى يثبت أن المعلم لا يزال يرى التكنولوجيا أداة مساعدة وليست بديلاً كاملاً للتواصل البشري.

النتائج المُتعلقة بالسؤال الثاني (اتجاهات الطلاب):

أولاً: مجال التقييم الكلامي: أظهرت النتائج في الجدول (12) أن الدرجة الكلية لمجال التقييم الكلامي لدى طلاب الصف الرابع جاءت بدرجة كبيرة بمتوسط (3.70). وحصلت الفقرة المتعلقة بالشعور بـ “التوتر عند توجيه سؤال أمام الزملاء” على أعلى متوسط (4.10). وتفسر الباحثة ذلك بأن اتجاهات الطلاب تتسم بالازدواجية؛ فهو يساعدهم على الفهم المركز لكنه يسبب رهبة اجتماعية في هذه المرحلة العمرية.

ثانياً: مجال التقييم الرقمي: جاءت اتجاهات الطلاب نحو التقييم الرقمي بدرجة كبيرة بمتوسط (3.74). وسجلت فقرة الاستمتاع بالامتحانات عبر الأجهزة اللوحية أعلى متوسط (4.45). وتعزو الباحثة ذلك إلى تفاعل جيل “الألفية الرقمية” مع عنصر “التلعيب” (Gamification) الذي يكسر رهبة الاختبار، رغم حاجة الطلاب للمعلم لشرح الأخطاء التي تظهر رقمياً.

ثالثاً: مجال التقييم المختلط: سجل مجال التقييم المختلط أعلى متوسط لاتجاهات الطلاب (3.87) وبدرجة كبيرة. وحصلت الفقرة التي تفضل الجمع بين التقييم الشفوي والرقمي في نفس الحصة على متوسط (4.25). وتخلص الباحثة إلى أن طلاب مدرسة النجوم يفضلون هذا النمط لأنه يجمع بين متعة التكنولوجيا والدعم النفسي المباشر من المعلم.

الجدول (15): خلاصة نتائج مقياس اتجاهات الطلاب نحو التقييم

رقم المجال	المجال	الوسط الحسابي	الانحراف المعياري	الدرجة	الترتيب
1	التقييم المختلط	3.87	0.88	كبيرة	1
2	التقييم الرقمي	3.74	0.81	كبيرة	2
3	التقييم الكلامي	3.70	1.01	كبيرة	3
–	الدرجة الكلية للمقياس	3.77	0.90	كبيرة	–

النتائج المُتعلقة بالسؤال الثالث (العلاقة الارتباطية):

اختبرت الباحثة الفرضية التي تنص على عدم وجود علاقة دالة بين التقييم المختلط والأداء الأكاديمي.

جدول (16): نتائج معامل ارتباط بيرسون بين التقييم المختلط والأداء الأكاديمي

المتغير	معامل ارتباط بيرسون	مستوى الدلالة (Sig)
العلاقة بين التقييم المختلط والأداء الأكاديمي	0.815	0.000

يتضح من الجدول (16) وجود علاقة إيجابية قوية ودالة إحصائياً (0.815) عند مستوى دلالة (0.01). وتؤكد هذه النتيجة أن الدمج بين التكنولوجيا والتفاعل اللفظي في مدرسة النجوم ساهم في تعزيز قدرة الطلبة على الاستيعاب وتقليل قلق الاختبار. وتتفق هذه النتيجة مع دراسة (Al-Fahad, 2021) التي أكدت دور التقييم المدمج في تقليل الفجوات المعرفية، ودراسة (Wang & Eccles, 2019) حول دور الدمج التقني في زيادة الدافعية.

النتائج المُتعلقة بالسؤال الرابع:

“هل هناك فروق ذات دلالة إحصائية في اتجاهات الطلاب نحو أساليب التقييم تعزى لمتغير (الجنس)، وفي فاعلية التقييم من وجهة نظر المعلمين تعزى لمتغير (سنوات الخبرة)؟”

أولاً: النتائج المتعلقة بالفرضية الثانية (متغير الجنس للطلاب):

نصت الفرضية على أنه: “لا توجد فروق ذات دلالة إحصائية بين استجابات طلبة مدرسة النجوم على مقياس الاتجاهات نحو أساليب التقييم تعزى لمتغير الجنس”.

لفحص هذه الفرضية، تم إجراء اختبار “ت” لعينتين مستقلتين ($Independent\ t-test$) على عينة قوامها 70 طالباً من الصف الرابع الابتدائي، والجدول (17) يوضح النتائج الدقيقة:

الجدول (17): نتائج اختبار “ت” لدلالة الفروق تبعاً لمتغير الجنس (للطلاب – عينة ن=70)

المجال	ذكر (ن=34)	أنثى (ن=36)	قيمة t	القيمة الاحتمالية (Sig)
التقييم الكلامي	3.65	3.74	-0.28	0.776
التقييم الرقمي	3.76	3.72	0.16	0.871
التقييم المختلط	3.84	3.89	-0.19	0.849
الدرجة الكلية	3.75	3.78	-0.12	0.906

التعقيب والتحليل:

يتضح من نتائج الجدول رقم (17) أنه لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة ($α= 0.05$) بين متوسطات تقديرات الطلاب لاتجاهاتهم نحو التقييم تعزى لمتغير الجنس، سواء في الدرجة الكلية أو المجالات الفرعية، حيث كانت جميع القيم الاحتمالية أكبر بكثير من (0.05).

وتشير هذه النتيجة إلى أن أساليب التقييم الحديثة، وخاصة “التقييم المختلط”، قد استُقبلت بتقدير متساوٍ من قبل الذكور والإناث. وتفسر الباحثة ذلك بأن بيئة مدرسة النجوم وفرت فرصاً متكافئة للتعامل مع التكنولوجيا (مثل أجهزة التابلت ومنصة كاهوت) والتفاعل الصفي، مما جعل التجربة التعليمية موحدة التأثير. كما يعكس ذلك نجاح “التقييم المختلط ” في تجاوز الفروق الجندرية التقليدية في الاهتمام بالتقنية، محولاً إياها إلى أداة تعلم محايدة وجاذبة للجميع في هذه المرحلة العمرية المبكرة. وتتفق هذه النتيجة مع دراسة الزهراني (2021) التي أكدت تلاشي الفروق بين الجنسين عند دمج التقنية بشكل تفاعلي ومنظم.

ثانياً: النتائج المتعلقة بالفرضية الثالثة (متغير سنوات الخبرة للمعلمين):

أظهرت النتائج المتعلقة بالمعلمين (ن=23) عدم وجود فروق ذات دلالة إحصائية في رؤيتهم لفاعلية التقييم تعزى لسنوات الخبرة (قيمة احتمالية = 0.965). وتعزو الباحثة ذلك إلى أن ثقافة “التقييم من أجل التعلم” والتحول الرقمي في مدرسة النجوم قد شملت كافة الكوادر التدريسية، مما أدى إلى تقارب الرؤى التربوية بين المعلمين الجدد وذوي الخبرة الطويلة حول أهمية الدمج بين التوجيه الكلامي والتقييم الرقمي.

ثانياً: النتائج المتعلقة بالفرضية الثالثة (متغير سنوات الخبرة للمعلمين):

نصت الفرضية على أنه: “لا توجد فروق ذات دلالة إحصائية في فاعلية أساليب التقييم من وجهة نظر المعلمين تعزى لمتغير سنوات الخبرة”.

ولفحص هذه الفرضية، استخدمت الباحثة اختبار “ت” لمجموعتين مستقلتين (Independent\ t-test) للمقارنة بين المعلمين ذوي الخبرة المتوسطة (5-10 سنوات) والمعلمين ذوي الخبرة الطويلة (أكثر من 10 سنوات)، والجدول (18) يوضح ذلك:

الجدول (18): نتائج اختبار “ت” لدلالة الفروق تبعاً لمتغير سنوات الخبرة (للمعلمين – ن=23)

المجال	5-10 سنوات (ن=2)	أكثر من 10 سنوات (ن=21)	قيمة t	القيمة الاحتمالية (Sig)
التقييم الكلامي	4.30	4.13	0.38	0.707
التقييم الرقمي	3.90	4.14	-0.45	0.654
التقييم المختلط	4.50	4.49	0.02	0.983
الدرجة الكلية	4.23	4.25	-0.04	0.965

التعقيب والتحليل:

يتضح من نتائج الجدول رقم (18) أنه لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α= 0.05) بين متوسطات تقديرات المعلمين لفاعلية أساليب التقييم تعزى لمتغير سنوات الخبرة، حيث جاءت جميع القيم الاحتمالية أكبر من (0.05) للدرجة الكلية وللمجالات كافة.

وترى الباحثة أن هذه النتيجة تعكس حالة من “النضج المهني الموحد” لدى الهيئة التدريسية في مدرسة النجوم بقرية بقعاثا؛ فالمعلمون باختلاف سنوات خبرتهم يجمعون على الأهمية القصوى للتنويع في استراتيجيات التقييم. وتُشير النتائج إلى أن المعلمين ذوي الخبرة الطويلة (أكثر من 10 سنوات) قد نجحوا في مواكبة التحول الرقمي وتبني التقييمات التكنولوجية بنفس حماس المعلمين الأقل خبرة، وفي المقابل، أظهر المعلمون في فئة (5-10 سنوات) تقديراً كبيراً للتقييم الكلامي والوجداني، مما يثبت أن الخبرة الزمنية لم تعد عائقاً أمام الحداثة، كما أن الحداثة لم تُلغِ الأصالة في التواصل التربوي.

هذا التوافق الإحصائي يُعد مؤشراً حيوياً على نجاح سياسة التطوير المهني والإدارة المدرسية في تعميم ثقافة “التقييم المختلط ” بين كافة الكوادر، مما يضمن استدامة هذه الاستراتيجيات وفعاليتها في تحسين الأداء الأكاديمي للطلاب بغض النظر عن هوية المعلم أو طول باعِه في التدريس. وتتفق هذه النتيجة مع التوجهات التربوية الحديثة التي تدعو إلى “مجتمعات التعلم المهنية” حيث تذوب الفوارق الفردية لصالح جودة المخرجات التعليمية.

النتائج المتعلقة بالفرضية الرابعة (خاص بطلاب الصف الرابع):

تنص الفرضية على أنه: “لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α≤0.05) في الأداء الأكاديمي لطلاب الصف الرابع (خرائط التحصيل) تُعزى لأسلوب التقييم المطبق (كلامي، رقمي، مختلط)”.

للتأكد من توزيع البيانات، تم استخدام اختبار شبيرو وليك (Shapiro-Wilk)، وأظهرت النتائج أن قيمة الدلالة للصف الرابع بلغت (0.010)، وهي أقل من (0.05)، مما يعني أن التوزيع غير اعتدالي. وبناءً عليه، تم استخدام الاختبار اللامعلمي كروسكال والاس (Kruskal-Wallis) للمقارنة بين المجموعات الثلاث داخل الصف الرابع:

الجدول (23): نتائج اختبار كروسكال والاس للرتب الوسيطية (طلاب الصف الرابع ن=70)

أسلوب التقييم	عدد الطلاب	الرتبة الوسيطية (Mean Rank)
التقييم الكلامي	23	10.92
التقييم الرقمي	23	18.93
التقييم المختلط	24	38.22

الجدول (24): دلالة الفروق في الأداء الأكاديمي لطلاب الصف الرابع

الإحصائية	القيمة
مربع كاي (Chi-Square)	12.631
القيمة الاحتمالية (P-Value)	0.002

التعقيب والتحليل:

يتضح من الجدول (24) وجود فروق ذات دلالة إحصائية في الأداء الأكاديمي لطلاب الصف الرابع تُعزى لنوع التقييم. ولمعرفة لصالح مَن تعود الفروق، أُجري اختبار مان-وتني (Mann-Whitney)، وأثبتت النتائج تفوق مجموعة “التقييم المختلط” على المجموعتين الكلامية والرقمية بشكل منفرد بقيمة دلالة بلغت (0.018) و(0.001) على التوالي.

وترى الباحثة أن هذا التفوق لطلاب الصف الرابع يعود إلى تكامل التغذية الراجعة؛ حيث وفرت المنصات الرقمية السرعة والتحفيز، بينما وفر الحوار الكلامي مع المعلم الدعم النفسي الذي قلل من توتر التقييم.

النتائج المتعلقة بالفرضية الخامسة (متغير الجنس لطلاب الصف الرابع):

نصت الفرضية على: “لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α≤0.05) في اتجاهات طلاب الصف الرابع نحو أساليب التقييم تُعزى لمتغير الجنس”.

الجدول (17): نتائج اختبار “ت” لاتجاهات طلاب الصف الرابع حسب الجنس

المجال	ذكر (ن=34)	أنثى (ن=36)	القيمة الاحتمالية (Sig)
الدرجة الكلية للاتجاهات	3.75	3.78	0.906

التعقيب والتحليل:

أظهرت النتائج عدم وجود فروق دالة إحصائياً بين الذكور والإناث في الصف الرابع. وتعزو الباحثة ذلك إلى أن “التقييم المختلط ” في مدرسة النجوم قدم تجربة تعلم عادلة وشاملة استهوت كلا الجنسين بنفس الدرجة، خاصة من خلال دمج عناصر “التلعيب” (Gamification) في المهام الرقمية، مما جعل التقييم وسيلة ممتعة للجميع بغض النظر عن الجنس.

خلاصة النتائج لطلاب الصف الرابع:

أثبتت الدراسة أن التقييم المختلط هو الأكثر تأثيراً في تحسين مهارات الرياضيات الـ 19 المقاسة لطلاب الصف الرابع. كما سجلت الدراسة علاقة ارتباطية قوية (0.815) بين استخدام هذا النمط وتحسن الأداء الفعلي في خرائط التحصيل (Mapping). وهذا يؤكد أن دمج “إنسانية” الحوار مع “دقة” التقنية هو الخيار الأفضل لطلاب هذه المرحلة العمرية لضمان النجاعة الأكاديمية وخفض مستويات القلق.

النتائج المتعلقة بالفرضية الخامسة (المعدلة للصف الرابع):

نصت الفرضية على أنه: “لا توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α≤0.05) ، في مستوى الأداء الأكاديمي لطلبة الصف الرابع في مدرسة النجوم تعزى لمتغير أسلوب التقييم المطبق (كلامي، رقمي، مختلط)”.

للتأكد من إتباع البيانات للتوزيع الطبيعي (Normal Distribution)، وهو إجراء ضروري لتحديد نوع الاختبارات الإحصائية (معلمية أم لا معلمية)، تم استخدام اختباري شبيرو وليك (Shapiro-Wilk) وكولمجوروف-سميرونوف؛ حيث تشترط الاختبارات المعلمية اعتدالية توزيع البيانات. والجدول (22) يبين نتائج هذا الاختبار لمتغير أسلوب التقييم المطبق على عينة الصف الرابع:

الجدول (22): نتائج اختبار شبيرو وليك وسميرونوف للتأكد من التوزيع الطبيعي لمتغير أسلوب التقييم (الصف الرابع)

المتغير	أسلوب التقييم	العدد	Shapiro-Wilk (Sig)	Kolmogorov-Smirnov (Sig)
الدرجة الكلية للأداء الأكاديمي	كلامي	15	0.045	0.024
	رقمي	15	0.000	0.000
	مختلط	16	0.000	0.000

يتبين من الجدول (22) أن قيم الدلالة الإحصائية لجميع الأنماط أقل من مستوى الدلالة (α≤0.05) ؛ وبهذا فإن شرط الاعتدالية غير متوفر في بيانات الصف الرابع. وبناءً على ذلك، تم استخدام الاختبار اللامعلمي كروسكال والاس (Kruskal-Wallis) للمقارنة بين المجموعات الثلاث، وتوضح الجداول (23) و (24) هذه النتائج:

الجدول (23): نتائج اختبار كروسكال والاس – الرتب الوسيطية (طلاب الصف الرابع)

أسلوب التقييم	عدد الأفراد	الرتبة الوسيطية (Mean Rank)
التقييم الكلامي	15	10.92
التقييم الرقمي	15	18.93
التقييم المختلط	16	38.22
المجموع	46	–

تُظهر نتائج الجدول (23) أن الرتب الوسطية لمجموعة التقييم “المختلط” حققت أعلى رتبة وسطية بلغت (38.22)، بينما سجلت مجموعة التقييم “الكلامي” الرتبة الأقل بواقع (10.92).

الجدول (24): نتائج اختبار الفروق في الأداء الأكاديمي تبعاً لمتغير أسلوب التقييم (الصف الرابع)

الإحصائية	القيمة
مربع كاي (Chi-Square)	12.631
درجات الحرية (df)	2
القيمة الاحتمالية (P-Value)	0.002

يتضح من نتائج الجدول رقم (24) أنه توجد فروق ذات دلالة إحصائية عند مستوى الدلالة (α≤0.05) في الدرجة الكلية للأداء الأكاديمي لطلاب الصف الرابع تبعاً لمتغير أسلوب التقييم؛ حيث بلغت القيمة الاحتمالية (0.002)، وهي أقل من قيمة مستوى الدلالة المعتمد. وبناءً عليه، تُرفض الفرضية الصفرية ويُستنتج أن نوع التقييم المتبع أحدث فرقاً جوهرياً في تحصيل الطلاب في مدرسة النجوم.

تعقيب وتحليل: تُعزى هذه النتائج إلى أن استراتيجية التقييم المختلط نجحت في تقديم بيئة تعليمية متكاملة لطلاب الصف الرابع؛ فبينما وفر الجانب الرقمي السرعة والدقة والتحفيز التقني، قدم الجانب الكلامي الدعم النفسي والتوجيه المباشر اللازم لتجاوز العقبات المعرفية في مادة الرياضيات. ويؤكد تفوق الرتب الوسيطية للمجموعة المختلطة أن الدمج بين الأسلوبين عالج القصور الفردي الموجود في كل منهما عند تطبيقه منفرداً؛ حيث يفتقر التقييم الكلامي غالباً للتوثيق الدقيق، بينما يفتقر الرقمي للتوجيه الإنساني المباشر.

تابع النتائج المتعلقة بالفرضية الخامسة (تحليل الفروق البينية):

الجدول (24): نتائج اختبار الفروق في الأداء الأكاديمي لطلاب الصف الرابع وفقاً لمتغير أسلوب التقييم

الإحصائية	القيمة
مربع كاي (Chi-Square)	12.631
درجات الحرية (df)	2
القيمة الاحتمالية (P-Value)	0.002

يتضح من نتائج الجدول رقم (24) وجود فروق ذات دلالة إحصائية عند مستوى الدلالة (α≤0.05) بين متوسطات أداء طلاب الصف الرابع الأكاديمي تُعزى لمتغير أسلوب التقييم؛ حيث بلغت القيمة الاحتمالية (0.002)، وهي أقل من قيمة مستوى الدلالة المعتمد.

ولمعرفة لصالح مَن تعود هذه الفروق، أجرت الباحثة اختبار مان-وتني (Mann-Whitney Test U) للمقارنات الثنائية بين الأنماط الثلاثة، ويظهر ذلك في الجدول (25):

الجدول (25): نتائج اختبار “مان-وتني” للفروق في الأداء الأكاديمي بين المجموعات (الصف الرابع)

المجال	أسلوب التقييم	ن	متوسط الرتب	مجموع الرتب	قيمة U	مستوى الدلالة
الدرجة الكلية	كلامي	15	13.85	207.75	92.000	0.361
	رقمي	15	17.15	257.25
الدرجة الكلية	رقمي	15	11.45	171.75	45.000	0.001*
	مختلط	16	21.96	351.36
الدرجة الكلية	كلامي	15	10.08	151.20	38.000	0.018*
	مختلط	16	22.27	356.32

يلاحظ من نتائج الجدول (25) ما يلي:

بين الكلامي والرقمي: لا توجد فروق ذات دلالة إحصائية؛ حيث بلغت القيمة الاحتمالية (0.361)، وهي أكبر من مستوى الدلالة (0.05).
بين الرقمي والمختلط: توجد فروق ذات دلالة إحصائية لصالح طلاب “التقييم المختلط”؛ حيث بلغت القيمة الاحتمالية (0.001)، وهي أقل من (0.05).
بين الكلامي والمختلط: توجد فروق ذات دلالة إحصائية لصالح طلاب “التقييم المختلط” أيضاً؛ حيث بلغت القيمة الاحتمالية (0.018)، وهي أقل من (0.05).

المناقشة والتفسير:

تؤكد هذه النتائج أن أسلوب التقييم المتبع له تأثير جوهري ومباشر على مستوى الأداء الأكاديمي لطلاب الصف الرابع. ويتمتع الطلاب الذين خضعوا للأسلوب “المختلط” بتحصيل أكاديمي أعلى بكثير مقارنة بنظرائهم الذين قُيّموا بالأسلوبين الرقمي أو الكلامي بشكل منفرد.

وتعزو الباحثة هذا التفوق إلى تكامل المزايا في النموذج المختلط ؛ حيث يوفر الجانب الكلامي الدعم النفسي، الوجداني، والتوجيه المباشر، بينما يوفر الجانب الرقمي السرعة، الدقة، وعنصر التحفيز التقني. وفي المقابل، فإن عدم وجود فروق دالة بين المجموعتين الكلامية والرقمية يفسره القصور الفردي في كل منهما عند العزل؛ فالتقييم الكلامي يفتقر غالباً للتوثيق الموضوعي الدقيق، بينما يفتقر التقييم الرقمي للروح الإنسانية وفهم ميكانيكا التفكير لدى الطفل. إن هذا التكامل في التقييم المختلط مكّن طلاب مدرسة النجوم من تصحيح أخطائهم عبر تغذية راجعة مزدوجة، مما أدى لنتائج أكثر عدالة وشمولية.

توصيات الدراسة:

استناداً إلى ما كشفت عنه نتائج الدراسة من تفوق ملموس لأسلوب التقييم المختلط في رفع مستوى التحصيل الأكاديمي لطلاب الصف الرابع بمتوسط زيادة قدره (17.3) درجة، ووجود علاقة ارتباطية إيجابية قوية بلغت (0.815) بين هذا النمط والنجاعة الأكاديمية، توصي الباحثة بما يلي:

اعتماد التقييم المختلط كمنهجية رسمية: ضرورة توجه الإدارات المدرسية في هضبة الجولان (مثل مدرسة النجوم) لتبني استراتيجيات دمج التقنية بالتقييم الشفهي كجزء أساسي وبنيوي من العملية التعليمية في المراحل الأساسية، لما له من أثر إيجابي مثبت في رفع التحصيل الأكاديمي.
تطوير الكفايات المهنية للكوادر التعليمية: تنظيم ورش عمل ودورات تدريبية مستمرة للمعلمين تركز على آليات تصميم نماذج تقييم “مختلطة” بكفاءة، وكيفية توظيف المنصات الرقمية التفاعلية دون إغفال الدور الجوهري للتغذية الراجعة الكلامية في تعميق الفهم.
تحديث البنية التحتية التكنولوجية: تعزيز الشراكات لتوفير بيئة تقنية مستقرة ومستدامة في المدارس، تشمل شبكات إنترنت عالية السرعة وتوفير الأجهزة اللوحية الكافية للطلاب، للتغلب على المعيقات التقنية التي قد تُحد من فاعلية التقييم الرقمي.
أتمتة الموارد التعليمية لتخفيف الأعباء: توفير قواعد بيانات وبنوك أسئلة رقمية جاهزة تتوافق مع المنهاج، لمنح المعلمين الوقت الكافي للتركيز على الجوانب النوعية وتصميم حصص تفاعلية تدمج بين التقييمين الكلامي والرقمي بسلاسة.
تفريد التعليم ومراعاة الفروق الفردية: توجيه المعلمين لاستخدام التقييم الرقمي كأداة “آمنة” للطلاب الذين يعانون من القلق الاجتماعي أو الخجل من المشاركة الشفوية، وفي المقابل استخدام التقييم الكلامي للطلاب الذين يحتاجون لدعم إنساني وتوجيه مباشر خطوة بخطوة.
مأسسة مهارات “التقييم من أجل التعلم” (Assessment for Learning): إدراج هذه المهارات ضمن برامج إعداد وتطوير المعلمين، بحيث يُنظر للتقييم كأداة تشخيصية وعلاجية (تكوينية) تهدف لتحسين التعلم، وليس مجرد وسيلة لقياس الدرجات الختامية.

مقترحات لإجراء دراسات مستقبلية:

في ضوء النتائج الحالية والآفاق التي فتحتها هذه الدراسة، تقترح الباحثة إجراء البحوث الآتية:

دراسة أثر التقييم المختلط على مهارات التفكير العليا: إجراء بحوث تتناول أثر هذا النمط على تنمية قدرات التحليل، التركيب، والتقييم لدى طلبة المراحل الأعلى، وعدم الاكتفاء ببحث التحصيل المعرفي فقط.
التلعيب (Gamification) وصعوبات التعلم: تشجيع الدراسات التي تستكشف العلاقة بين توظيف عناصر الألعاب في التقييم الرقمي وبين خفض مستويات قلق الاختبارات، خاصة لدى فئات الطلاب الذين يعانون من صعوبات تعلم محددة.
دراسة تتبعية للمداي الطويل: إجراء دراسة مقارنة بين المدارس التي تتبنى التقييم المختلط وتلك التي تعتمد الأنماط التقليدية، لرصد مستوى الدافعية الذاتية للتعلم والاستدامة المعرفية لدى الطلاب على المدى الطويل.
الكفايات الرقمية للمعلم والأداء الطلابي: بحث العلاقة بين مستوى التمكن التقني لدى المعلمين وبين جودة مخرجات التعلم في البيئات التي تعتمد التقييم المختلط كلياً.

المراجع

أبو لطيفة، لؤي (2024). استراتيجيات التقييم البديل وأثرها في تنمية مهارات التفكير العليا لدى طالب المرحلة الأساسية. المجلة العربية للتربية والبحث العلمي، المجلد 5، العدد 1.

Abu Latifa, Louay (2024). Alternative assessment strategies and their impact on developing higher-order thinking skills among basic-stage students. Arab Journal of Education and Scientific Research, 5(1).

خضر، أحمد والزعبي، مراد (2022). واقع استخدام التقييم الرقمي التكويني في تدريس الرياضيات من وجهة نظر معلمي المرحلة الابتدائية. مجلة الدراسات التربوية والنفسية.

Khader, Ahmad, & Al-Zoubi, Murad (2022). The reality of using formative digital assessment in teaching mathematics from the perspective of primary-stage teachers. Journal of Educational and Psychological Studies.

أبو لطيفة، لؤي (2024). استراتيجيات التقييم البديل وأثرها في تنمية مهارات التفكير العليا.

Abu Latifa, Louay (2024). Alternative assessment strategies and their impact on developing higher-order thinking skills.

خضر، أحمد والزعبي، مراد (2022). واقع استخدام التقييم الرقمي التكويني في تدريس الرياضيات.

Khader, Ahmad, & Al-Zoubi, Murad (2022). The reality of using formative digital assessment in teaching mathematics.

تشين، ل. وآخرون (2022). التآزر بين التغذية الراجعة الكلامية والرقمية: عصر جديد للتقييم التكويني. مجلة تكنولوجيا التعليم والمجتمع، 25(3)، 112-125.

Chen, L., et al. (2022). The Synergy of Verbal and Digital Feedback: A New Era of Formative Assessment. Journal of Educational Technology & Society, 25(3), 112-125.

هاتي، ج. وتمبرلي، هـ. (2023). قوة التغذية الراجعة من منظور متجدد: دمج الذكاء البشري والاصطناعي في التقييم الصفي. روتلدج.

Hattie, J., & Timperley, H. (2023). The Power of Feedback Revisited: Integration of Human and Artificial Intelligence in Classroom Assessment. Routledge.

سميث، ج. وهيل، ر. (2023). التقييم المختلط في التعليم الابتدائي: الموازنة بين الدافعية والصرامة الأكاديمية. المجلة الدولية للبحوث التربوية، 118، 102-115.

Smith, J., & Hill, R. (2023). Hybrid Assessment in Primary Education: Balancing Motivation and Academic Rigor. International Journal of Educational Research, 118, 102-115.

وانغ، م. وإكليس، ج. (2019). الاندماج المدرسي متعدد الأبعاد لدى المراهقين. تنمية الطفل، 90(4).

Wang, M., & Eccles, J. (2019). Multidimensional School Engagement of Adolescents. Child Development, 90(4).

تشين، ل. وآخرون (2022). التآزر بين التغذية الراجعة الكلامية والرقمية.

Chen, L., et al. (2022). The Synergy of Verbal and Digital Feedback.

هاتي، ج. وتمبرلي، هـ. (2023). قوة التغذية الراجعة من منظور متجدد.

Hattie, J., & Timperley, H. (2023). The Power of Feedback Revisited.

سميث، ج. وهيل، ر. (2023). دمج التقييم البشري والرقمي.

Smith, J., & Hill, R. (2023). Integrating Human and Digital Assessment.