مقالات

8: الإحصاء وجمع البيانات - الرياضيات


8: الإحصاء وجمع البيانات - الرياضيات

البيانات الحقيقية: مشاريع إحصائية للمرحلة الرئيسية الثالثة

يتكون هذا المورد من SMILE Mathematics من ستة مشاريع معالجة بيانات تحت عنوان. يحتوي كل مشروع على توجيه للمعلم يعطي فرضية محتملة ضمن الموضوع وأيضًا النتائج المحتملة على مستويات رياضية مختلفة لكل مشروع تحت العناوين: التخطيط والجمع والمعالجة والتمثيل والتفسير والمناقشة.

مواضيع المشاريع هي:

  • الطالب المتوسط
  • بيئة
  • يد سريعة
  • رياضة
  • المواصلات
  • إحصائيات العالم

يحتوي كل موضوع على جدول بيانات داعم ، باستثناء Fast Hand الذي يتطلب من الطلاب جمع بياناتهم الخاصة.

يحتوي الملف المرجعي لمعالجة البيانات على دعم لكل مرحلة من المراحل ، والتي يمكن للطلاب قراءتها قبل تنفيذ المشروع أو استخدامها كمرجع للبحث عن طريقة عرض معينة أو تقنية تحليل أو حساب إحصائي.

يُتوقع من الطلاب استخدام مجموعة من الإحصائيات لمعالجة كل فرضية ، بما في ذلك جداول التردد والمخططات الشريطية والمخططات الدائرية والمخططات الجذعية والأوراق والمخططات المربعة والشعيرة والمخططات المبعثرة والمخططات الشريطية المركبة والمخططات الشريطية المتعددة والرسوم البيانية الخطية. ومن المتوقع أيضًا أن يجدوا متوسط ​​البيانات ووضعها ومتوسطها.


8: الإحصاء وجمع البيانات - الرياضيات

مشروع تحسين تعليم الرياضيات في المدارس (TIMES)

التحقيق في البيانات وتفسيرها 8

الإحصاء والاحتمالية: الوحدة 5السنة 8

الخلفية المفترضة من F-7

من المفترض أنه في السنوات F-7 ، كان لدى الطلاب العديد من الخبرات التعليمية التي تنطوي على اختيار وتحديد الأسئلة أو القضايا من الحياة اليومية والمواقف المألوفة ، والتخطيط للتحقيقات الإحصائية وجمع البيانات أو الوصول إليها. من المفترض أن الطلاب أصبحوا الآن على دراية بالبيانات الفئوية والعدد والمستمرة ، ولديهم خبرات تعليمية في تسجيل مجموعات البيانات الفردية من كل نوع وتصنيفها واستكشافها ، وشاهدوا واستخدموا الجداول والرسوم البيانية للصور والرسوم البيانية العمودية للبيانات الفئوية وبيانات العد مع عدد صغير من التهم المختلفة التي يتم التعامل معها على أنها فئات ، ومخططات نقطية ومخططات جذعية وأوراق لبيانات مستمرة وحساب. من المفترض أن الطلاب على دراية باستخدام الترددات والترددات النسبية للفئات (للبيانات الفئوية) أو الأعداد (لبيانات العد) أو فترات القيم (للبيانات المستمرة). من المفترض أن الطلاب قد استخدموا وقاموا بتفسير المتوسطات (أو الوسائل) والمتوسطات للبيانات الكمية (أي العد أو المستمر). من المفترض أن الطلاب قد أصبحوا على دراية بمفاهيم المتغيرات الإحصائية وموضوعات التحقيق في البيانات. من المفترض أن التركيز في الاستكشاف والتعليق على البيانات المستمرة والحساب كان على كل مجموعة من البيانات في حد ذاته ، ولكن في السنة 6 ، أصبح الطلاب على دراية بالنظر في أكثر من مجموعة واحدة من البيانات الفئوية حول نفس الموضوعات. وبذلك ، فهموا أنهم كانوا يحققون في البيانات الخاصة بأزواج من المتغيرات الفئوية.

أصبح التفكير الإحصائي والإحصائي ذا أهمية متزايدة في مجتمع يعتمد أكثر فأكثر على المعلومات ويدعو إلى الأدلة. ومن هنا نمت الحاجة إلى تطوير المهارات الإحصائية والتفكير في جميع مستويات التعليم وأصبحت ذات أهمية جوهرية في قرن من شأنه أن يضع مطالب أكبر على المجتمع للقدرات الإحصائية في جميع أنحاء الصناعة والحكومة والتعليم.

البيئة الطبيعية لتعلم التفكير الإحصائي هي من خلال تجربة عملية إجراء تحقيقات البيانات الإحصائية الحقيقية من الأفكار الأولى ، من خلال التخطيط وجمع واستكشاف البيانات ، إلى الإبلاغ عن ميزاتها. توفر تحقيقات البيانات الإحصائية أيضًا ظروفًا مثالية للتعلم النشط والخبرة العملية وحل المشكلات. بغض النظر عن كيفية وصفها ، يمكن الوصول إلى عناصر عملية التحقيق في البيانات الإحصائية عبر جميع المستويات التعليمية.

تتضمن تحقيقات البيانات الإحصائية الحقيقية عددًا من المكونات & # 58 صياغة مشكلة بحيث يمكن معالجتها إحصائيًا التخطيط والتجميع والتنظيم والتحقق من صحة البيانات واستكشاف وتحليل البيانات وتفسير وتقديم المعلومات من البيانات في السياق. بغض النظر عن كيفية وصف عملية استقصاء البيانات الإحصائية ، توفر عناصرها إطارًا عمليًا لإثبات وتعلم التفكير الإحصائي ، بالإضافة إلى التعلم التجريبي الذي يمكن من خلاله إدخال المفاهيم والتقنيات والأدوات الإحصائية وتطويرها وتطبيقها وتوسيعها مع انتقال الطلاب. من خلال التعليم.

في هذه الوحدة ، في سياق تحقيقات البيانات الإحصائية ، نبني على محتوى السنوات F-7 للتركيز بشكل أكبر على ما إذا كان بإمكاننا استخدام البيانات للتعليق على حالة عامة أو مجموعة سكانية. يمكننا القيام بذلك إذا كانت بياناتنا ، أو يمكن اعتبارها كذلك ، عبارة عن مجموعة عشوائية من الملاحظات التي تم الحصول عليها في ظروف تمثل الوضع العام أو السكان. لأن هذا الكلام ممتلئ ، سوف نسمي هذا التمثيل العشوائي للبيانات. لذلك في هذه الوحدة ، نأخذ في الاعتبار المزيد حول كيفية جمع البيانات ، وكيفية الحصول على بيانات تمثيلية عشوائية وما يمكننا اعتباره بيانات تمثيلية. نحن نقارن طبيعة التعدادات والمسوحات والتحقيقات الرصدية. غالبًا ما تسمى مجموعات البيانات التي ليست بيانات تعداد عينات من البيانات ، لذلك تتضمن هذه الوحدة بعض المفاهيم التمهيدية لأخذ العينات للحصول على بيانات تمثيلية عشوائية.

المعنى العام لكلمة نموذج هو جزء أو قطعة أو جزء يمثل الكل. في الإحصاء ، تكون عينة البيانات ، أو عينة البيانات ، عبارة عن مجموعة من الملاحظات بحيث يمكن أخذ المزيد ، وأحيانًا أكثر بلا حدود ، من الملاحظات. نريد أن تكون عينة البيانات الخاصة بنا ممثلة بشكل عشوائي لبعض المواقف العامة أو السكان حتى نتمكن من استخدام البيانات للحصول على معلومات حول الوضع العام أو السكان. يمكن اعتبار مجموعة بيانات معينة تمثيلية لبعض الأسئلة أو المشكلات ، ولكن ليس لبعض الأسئلة أو المشكلات الأخرى ، وسيتم أيضًا استكشاف هذه الاعتبارات.

على سبيل المثال ، إذا أردنا معلومات حول آراء الناس حول إعادة تدوير المياه ، في بعض المناطق ، فإن الطريقة المثالية للحصول على عينة من الآراء التي يمكن استخدامها للتعليق على المنطقة بأكملها ، هي عن طريق أخذ مجموعة مختارة عشوائيًا من الأشخاص من الجميع. من الموجودين في البلدة واستفسارهم عن آرائهم. ومع ذلك ، حتى مع توفر السجلات والموارد الكاملة ، فإن هذا يواجه العديد من الصعوبات كما سنرى في هذه الوحدة. ماذا عن استطلاع رأي الأشخاص في مركز التسوق في أيام عطلة نهاية الأسبوع في تلك المنطقة؟ قد يُعتبر هذا ممثلاً بشكل معقول للأشخاص في تلك المنطقة فيما يتعلق بالآراء حول إعادة تدوير المياه ، ولكن إذا أردنا الحصول على معلومات حول الوقت المفضل لدى الأشخاص للتسوق ، فمن الواضح أن هذه الطريقة ستكون غير ممثلة إلى حد كبير للأشخاص في تلك المنطقة.

ولكن حتى إذا كان يمكن اعتبار المتسوقين في عطلة نهاية الأسبوع في مركز التسوق في المنطقة ممثلين لتلك المنطقة ، فنحن نحتاج أيضًا إلى اختيار الأشخاص بشكل عشوائي لأن مجموعة الأشخاص المختارة عشوائيًا فقط هي التي تمثل حقًا كل شخص في المنطقة.

في هذه الوحدة ، نستخدم مصطلح البيانات التمثيلية ليعني مجموعة من الملاحظات التي تم الحصول عليها عشوائيًا في ظروف تمثل حالة أكثر عمومية أو عددًا أكبر من السكان فيما يتعلق بالقضايا ذات الاهتمام.

نحن نبني على مفاهيم التباين التي تم تقديمها عبر السنوات F-7 لاستكشاف هذا المفهوم عن كثب ، بما في ذلك مصادر التباين داخل مجموعات البيانات وعبرها.

في السنة 7 ، رأينا مفهوم واستخدام وتفسير متوسط ​​مجموعة من البيانات الكمية ، وغالبًا ما يُطلق على المتوسط ​​اسم متوسط ​​العينة. لقد رأينا مفهوم واستخدام وتفسير التكرار النسبي لفئة للبيانات الفئوية ، وغالبًا ما يطلق عليها نسبة العينة (لتلك الفئة). في هذه الوحدة ، يقودنا النظر في التباين عبر مجموعات البيانات إلى استكشاف تباين وسائل العينة ونسب العينة عبر مجموعات البيانات التي تم جمعها أو الحصول عليها في نفس الظروف أو ظروف مشابهة.

تستخدم هذه الوحدة عددًا من الأمثلة التي تتضمن أنواعًا مختلفة من البيانات لاستكشاف تمثيل البيانات ، والتباين عبر مجموعات البيانات وداخلها ، وتباين الكميات المحسوبة من البيانات ، مثل المتوسطات أو متوسطات العينة ، ونسب العينة. تسمى هذه الكميات بإحصاءات موجزة. يتم تطوير الأمثلة والمحتوى الجديد ضمن عملية التحقيق في البيانات الإحصائية من خلال ما يلي:

  • النظر في الأسئلة الأولية التي تحفز التحقيق
  • تحديد القضايا والتخطيط
  • جمع البيانات ومعالجتها وفحصها
  • استكشاف وتفسير البيانات في السياق.

هذه المراحل قابلة للتمثيل على الرسم التخطيطي ، على النحو التالي.

تأخذ الأمثلة بعين الاعتبار المواقف المألوفة والتي يمكن الوصول إليها لطلاب السنة الثامنة وفي التقارير في الوسائط الرقمية وغيرها ، وتبني على المواقف التي تم النظر فيها في F-7. تستخدم الوحدة المفاهيم والرسوم البيانية وملخصات البيانات الأخرى التي تم النظر فيها في F-7 ، ولكنها تركز على مكونات التخطيط والجمع لعملية استقصاء البيانات الإحصائية لتطوير فهم مفاهيم التمثيل ومصادر التباين وأخذ العينات والتباين بسبب أخذ العينات.

مراجعة أنواع البيانات والمتغيرات الإحصائية

في F-7 ، درسنا أنواعًا مختلفة من البيانات ، وبالتالي أنواعًا مختلفة من المتغيرات الإحصائية. عندما نجمع البيانات أو نلاحظها ، فإن "ما" الذي سنلاحظه يسمى متغير إحصائي. يمكنك التفكير في المتغير الإحصائي على أنه وصف لكيان تتم ملاحظته أو سيتم مراقبته. ومن ثم عندما نفكر في أنواع البيانات ، فإننا نفكر أيضًا في أنواع المتغيرات. هناك ثلاثة أنواع رئيسية من المتغيرات الإحصائية: المستمر ، والعد ، والفئوي.

بعض الأمثلة على المتغيرات المستمرة هي:

  • الوقت بالدقائق للوصول إلى المدرسة
  • الطول بالسنتيمتر للقدم اليمنى للفتيات في السنة السابعة
  • العمر بالسنين
  • مقدار البدل الأسبوعي

تحتاج جميع البيانات المستمرة إلى وحدات ويتم تسجيل الملاحظات في الوحدات المطلوبة.

يمكن أن تأخذ المتغيرات المستمرة أي قيم في فترات. على سبيل المثال ، إذا قال أحدهم أن ارتفاعه هو 149 سم ، فهذا يعني أن ارتفاعه يقع بين 148.5 سم و 149.5 سم. إذا قالوا أن ارتفاعهم 148.5 سم ، فإنهم يقصدون أن ارتفاعهم يتراوح بين 148.45 سم و 148.55 سم. إذا أبلغ شخص ما عن أن عمره 12 عامًا ، فهذا يعني (عادةً) أن عمره يتراوح بين 12 و 13 عامًا. لاحظ أن الاصطلاح مع العمر هو أن الفترة الزمنية تبدأ من عمرنا بعدد صحيح من السنوات وحتى العدد الصحيح التالي للسنوات. إذا قال أحدهم أن عمره 12 عامًا ونصف ، فهل هناك طريقة معيارية لتفسير الفاصل الزمني الذي يشيرون إليه؟ هل تعني 12.5 سنة حتى 13 سنة ، أم أنها تعني فاصل زمني حوالي 12.5 مع الفترة الفعلية غير محددة بالكامل؟ لاحظ أن تحديدنا للفترات الزمنية في الحديث عن العمر لا يكون عادةً محددًا كما هو الحال عندما نقتبس من طول شخص ما ، ولكن المبدأ هو نفسه ، ولا تكون ملاحظات المتغيرات المستمرة دقيقة أبدًا وتتوافق مع فترات زمنية صغيرة.

يحسب متغير العد عدد العناصر أو الأشخاص في وقت أو مكان محدد أو مناسبة أو مجموعة. كل ملاحظة في مجموعة بيانات العد هي قيمة عد. تحدث بيانات العد عند النظر في مواقف مثل:

  • عدد الأطفال في الأسرة
  • عدد الأشخاص الذين يصلون إلى محطة سكة حديد مركزية في المدينة في فاصل زمني مدته 5 دقائق خلال وقت الذروة
  • حضور مباريات كرة القدم
  • عدد مرات الوصول إلى موقع على شبكة الإنترنت في الأسبوع

يمكننا أن نرى أن المثال الأول أعلاه لمتغير العد يتناقض مع الأمثلة الأخرى ، حيث تميل الأعداد إلى أخذ العديد من القيم المختلفة وناقصًا منها ، في البيانات المتعلقة بالمتغيرات في النقاط 2 و 3 و 4 أعلاه ، تكرار القيم من الملاحظات غير محتملة. أيضًا ، تميل أحجام الملاحظات إلى أن تكون كبيرة ، وأحيانًا تكون كبيرة جدًا. بالنسبة لهذه الأنواع من متغيرات العد ، غالبًا ما تكون أنواع الرسوم البيانية والملخصات المستخدمة للمتغيرات المستمرة مناسبة.

في البيانات الفئوية ، تقع كل ملاحظة في واحدة من عدد من الفئات المميزة. وبالتالي ، يحتوي المتغير الفئوي على عدد من الفئات المميزة. هذه البيانات موجودة في كل مكان في الحياة اليومية. بعض الأمثلة على أزواج المتغيرات الفئوية هي:

  • تفضيل الجنس والحيوانات الأليفة بين القط والكلب
  • البرنامج التلفزيوني المفضل ونشاط العطلة المفضل
  • الجنس والطعام المفضل
  • الرياضة المفضلة ولون الشعر (مثل الشعر الأحمر والأشقر والبني والأسود)

في بعض الأحيان تكون الفئات طبيعية ، مثل الجنس أو التفضيل بين القط والكلب ، وفي بعض الأحيان تتطلب اختيارًا ووصفًا دقيقًا ، مثل نشاط العطلة المفضل أو الطعام المفضل.

أسئلة أولية يمكن أن تحفز التحقيق.

فيما يلي بعض الأمثلة التي تتضمن جمع ، أو الوصول ، أو الحصول على البيانات التي تعتبر اعتبارات التمثيل ومصادر الاختلاف لها ذات أهمية أساسية في التخطيط للتحقيق في البيانات ، وفي المرحلة الأخيرة من التحقيق في البيانات ، التفسير في السياق.

تخطط إحدى المدارس لتقديم الطعام لحفلة نهاية العام (مجانية) وتريد تقدير عدد الأشخاص الذين سيحضرون. هل يجب عليهم تقديم استطلاع لجميع الطلاب أم ينبغي عليهم إجراء مسح لمجموعة فرعية من الطلاب؟
ب ترغب المدرسة في الحصول على آراء أولياء الأمور بشأن عدد من الأمور التي لا تصلح لأسئلة بسيطة. تقرر المدرسة الحصول على آراء من خلال طرح الأسئلة شخصيًا من مجموعة تمثيلية من أولياء الأمور. إنهم يتساءلون عما إذا كانوا سيرسلون رسالة إلى المنزل يسألون فيها عن آباء متطوعين ، أو ما إذا كانوا سيختارون الآباء الذين ستتم مقابلتهم.
C مجموعة من الطلاب مهتمون بالتحقيق في طول الأغاني الأكثر شعبية. قرروا التحقيق في أفضل 25 أغنية على مخططات JJJ السنوية على مدار عدد من السنوات.
D عندما تشبك يديك ، أي إبهام في الأعلى؟ يجد معظم الناس أن الإبهام الأيسر أو الأيمن في الأعلى دائمًا وأنه من الصعب جدًا إمساك أيديهم بحيث يكون الإبهام الآخر في الأعلى. قد يكون هناك ارتباط وراثي في ​​هذه الإجراءات البسيطة. راجع ، على سبيل المثال ، http & # 58 // humangenetics.suite101.com / article.cfm / dominant_human_genetic_traits الذي يتضمن البيان التالي:

& apos ، امسك يديك معًا (دون التفكير في الأمر!). يضع معظم الناس إبهامهم الأيسر فوق يمينهم وهذا هو النمط الظاهري السائد. & apos

تهتم مجموعة من الطلاب بالتحقيق في هذا الأمر.


هـ- ما مدى براعة الناس في تقدير الفترات الزمنية؟ بمعنى ، ما مدى جودة تقدير طول الوقت مثل 10 ثوانٍ؟
تقوم الحكومات ومجلس السرطان ومجموعات أخرى بإطلاق إعلانات ، خاصة في فصل الصيف ، لمحاولة حث الناس على حماية بشرتهم من آثار التعرض لأشعة الشمس. على سبيل المثال ، في تشرين الثاني (نوفمبر) 2009 ، تم إطلاق الحملة لصيف 2009-2010 في شاطئ بوندي ، مع مناشف على الشاطئ تمثل تقديرات مجلس السرطان لعدد الأستراليين الذين سيموتون بسبب سرطان الجلد في العام المقبل. إنهم يرغبون في معرفة ما إذا كان الناس يميلون إلى الالتفات إلى رسائل Slip و Slop و Slap ، وحول الاختلافات مثل ما إذا كان البالغين مختلفين عن المراهقين فيما يتعلق بسلوك الشمس.
ما مدى وعي الناس بالقضايا البيئية؟ ما مدى معرفتهم
من الحقائق ذات الصلة؟
هل يميل الناس إلى استخدام المصعد أو السلالم عند الصعود في محطة حافلات أو قطار؟
ما نسبة أولئك الذين يصعدون يستخدمون المصعد؟
ما هي المدة التي يجب أن يكون فيها اللون الأخضر على أضواء عبور المشاة؟ ما المدة التي يستغرقها الأشخاص لعبور الطريق عند معبر المشاة بأضواء العبور؟

ما ورد أعلاه هو أمثلة لبعض الأسئلة أو الموضوعات العديدة التي يمكن أن تنشأ والتي تتضمن النظر في كيفية جمع البيانات ، ومصادر التباين ، والاختلاف داخل مجموعات البيانات وعبرها. تتضمن الأمثلة أيضًا اعتبارات لملخصات البيانات وكيفية اختلافها عبر مجموعات البيانات. يتم استخدام بعض هذه الأمثلة هنا لاستكشاف تقدم تطور التعلم حول تقصي البيانات وتفسيرها. ينصب التركيز في هذه الوحدة على التخطيط لجمع البيانات ، واستكشاف وتفسير التباين ، وتنوع ميزات البيانات.

تحديد القضايا والتخطيط للحصول على البيانات التمثيلية

في الجزء الأول من عملية استقصاء البيانات ، يبدأ سؤال أو أكثر في عملية تحديد الموضوع الذي سيتم التحقيق فيه. عند التفكير في كيفية التحقيق في هذه ، يمكن أن تظهر أسئلة وأفكار أخرى. صقل هذه الأسئلة والأفكار وفرزها جنبًا إلى جنب مع التفكير في كيفية الحصول على البيانات اللازمة للتحقيق فيها ، ومساعدة تخطيطنا على التبلور. يتم التخطيط لاستقصاء البيانات من خلال تفاعل الأسئلة:

  • "ما الذي نريد أن نعرف عنه؟"
  • "ما هي البيانات التي يمكننا الحصول عليها؟" و
  • "كيف نحصل على البيانات؟"

يتضمن التخطيط للتحقيق في البيانات تحديد متغيراته وموضوعاته (أي حول ما أو من سيتم جمع ملاحظاتنا) وكيفية جمع البيانات ذات الصلة والتمثيلية أو الوصول إليها.

مثال أ & # 58 تقديم الطعام لحفل نهاية العام للمدرسة (مجانًا)

في هذا المثال ، من الناحية المثالية ، ستعرف المدرسة ما تنوي كل أسرة في المدرسة القيام به ، وليس هناك اهتمام بالتعميم خارج المدرسة. من المرجح أن تطلب المدرسة من كل أسرة الرد على استطلاع بسيط يسأل عن عدد ، إن وجد ، من كل خطة عائلية لحضور الحفلة الموسيقية. يسمى هذا النوع من جمع البيانات ، الذي يهدف إلى جمع المعلومات حول كل فرد من السكان ، بالتعداد. ربما لا نفكر في أن النموذج الذي يتم إرساله إلى كل أسرة في مدرسة ما هو عبارة عن تعداد سكاني ، ولكنه مثال بسيط على نموذج واحد.

إذا كان التعداد هو الحصول على المعلومات المطلوبة من كل فرد من السكان ، وإذا كنا مهتمين فقط بالمعلومات الخاصة بذلك السكان ، فكيف يمكن أن تكون هناك أية مشكلات تتعلق بالدقة؟ يقدم السيناريو البسيط أعلاه بعض الأمثلة. حتى مع حسن النوايا والرعاية ، فإن بعض الأشكال لن تصل إلى بعض العائلات ، والبعض الآخر لن يتم إعادته. قد يكون هناك سوء فهم وناقص ، على سبيل المثال ، قد تحسب بعض العائلات طلاب مدارسهم في عدد الحضور ، والبعض الآخر قد لا. قد تحدث تغييرات بين عودة النموذج وليلة الحفلة الموسيقية. استنادًا إلى الخبرة السابقة & ناقص والبيانات السابقة & مطروحًا منها ، قد تكون المدرسة قادرة على السماح لمصادر التباين هذه في تقدير الأرقام لأغراض تقديم الطعام.

نحن في الغالب نربط كلمة & aposcensus & apos بالتعدادات التي تجريها المكاتب الإحصائية الوطنية ، مثل مكتب الإحصاء الأسترالي. تعد هذه التعدادات بمثابة تعهدات رئيسية يتم إجراؤها للحصول على أكبر قدر ممكن من المعلومات حول المتغيرات المهمة للحكومة والصناعة والمجتمع بأسره. تهدف التعدادات الوطنية إلى الحصول على بيانات سكانية ليس فقط من أجل المعلومات الحيوية للتخطيط والاستراتيجيات المستقبلية ، ولكن أيضًا لتوجيه المزيد من عمليات جمع البيانات.

تُجري أستراليا تعدادًا وطنيًا كل خمس سنوات تقريبًا. يطلق عليه تعداد السكان والمساكن. تاريخ التعداد الأسترالي السادس عشر هو 9 أغسطس 2011.

تأتي كلمة & aposcensus & apos من اللاتينية ، censere ، والتي تعني & aposto rate & apos ، والهدف الأساسي والأول لتعداد البلد هو حساب العدد الإجمالي للأشخاص والأعداد في مجموعات مختلفة. هذا جزئيًا سبب إجراء التعداد لجميع السكان.

من المهم جدًا أن يكون لدى الدول بيانات إحصائية دقيقة. تحظى جودة بيانات التعداد السكاني في أستراليا بتقدير كبير على المستوى الدولي. ما الخطأ الذي يمكن أن يحدث في جمع بيانات التعداد؟ هناك العديد من التحديات: ضمان الإبلاغ عن كل شخص في نموذج تعداد واحد فقط ، والتأكد من إكمال كل نموذج تعداد وإعادته ، والسهو ، والأخطاء العرضية ، والأخطاء بسبب اللغة أو صعوبات الفهم ، والأخطاء المتعمدة. تستخدم المكاتب الوطنية للإحصاء العديد من الأساليب الإحصائية المتطورة لتقدير ومراجعة الأخطاء ، و & السماح لأنواع التحديات الموضحة أعلاه.

مثال ب & # 58 إجراء المقابلات من أجل آراء أولياء الأمور

لن تستغرق مقابلة جميع أولياء أمور المدرسة وقتًا طويلاً فحسب ، بل سيكون من الصعب أيضًا تنظيم مقابلات متسقة في إطار زمني معقول. يمثل اختيار الآباء الذين ستجري معهم مقابلات للحصول على آراء تمثيلية التحدي الدائم المتمثل في اختيار كيفية إجراء مسح العينة. سيتم الحصول على عينة عشوائية عن طريق وضع جميع أسماء الوالدين في قبعة واختيار العدد المطلوب من الأسماء من الأسماء المختلطة في القبعة. هذا هو اختيار الأسماء & aposat العشوائية & apos للحصول على عينة عشوائية. إذا كان لدى الطلاب أرقام هوية ، فإن طريقة أخرى لاختيار عينة عشوائية من أولياء الأمور يمكن أن تتمثل في استخدام أرقام عشوائية لاختيار الطلاب بشكل عشوائي ثم طرح أسئلة رأي والديهم. يمكن ببساطة ترقيم الطلاب بأي طريقة واستخدام أرقام عشوائية لاختيار عينة عشوائية من الطلاب ، ومن ثم أولياء أمورهم.

ملاحظات إحصائية عامة حول استطلاعات العينة

قد يكون إجراء استبيانات بالعينة للحصول على بيانات تمثيلية أمرًا صعبًا ومعقدًا للغاية ، وهذا هو سبب وجود شركات اقتراع متخصصة ولماذا يعد تصميم استطلاعات العينة جزءًا كبيرًا من عمل المكاتب الإحصائية الحكومية.

يُفهم أن إجراء استطلاع عن طريق مطالبة الأشخاص بالاتصال هاتفيًا أو تسجيل رأي عبر الإنترنت هو أحد أكثر الطرق غير الموثوقة لجمع البيانات لأن البيانات تمثل فقط أولئك الذين يرغبون في الاتصال أو الرد عبر الإنترنت! يُعد الاتصال الهاتفي بالأشخاص بشكل عشوائي أمرًا أفضل ولكن يجب أن نأخذ في الاعتبار جوانب مثل الوقت من اليوم وماذا نفعل إذا رفض الأشخاص الإجابة على الاستبيان.

في الاستطلاع المدرسي لأولياء الأمور في المثال ب أعلاه ، افترض أننا اخترنا بعناية عينة عشوائية من الآباء وأرسلنا استمارة الاستبيان إليهم بالبريد. سيكون هناك دائمًا غير مجيبين. هل نتجاهلهم؟ يوصى عادةً بمتابعة غير المستجيبين لأن المجموعة الأصلية تم اختيارها عشوائيًا وبالتالي فهي ممثلة ، ولكن أولئك الذين يستجيبون دون أي مطالبة قد يكونون أقل انشغالًا أو أولئك الذين لديهم آراء أقوى. لاحظ أن مقدار الاهتمام المطلوب لعدم الردود يميل إلى أن يكون أكبر عند البحث عن الآراء. إذا كان الاستطلاع يطرح أسئلة حول أمور واقعية لا تميل إلى إنتاج ردود فعل (على سبيل المثال ، ما هو طولك؟

قد يكون هناك شعور بأن آراء أولياء الأمور قد تختلف اختلافًا كبيرًا عبر مستويات المدرسة التي يتواجد فيها أطفالهم. قد يتقرر إجراء الاستبيان عن طريق اختيار أولياء الأمور العشوائيين للطلاب في مستويات مدرسية مختلفة ، أو مستويات مجمعة ، على سبيل المثال ، السنوات 7-8 ، 9-10 ، 11-12. داخل كل مجموعة من هذه المجموعات ، يجب اختيار الآباء بشكل عشوائي كما هو موضح أعلاه. وهذا ما يسمى عينة عشوائية طبقية ، والتجمعات هي طبقات.

كم عدد الآباء الذين يجب اختيارهم؟ إذا تم استخدام نهج طبقي ، فكم عددًا إجماليًا ، وكم عددًا من كل من المجموعات أو الطبقات؟ يمكن أن تكون الإجابات الرسمية على الأسئلة المتعلقة بعدد الملاحظات التي يجب اختيارها معقدة وتعتمد دائمًا على ما تحاول تحقيقه. بالنسبة لخطط أخذ العينات بخلاف أخذ العينات العشوائية البسيطة من عدد كبير جدًا من السكان ، فهذه أسئلة للإحصائيين وربما طلاب الجامعات المتقدمين الذين يدرسون الإحصاء في الاعتبار. ومع ذلك ، فإن أحد المبادئ التي تُستخدم غالبًا في أخذ العينات الطبقية هو اختيار المزيد من الطبقات التي تميل إما إلى وجود عدد أكبر من الأشخاص فيها أو تباين أكبر وناقصًا في هذه الحالة ، من الآراء. كما يمكنك أن تتخيل ، غالبًا ما يسير هذان الشخصان (المزيد من الأشخاص وتنوع أكبر في الآراء) جنبًا إلى جنب!

هناك نوع آخر من أخذ العينات من غير المحتمل أن يكون مناسبًا في المثال ب ولكن يمكن أن يكون مناسبًا في حالات مثل أخذ عينات من الأسر في مدينة كبيرة جدًا ، وهو أخذ العينات العنقودية. يتم تقسيم مجموع موضوعات أخذ العينات (مثل الأسر) إلى مجموعات عديدة (مثل الشوارع أو الكتل) يتم اختيار المجموعات بشكل عشوائي ، ويتم مسح جميع الوحدات في المجموعات المختارة.

ملاحظات إحصائية عامة للمعلومات الأساسية للمعلمين

كم عدد الآباء الذين يجب اختيارهم؟ الإجابات الرسمية على الأسئلة المتعلقة بعدد الملاحظات التي يجب اختيارها ليست مباشرة وتعتمد على ما تحاول تحقيقه. يتم أخذ مثل هذه الأسئلة في الاعتبار على المستوى الجامعي ، ولكن يمكن لطلاب المدارس اكتساب فكرة عن تأثيرات حجم العينة من خلال التحقيق والتجريب.

تعتمد القرارات حول عدد الملاحظات التي سيتم جمعها على أهداف التحقيق في البيانات والمعايير المرتبطة بهذه الأهداف. على سبيل المثال ، قد يكون من المرغوب فيه تقدير معلمة مثل نسبة أو متوسط ​​متغير مستمر. في حالة التقدير ، سيتم التعبير عن المعايير من حيث مدى قربنا من القيمة الحقيقية ، ومدى ثقتنا في تحقيق هذه الدقة المطلوبة.

في حالة تقدير متوسط ​​متغير مستمر ، حتى تحديد مدى الاقتراب الذي نريده ومدى ثقتنا التي نريد أن نكون في هذه الدقة غير كافيين ، نحتاج أيضًا إلى الحصول على فكرة على الأقل عن مدى ميل المتغير المستمر إلى يتغير.

في حالة البيانات الفئوية وتقدير النسبة ، على الرغم من أن فكرة معينة عن القيمة الحقيقية للنسبة مفيدة ، يمكن استخدام نهج متحفظ لا يفترض شيئًا عن النسبة. يمكن إظهار النهج المحافظ رياضيًا بافتراض أن النسبة في مكان ما حول 0.5. على سبيل المثال ، لتقدير نسبة ذات ثقة عالية معقولة في حدود 0.05 من قيمتها الحقيقية ، يمكن أن يتطلب ما يصل إلى 400 ملاحظة إذا كانت القيمة الحقيقية للنسبة قريبة من 0.5. مطلوب أقل إذا كانت القيمة الحقيقية للنسبة أقرب إلى 0 أو 1 على سبيل المثال ، إذا كانت القيمة الحقيقية التي نحاول تقديرها هي 1/3 ، فإننا نطلب ما يقرب من 350 ملاحظة لتقديرها بثقة عالية في حدود 0.05 من قيمة حقيقية. لتقدير نسبة ذات ثقة عالية إلى حد معقول في حدود 0.01 من قيمتها الحقيقية ، يمكن أن يتطلب ما يصل إلى 10000 ملاحظة. لتقديره بثقة عالية معقولة في حدود 0.1 يمكن أن يتطلب ما يصل إلى 100 ملاحظة.

التقدير في حدود 0.1 يعني أنه إذا حصلنا على 55٪ من الأشخاص الذين ، على سبيل المثال ، لديهم إبهامهم الأيسر في الأعلى عند إمساك أيديهم ، فكل ما يمكننا قوله هو أننا واثقون بشكل معقول من أن القيمة الحقيقية تقع في مكان ما بين 45 ٪ و 65٪.

على الرغم من أن الطلاب لا يحتاجون إلى معرفة أي شيء من التفاصيل المذكورة أعلاه حتى الدراسات العليا أو الجامعية ، إلا أنه من المفيد للمدرسين معرفة ذلك حتى يتمكنوا من المساعدة في تطوير وتوجيه مفاهيم الطلاب للتنوع عبر مجموعات البيانات وعدم اليقين في التفكير خارج نطاق البيانات إلى موقف أكثر عمومية قد نعتبر أن البيانات تمثله.

لاحظ أن القيمة الحقيقية للنسبة المشار إليها أعلاه تتعلق بالوضع العام أو السكان الذين تمثل بياناتنا تمثيلهم.

مثال C & # 58 طول الأغاني

الحصول على بيانات لأعلى 25 من مخططات JJJ لعدد من السنوات هو إجراء إحصاء لأعلى 25 مخططًا في هذا المخطط للسنوات المحددة. إنها ليست عينة عشوائية من الأغاني المنتجة أو التي يتم تشغيلها. هل يمكن اعتباره ممثلاً لأفضل 25 أغنية (JJJ) بعد سنوات التجميع؟ هل يمكن اعتباره ممثلاً للأغاني الشعبية بالنسبة لأي سؤال؟ على سبيل المثال ، هل يمكن اعتبار مجموعة البيانات هذه ممثلة لأطوال الأغاني الشعبية وطرحها حتى لو كانت تلك السنوات فقط؟ لا توجد طريقة لمعرفة ، أليس كذلك؟ يجب أن يكون واضحًا جدًا في أي تقرير أن الأغاني التي تم النظر فيها هي أفضل 25 أغنية من أغاني JJJ في كل عام من السنوات المختارة ، ويجب تجنب التعميمات.

مثال D & # 58 أي الإبهام في الأعلى؟

يجد الجميع تقريبًا أنه عند إمساك أيديهم ، يميل نفس الإبهام إلى أن يكون في الأعلى ومن الصعب جدًا الإمساك به بحيث يكون الإبهام الآخر في الأعلى. هذه الملاحظة ، بالإضافة إلى المقالات العلمية مثل تلك الموجودة في http & # 58 // humangenetics.suite101.com / article.cfm / dominant_human_genetic_traits ، تميل إلى الإشارة إلى أنها خاصية يولد بها الفرد ناقصًا سمة وراثية. لتقدير نسبة الأشخاص الذين وضعوا إبهامهم الأيسر في الأعلى عند إمساك أيديهم ، هل يمكننا اختيار أي مجموعة؟ إذا لم تكن هناك معلومات حول كيفية ربط مثل هذه السمة الجينية بسمات أخرى ، فكيف يمكننا اختيار مجموعة بيانات تمثيلية ، وما الذي نريد أن نكون ممثلين له؟ في موقف مثل هذا في تحقيق بيانات حقيقية ، قد نقوم بجمع بيانات عن متغيرات أخرى للتحقيق في إمكانية وجود روابط بين الإبهام في الأعلى ومتغيرات أخرى مثل الجنس واليدين الخ.

على الرغم من أنه يتعين علينا اختيار الأشخاص للمراقبة ، ومن ثم ، كما في المثال ب ، فإننا نختار من & الاستقصاء ، لا يُنظر إلى هذا النوع من التحقيق عادةً على أنه & apossurvey & apos لأننا نراقب خصائص الأشخاص ، وليس من الواضح ما إذا ستكون الأنواع التالية من الإجراءات المستخدمة لمسح الأشخاص أكثر تمثيلاً فيما يتعلق بمسألة أي الإبهام في القمة ، من عينة عشوائية!

مثال E & # 58 تقدير طول الوقت

ما مدى تقدير الأشخاص لطول الوقت مثل 10 ثوانٍ أو دقيقة؟ وكيف يطلب منهم تقديره؟ إحدى الطرق هي استخدام ساعة توقيت وبدء ساعة الإيقاف والموضوع على & aposgo & apos ؛ مع استدعاء الموضوع & aposstop & apos عندما يعتقدون أن الفترة الزمنية قد انتهت. تقديرهم هو الوقت الذي سجلته ساعة الإيقاف. المتغير هو الوقت المقدر أو المقدر ويتم تسجيل الملاحظات لكل شخص.

مثال F & # 58 Sun Protection Survey

ما مدى وعي البالغين والمراهقين بالحاجة إلى الحماية من أشعة الشمس ، وهل يتصرفون بناءً على أي وعي من هذا القبيل؟ هل رسالة Slip ، Slop ، Slap لها أي تأثير؟ كان المسح الوطني للحماية من الشمس 2006-2007 هو المسح الثاني من نوعه الذي تم إجراؤه في 2003-2004. يتم تمويل الدراسة من قبل مجلس السرطان الأسترالي والحكومة الأسترالية من خلال مؤسسة السرطان الأسترالية. تعد محاولة الحصول على معلومات دقيقة ومتسقة حول عادات الحماية من أشعة الشمس للأشخاص تحديًا كبيرًا لأن الأشخاص أنفسهم قد يكونون غير متسقين تمامًا في سلوك من هذا النوع ، وقد يعتمد ذلك على عدد من العوامل بالإضافة إلى تفسير الأسئلة. وصل استطلاع 2006-2007 إلى المستجيبين من خلال مقابلات هاتفية أجريت في أمسيات الاثنين والثلاثاء خلال فصل الصيف. ركزت المقابلات على سلوك عطلة نهاية الأسبوع في الصيف ، وسجلت أيضًا ما إذا كان الشخص مراهقًا أم بالغًا ، وفي أي ولاية يعيش. تقدم هذه الأسئلة بيانات عن ثلاثة متغيرات فئوية لكل شخص: سلوك الحماية من أشعة الشمس في الفئة العمرية في عطلة نهاية الأسبوع والموقع (حدد المكان الذي يعيش فيه).

لاحظ الأساليب المستخدمة لمحاولة الحصول على مجموعة تمثيلية قدر الإمكان ، ومحاولة الحصول على تناسق في شروط الأسئلة. يتم استخدام الاتصال الهاتفي العشوائي ، ويتم إجراء المكالمات الهاتفية في أمسيات نهاية الأسبوع بحيث يكون أولئك الموجودون في المنزل ممثلين لجميع السكان. يخدم إجراء المكالمات يومي الاثنين والثلاثاء غرضين: يقل احتمال خروج الناس في تلك الليالي الأسبوعية ، وكلما اقتربنا من عطلة نهاية الأسبوع ، كان ذلك أفضل لتحقيق ذاكرة دقيقة. إن السؤال عن سلوك عطلة نهاية الأسبوع يساعد في الحصول على تناسق في الظروف حيث أن ظروف العمل متغيرة للغاية. من المرجح أيضًا أن تشمل أنشطة عطلة نهاية الأسبوع الأنشطة الخارجية عبر مجموعة كبيرة من الأشخاص.

مثال G & # 58 الوعي والمعرفة البيئية

لاحظ أن هناك جانبين في هذا الموضوع لأن وعي الناس يختلف عن معرفة الناس. ومن ثم ستحتاج أسئلة الاستطلاع إلى تغطية كلا الجانبين ، وستحتاج إلى تفكير متأني وسيستغرق الاستبيان بضع دقائق على الأقل لإكماله. هل ينبغي إجراء مسح كهذا شخصيًا أم لا؟ إجراء الاستبيانات عن بُعد ، سواء أكان ذلك عن طريق الورق أو عبر الإنترنت ، أقل تكلفة ويمكن أن تصل إلى عدد أكبر من الأشخاص ، لكن يجب ألا يكون للأسئلة أي احتمال على الإطلاق لأي غموض وهناك مشكلة عدم الردود ، خاصة من وجهة النظر التمثيلية. هذا هو السبب في أن بعض تصميمات الاستطلاع تستخدم أسلوب المتابعة مع غير المستجيبين.

يجب أن تكون أسئلة الاستطلاع واضحة تمامًا لجميع المستجيبين. ما لم يكن معروفًا بالضبط ما يعنيه كل سؤال لكل مستجيب ، فإن بيانات الاستطلاع عديمة الفائدة.

إذا تم إجراء استطلاع شخصيًا ، فمن الأفضل أن تكون لديك الأسئلة على الورق بحيث يتم طرح الأسئلة نفسها بالضبط بنفس الترتيب. بنفس القدر من العناية المطلوبة في إعداد الأسئلة وتجربتها مسبقًا. تتمثل مزايا استبيان & aposin-person & apos في أنه يميل إلى أن يكون أسهل على الأشخاص للاستجابة ، وبالتالي فإن معدل الاستجابة يميل إلى أن يكون أفضل أسباب عدم الاستجابة في بعض الأحيان يمكن ملاحظة أي غموض غير متوقع يمكن تصحيحه ويمكن ملاحظة التعليقات الإضافية وإجمالي تميل الجهود التي يبذلها المستجيبون إلى أن تكون أقل ، مما يؤدي إلى الحصول على بيانات أكثر جودة وأفضل.

سؤال مثل "هل أنت قلق بشأن القضايا البيئية؟" يمكن أن يكون سؤالًا رئيسيًا. كثير من الناس سيترددون في قول لا ، أو حتى لا يعرفون. قد تكون أفضل طريقة للسؤال عن القلق هي أن تطلب من شخص ما تقييم درجة اهتمامه بالقضايا البيئية من 1 إلى 5 من الاهتمام المتزايد مع 3 محايد. (1 غير مهتم على الإطلاق و 2 غير مهتم و 3 محايد و 4 قلق و 5 قلق للغاية).

هناك العديد من الاعتبارات في تصميم استبيان مثل هذا ، تتم مناقشة بعضها بشكل عام أدناه.

ملاحظات إحصائية عامة حول أسئلة المسح

في استطلاع كما في المثال G ، يمكن مسح المعرفة (على سبيل المثال ، القضايا البيئية) من خلال أسئلة البيانات الواقعية وطلب إجابة صحيحة أو خاطئة أو لا تعرف. يُنصح بمزيج من العبارات الصحيحة والخاطئة ، ويوصى أحيانًا بالبدء بعبارة يسهل الإجابة عليها لمساعدة الأشخاص على البدء.

كما هو مذكور في المثال (ج) ، فإن العبارات أو الأسئلة التي يصعب الاختلاف معها ، يمكن أن تضغط على المستجيبين بالإضافة إلى احتمال تشويه المعلومات. على سبيل المثال ، في سياق المثال ز ، سؤال مثل & apos هل توافق على أن وسائل الإعلام يمكنها فعل المزيد لخلق الوعي بالقضايا البيئية المهمة؟ & apos و & apos ؛ هل تقوم بإعادة التدوير قدر المستطاع؟ معلومة.

تمرين: اقترح طرقًا يمكن من خلالها صياغة أسئلة حول هذه القضايا من أجل الحصول على معلومات دقيقة.

في الاستطلاع ، السؤال المفتوح هو السؤال الذي يُسمح فيه للمستجيبين بالإجابة بكلماتهم الخاصة ، السؤال المغلق هو السؤال الذي يتم فيه إعطاء المستجيبين قائمة بالبدائل للاختيار من بينها إجابتهم. عادةً ما يقدم النموذج الأخير خيار & aposother & apos حيث يُسمح للمستفتى بالملء في الفراغ. كلا النوعين من الأسئلة لهما نقاط قوة ونقاط ضعف.

لإظهار محدودية الأسئلة المغلقة ، ضع في اعتبارك المثال G وكيفية طرح ما يعتقده الناس أنه أهم المشكلات (أو التحديات) البيئية. يمكن طرح هذا السؤال عن طريق سؤال مفتوح أو مغلق ، حيث يتكون الأخير من قائمة للمستجيبين لاختيار الأكثر أهمية أو ترتيب الأهمية.

إذا كانت الأسئلة المغلقة مفضلة ، فيمكن تقديمها أولاً كأسئلة مفتوحة لعينة اختبار قبل الاستطلاع الحقيقي ، ويمكن بعد ذلك تضمين الإجابات الأكثر شيوعًا في قائمة الاختيارات للسؤال المغلق. يجب دائمًا إجراء هذا النوع من الاستقصاء & apospilot ، الذي يمكن من خلاله تجربة جوانب مختلفة من تصميم الدراسة قبل فوات الأوان لتغييرها.

أكبر مشكلة في الأسئلة المفتوحة هي صعوبة تلخيص النتائج. إذا اشتمل الاستطلاع على آلاف المستجيبين ، فقد يكون تصنيف ردودهم عملًا روتينيًا كبيرًا. مشكلة أخرى هي أن صياغة السؤال قد تستبعد عن غير قصد الإجابات التي كان من الممكن أن تكون جذابة لو تم إدراجها في قائمة الخيارات (مثل سؤال مغلق).

هناك مزايا وعيوب لكلا النهجين. يتمثل أحد الحلول الوسط في أن تطلب من عينة اختبار صغيرة أن تسرد أول عدة إجابات تتبادر إلى الذهن ، ثم استخدم أكثرها شيوعًا. يمكن استكمالها بإجابات إضافية قد لا تتبادر إلى الذهن بسهولة.

ملاحظات إحصائية عامة حول سرية المسح / عدم الكشف عن هويته

غالبًا ما يجيب الأشخاص على الأسئلة بشكل مختلف بناءً على الدرجة التي يعتقدون أنها مجهولة الهوية. نظرًا لأن الباحثين غالبًا ما يحتاجون إلى إجراء استطلاعات متابعة ، فمن الأسهل محاولة ضمان السرية بدلاً من إخفاء الهوية. لضمان السرية ، يتعهد الباحث بعدم نشر معلومات تعريفية عن المستجيبين. في استبيان مجهول ، لا يعرف الباحث هوية المستجيبين.

هذه الاعتبارات مهمة جدًا أيضًا في بيانات التعداد السكاني للدولة. في أستراليا ، عدل قانون تعديل تشريع معلومات التعداد السكاني لعام 2005 قانون التعداد والإحصاء لعام 1905 وقانون المحفوظات لعام 1983 من أجل الكشف عن المعلومات المحددة الاسم التي تم جمعها في تعداد 2006 وجميع التعدادات اللاحقة ، من تلك الأسر التي تقدم موافقة صريحة ، سيتم الحفاظ عليها لأبحاث الأنساب المستقبلية وغيرها ، وتم إصداره بعد 99 عامًا http & # 58 // www.aph.gov.au / library / Pubs / BD / 2005-06 / 06bd071.htm. كان مشروع القانون هذا بمثابة حل وسط بين احتياجات التاريخ والحاجة إلى الحصول على بيانات تعداد دقيقة.

يمكن أن تكون المعلومات حول سلوك الناس مهمة في تصميم المرافق العامة. يجب أن تكون محطات الحافلات والقطارات قادرة على التعامل مع العديد من الأشخاص في ساعات الذروة. تحتوي معظم محطات الحافلات الكبيرة على سلالم ومصاعد وناقص ليس فقط لمحطات حافلات الأنفاق ، ولكن أيضًا لربط ممرات المشاة بالأرصفة ، تمامًا مثل محطات القطار. بالإضافة إلى معلومات حول عدد الأشخاص الذين يستخدمون المحطات في أوقات مختلفة ، يمكن أن تكون تقديرات نسبة المستخدمين الذين يميلون إلى استخدام السلالم أو المصاعد بمثابة مدخلات قيمة في عملية التصميم.

لجمع البيانات ذات الصلة ، يجب اختيار أوقات معينة ، وتسجيل عدد الأشخاص الذين يستخدمون السلالم أو المصاعد للصعود أو النزول في تلك الفترات الزمنية. على الرغم من أن هذا قد يُنظر إليه على أنه دراسة قائمة على الملاحظة وليس تعدادًا أو مسحًا أو تجربة ، لاحظ أنه لا تزال هناك خيارات يتعين اتخاذها للحصول على بيانات تمثيلية ناقصًا أوقات المراقبة.إذا كانت فترات الذروة مصدر قلق ، فسيتم اختيار هذه الفترات. لاحظ أنه لن يتم اختيار الأوقات بشكل عشوائي ، بل إن فترات المراقبة هي الظروف التي يتم فيها إجراء الملاحظات.

مثال & # 58 كم من الوقت يجب أن يدوم اللون الأخضر؟

مثل المثال ح ، سيكون هذا الموضوع مدفوعًا بقضايا التصميم. من الواضح أن طول اللون الأخضر لمجموعة من أضواء المشاة يعتمد على عرض المعبر. يمكن الاستفادة من عرض المعبر ومعلومات عن سرعات السير ، ولكن ما هو المهم هنا؟ هل هو متوسط ​​سرعة المشي؟ لا ، لأنه يلزم تخصيص بعض المخصصات للأشخاص الأبطأ ناقصًا ، يجب مراعاة التباين في سرعات المشي. كما أن سرعات المشي في عبور الطريق قد تختلف عن سرعات المشي بشكل عام. ومن ثم ، فإن البيانات المتعلقة بالوقت الذي يستغرقه الأشخاص لعبور طريق في نوع معين من المنطقة (على سبيل المثال في المدينة ، عند معبر المدرسة) يمكن أن تكون معلومات قيمة عند العبور من هذا النوع ، مما يسمح بعرض مختلف للمعابر.

ما المقدار الذي يجب السماح به للتباين في الأوقات للعبور؟ أي ، ما مقدار بدل الاختلاف الذي يجب أن يكون هناك؟

كما في المثال ح ، ستكون هذه دراسة قائمة على الملاحظة ، ولكن مع التحكم في شروط الملاحظات. في مثل هذه الدراسات ، يعد تقديم التفاصيل الكاملة لكيفية ومتى وأين جمع البيانات ، جنبًا إلى جنب مع أوصاف الظروف لشرح أي خيارات للشروط ، أمرًا ضروريًا للتفسير السليم للبيانات ، ولتوسيع الدراسة أو يتكرر في المستقبل إذا أصبح هذا مرغوبًا فيه.

التباين داخل مجموعات البيانات وعبرها

الإحصاء هو علم الاختلاف وعدم اليقين ، مطروحًا منه علم الاستقصاء والتعرف والقياس والتقدير والوصف والنمذجة والعزو والتفسير والتقليل والسماح بالتباين وعدم اليقين.

في شريط البيانات ، نركز أكثر على جوانب التباين. سننظر في بعض جوانب الاختلاف في الأمثلة المذكورة أعلاه.

يهدف التعداد إلى الحصول على معلومات من جميع السكان. لا تظهر أسئلة التمثيلية إذا كانت لدينا المعلومات المطلوبة عن جميع السكان. عند الإبلاغ عن بيانات التعداد واستخدامها ، يعد تحديد التباين ووصفه والتحقيق فيه وإسناده أمرًا مهمًا ، ولكن من حيث المبدأ لا يتعين علينا النظر في التباين وعدم اليقين بسبب أخذ العينات وطرحها بسبب وجود مجموعة فرعية من مجموعة سكانية كاملة ، أو وجود مجموعة من الملاحظات تمثيلية بطريقة ما لحالة أكثر عمومية.

هذا هو مبدأ & apos ، لأنه في التعدادات الكبيرة والمعقدة ، مثل التعدادات الوطنية ، يجب التحقق من الأخطاء ، والسهو ، وعدم الرد أو حتى عدم الاتصال ، ونمذجة ، وتقدير ، والسماح بها. مثل هذه القضايا معقدة وصعبة للغاية وتتطلب خبرة ومعلومات إحصائية متقدمة للغاية. يتطلب التقليل من مخاطر هذه الصعوبات أيضًا معرفة وخبرة حكومية وإحصائية كبيرة ، مع تخطيط شامل وعالي الجودة.

يتضمن المثال (أ) ، على نطاق صغير ، بعض تحديات التعداد. يجب الاتصال بجميع العائلات ، يجب أن يكون السؤال (الأسئلة) واضحًا لتجنب الأخطاء غير المقصودة ، يجب تخصيص بدل للإبلاغ الخاطئ (في حالة المثال أ ، هذا في الأساس تغييرات في الخطط بعد إعادة النموذج) وعدم إرجاع تتطلب النماذج تقدير النوايا المجهولة لغير المستجيبين. في المثال أ ، قد لا تكون تأثيرات هذه المشكلات كبيرة وناقصًا بعد كل شيء ، لا يزال هناك تقدير مطلوب لمقدار تقديم الطعام المطلوب حتى لو كان الحضور معروفًا بدقة! لكن المثال يقدم فكرة ما على الأقل عن التحديات الهائلة (والنفقات) للتعداد الوطني. ولكن لا يمكن التأكيد بشكل كافٍ على الحاجة إلى بيانات التعداد الوطنية عالية الجودة وقيمة هذه البيانات لكل جانب من جوانب التخطيط الاستراتيجي لبلد ما.

نشاط الفصل الدراسي: استكشف موقع المكتب الأسترالي للإحصاء على بيانات التعداد http & # 58 // www.abs.gov.au / websitedbs / d3310114.nsf / home / census + data اعثر على التقرير الخاص بموقعك وحدد اثنين على الأقل من التخطيطات القضايا الخاصة بموقعك والتي توفر بيانات التعداد معلومات قيمة عنها.

في المثال C ، يمكن اعتبار مجموعة البيانات بمثابة إحصاء لأفضل 25 أغنية على مخططات JJJ للسنوات التي تم جمع البيانات من أجلها. الأخطاء أو الإغفالات الوحيدة هنا هي جمع الأخطاء. تُظهر الحبكة النقطية والمؤامرة الجذعية والأوراق أدناه أطوال (بالثواني) أفضل 25 أغنية لـ JJJ للفترة 1993-2006.

1 /> 0 /> 9
17 1 0000122234444444
82 1 55555555556666667777777777777778888888888888888899999999999999999+
(150) 2 00000000000000000000000000000000001111111111111111111111111111111+
118 2 55555555555555555555666666666666666666666667777777777777777777888+
41 3 0000000000011111111112222244
13 3 55556688
5 4 022
2 4 6
1 5
1 5 7

تختلف الأطوال من 90 ثانية إلى أغنية طويلة بشكل غير عادي (مقارنة بالباقي) من 570 ثانية (إلى أقرب 10 ثوانٍ). ثاني أطول أغنية هي 460 ثانية. ومع ذلك ، فإن جميع الأغاني تقريبًا تتراوح مدتها بين دقيقتين و 6 دقائق ، ومعظمها بين
3 و 5 دقائق.

أيهما تعتقد أنه سيكون أكبر لهذه البيانات؟ المتوسط ​​أم الوسيط؟ الإجابة & # 58 هي المتوسط ​​نظرًا للقيم القليلة الأكبر بكثير من باقي القيم في الواقع ، يبلغ متوسط ​​الطول 234 ثانية والوسيط 229 ثانية.

بيانات العينة & # 58 البيانات الفئوية

بالنسبة للمتغيرات الفئوية ، ناقص وبالتالي البيانات الفئوية وناقص ، نحن مهتمون بالترددات النسبية أو النسب من الفئات المختلفة. إذا كانت لدينا بيانات التعداد ، فيمكننا ببساطة الإبلاغ عن النسب المئوية أو النسب لبلد ما. إذا كان لدينا بيانات نموذجية تمثل بعض المواقف العامة ، فنحن مهتمون باستخدام بيانات العينة لتقدير النسب للموقف الأكثر عمومية.

ومن ثم فإننا بحاجة إلى فكرة عن مقدار التباين الذي يمكننا الحصول عليه عبر عينات مختلفة من البيانات ، وبالتالي مقدار التباين الذي يمكننا الحصول عليه في تقديرنا للنسبة في الموقف الأكثر عمومية. تشارك في هذه الأسئلة أيضًا أسئلة:

  • ما إذا كانت العينة (العينات) من البيانات الخاصة بنا تمثل الموقف العام ناقصًا أو ، من وجهة نظر أخرى ، ما الذي يمكن أن نعتبره عينة (عينات) من البيانات لدينا تمثيلية؟
  • هل يمكن أن يُعزى أي اختلاف نلاحظه إلى بعض المتغيرات الأخرى أو أن نفسرها؟

مثال D & # 58 أي الإبهام في الأعلى؟

عندما يمسك الأفراد بأيديهم ، يميل الإبهام الأيسر أو الأيمن إلى أن يكون في الأعلى ومن الصعب جدًا إمساك يدي أحدهم بالإبهام الآخر في الأعلى. يُزعم أن هذه خاصية مرتبطة وراثيًا ، تمامًا كما أن قدرة الناس على لف جوانب ألسنتهم أم لا هي خاصية وراثية.

لذلك يجب أن يكون من السهل بشكل معقول تقدير نسبة الأشخاص بشكل عام الذين يضعون إبهامهم الأيسر في الأعلى عندما يمسكون أيديهم. يُزعم أن الإبهام الأيسر في الأعلى مهيمن وراثيًا (انظر ، على سبيل المثال ، http & # 58 // humangenetics.suite101.com / article.cfm / dominant_human_genetic_traits). أي ، لا داعي للقلق بشأن ظروف جمع البيانات وأي عينة عشوائية معقولة وربما ناقص تجنب الأقارب داخل العينة ويجب أن يكون ناقصًا تمثيليًا بشكل معقول.

ولكن كم عدد الملاحظات التي يجب أن نجمعها لتقدير نسبة الأشخاص الذين يضعون إبهامهم الأيسر في الأعلى وكم ستختلف نسبة العينة لدينا على عينات مختلفة؟

في مجموعة من 203 أشخاص ، يوضح الرسم البياني التالي عدد الأشخاص الذين لديهم إبهامهم الأيسر
على القمة.

كانت النسبة المئوية لهؤلاء الأشخاص 203 الذين لديهم إبهام الأيسر في الأعلى حوالي 57٪.

مهما كانت النسبة المئوية الحقيقية الإجمالية للجميع & ناقص أي ، بغض النظر عن النسبة المئوية للأشخاص الذين لديهم إبهامهم الأيسر في الأعلى عندما يمسكون أيديهم وناقصًا ، فلن نحصل على هذه النسبة المئوية عندما نأخذ عينة من الأشخاص بغض النظر عن مدى تمثيل العينة لدينا يكون. في الواقع ، لأن العينة عشوائية لن نحصل على نفس النسبة المئوية. يسمى التباين عبر عينات البيانات تقلبية أخذ العينات. ما مدى روعة هذا الاحتمال؟

بافتراض أن 57٪ هي النسبة الحقيقية للأشخاص عمومًا الذين وضعوا إبهامهم الأيسر في الأعلى عند إمساك أيديهم ، فيما يلي مخطط نقطي ومخطط جذعي وأوراق لـ٪ في 100 عينة مختلفة من الأشخاص ، مع كل عينة تتكون من 20 شخصًا تم اختيارهم عشوائيًا. (انظر الملحق 1 لمعرفة كيفية إنشاء مثل هذه البيانات باستخدام Excel.)

الجذع والأوراق للنسب المئوية

1 /> 3 /> 0
3 3 55
6 4 000
15 4 555555555
29 5 00000000000000
47 5 555555555555555555
(17) 6 00000000000000000
36 6 555555555555555555555
15 7 000000000000
3 7 55
1 8 0

النسب المذكورة أعلاه تختلف من 30٪ إلى 80٪!

تم الحصول على العينات المذكورة أعلاه بحجم 20 عن طريق المحاكاة. لكن من السهل جدًا جمع البيانات المتعلقة بكيفية تشبث الناس بأيديهم بسرعة ومن العديد من الأشخاص. اطلب من كل طالب في الفصل أن يطلب من 20 شخصًا إمساك أيديهم والإبلاغ عن عدد إبهامهم الأيسر في الأعلى. استخدم مخطط نقطي أو ساق وأوراق على النحو الوارد أعلاه لإظهار مقدار التباين الموجود في النسب المئوية التي تم جمعها من قبل الطلاب.

لذلك إذا كنا نحاول تقدير نسبة جميع الأشخاص الذين يضعون إبهامهم الأيسر في الأعلى في أيديهم ، يجب أن نجمع كل البيانات التي يمكننا جمعها. افترض أننا جمعنا 200 ملاحظة. يوجد أدناه جذع وأوراق مكونة من 100 عينة ، كل منها من 200 شخص تم اختيارهم عشوائيًا ، مع النسبة الإجمالية للأشخاص الذين وضعوا إبهامهم الأيسر في الأعلى في أيدي المشبكين ، مرة أخرى 57٪.

الجذع والأوراق للنسب المئوية

1 /> 4 /> 8
5 5 1111
19 5 22222233333333
34 5 444444455555555
(23) 5 66666666666677777777777
43 5 88888888899999999999
23 6 00000000001111
9 6 222223
3 6 55
1 6 6

في هذه العينات المائة ، لكل 200 شخص ، لا تزال النسب تختلف من 48٪ إلى 66٪! وإذا أخذنا 100 عينة أخرى ، كل منها من 200 شخص ، فلن نحصل على نفس الاختلاف بالضبط في٪ ’s.

دعونا نرى ما يمكن أن يحدث إذا سألنا 1000 شخص. يوجد أدناه مخطط للساق والأوراق من النسب المئوية لـ 1000 شخص في 100 عينة تم اختيارها عشوائيًا وناقصًا لكل منها 1000 شخص وناقص بافتراض أنه على جميع الأشخاص بشكل عام ، 57 ٪ لديهم إبهامهم الأيسر في الأعلى عند قفل اليدين.

الجذع والأوراق للنسب المئوية

1 /> 53 /> 0
2 54 0
17 55 000000000000000
40 56 00000000000000000000000
(20) 57 00000000000000000000
40 58 00000000000000000000000000
14 59 000000
8 60 00000000

نلاحظ أنه في هذه العينات المائة من 1000 شخص ، تتراوح نسبة٪ مع الإبهام الأيسر في الأعلى من 53٪ إلى 60٪ ليس متغيرًا كما هو الحال في عينات 200 شخص وبالتأكيد أقل تغيرًا بكثير من عينات 20 شخصًا.

من الواضح أننا يجب أن نكون حذرين للغاية في الإبلاغ عن٪ ، ومن الواضح أننا بحاجة إلى الكثير من البيانات حتى نتمكن من تقدير النسب بدقة. نحتاج دائمًا إلى الإبلاغ عن عدد الملاحظات التي تم جمعها ، وكيف تم جمعها ، ويمكننا تحديد النسبة المئوية فقط في بياناتنا.

نشاط الفصل الدراسي: ما إذا كان يمكن للناس ثني جوانب ألسنتهم هو متغير وراثي معروف. يمكن للطلاب جمع كميات صغيرة من البيانات (على سبيل المثال ، عينات بحجم 20) للتحقيق في تباين العينة لنسبة الأشخاص الذين يمكنهم ثني جوانب ألسنتهم.

توضح البيانات الخاصة بالمثال ح أدناه مزيدًا من التباين في النسب عبر عينات من بيانات المتغيرات الفئوية

مثال H & # 58 رفع أم صعود الدرج؟

في محطة حافلات معينة ، تم جمع البيانات في يوم عادي خلال أوقات الذروة في الصباح والمساء بهدف محاولة تقدير نسبة الأشخاص الذين يصعدون يختارون استخدام المصعد بدلاً من الدرج. البيانات أدناه مقدمة في شكل جداول ثنائية الاتجاه لكل فترة من فترات الذروة ناقص الصباح والمساء.

جدول اختيار المصعد أو الدرج
للصعود والهبوط & # 58 مساء الذروة

أسفل فوق مجموع
مصعد 76 300 376
سلالم 420 213 633
مجموع 496 513 1009

جدول اختيار المصعد أو الدرج
للصعود والهبوط & # 58 الذروة الصباحية

أسفل فوق مجموع
مصعد 45 222 267
سلالم 204 210 414
مجموع 249 432 681

بشكل عام ، في هذه البيانات ، اختار 522/945 & # 61 0.5524 (أو 55.24٪) من الأشخاص الذين صعدوا استخدام المصعد ، بينما اختار 121/745 = 0.1624 (أو 16.24٪) من الأشخاص المتجهين إلى الأسفل استخدام المصعد مصعد. في المساء ، كانت هذه٪ 58.5٪ و 15.3٪ بينما في ذروة الصباح ، كانت هذه٪ 51.4٪ و 18.1٪. قبل أن تميل إلى القول إن المزيد من الأشخاص يميلون إلى أخذ المصعد للصعود في المساء ، لكن يميلون أكثر إلى رفع المصعد في الصباح (يكون التعب أكثر في المساء ، ولكن في عجلة من أمرهم ينزلون في صباح؟) ، تذكر إلى أي مدى يمكن أن تختلف هذه٪ حتى مع مثل هذه الأعداد الكبيرة من الملاحظات.

فيما يلي نقاط نقطية للنسب المئوية التي تختار المصعد لترتفع لـ 500 شخص في المساء و 430 شخصًا في الصباح إذا كانت النسبة المئوية الحقيقية بشكل عام 59٪ للمساء و 51٪ للصباح.

لاحظ أنه من الممكن الحصول على٪ 's القريبة جدًا من بعضها البعض وحتى الحصول على٪' s في الاتجاه المعاكس مع وجود نسبة مئوية أكبر قليلاً من الأشخاص في الصباح مقارنة بالمساء يختارون المصعد للصعود. لذلك بالنسبة إلى البيانات التي تمت ملاحظتها في الجداول ، يمكننا اقتباس٪ 's ولكننا نقول أن هناك بعض الدلائل على أن السلوك الصباحي يختلف عن السلوك المسائي وناقصًا ولكننا سنكون حذرين.

ماذا يمكن أن يحدث إذا كانت النسب الحقيقية قريبة من بعضها البعض؟ فيما يلي نقاط نقطية للنسب المئوية التي تختار المصعد لترتفع لـ 500 شخص في المساء و 430 شخصًا في الصباح إذا كانت النسبة الحقيقية هي 58٪ للمساء و 52٪ للصباح.

لذلك نرى أن هناك فرصة أكبر لملاحظة٪ ’s القريبة من بعضها البعض أو مع الصباح٪ أكبر من المساء٪.

هل يميل سلوك أخذ العينات نفسه إلى الحدوث مع٪ ’s الأصغر بنسبة 15٪ و 18٪؟ هذه هي النسبة المئوية الملحوظة للأشخاص الذين يختارون استخدام المصعد للنزول في المساء وساعات الذروة الصباحية. هذه هي أقرب بكثير من بعضها البعض من٪ المذكورة أعلاه. دعونا نرى ما يمكن أن يحدث إذا كانت هذه هي٪ 's الحقيقية بشكل عام. في ما يلي النقاط النقطية لـ٪ 's التي تستخدم المصعد في 100 عينة من 500 شخص ينزلون في المساء وفي 100 عينة من 250 شخصًا ينزلون في الصباح ، بافتراض أن النسبة الحقيقية٪ بشكل عام هي 15٪ و 18٪ على التوالى.

لذلك هناك الكثير من التداخل كما نتوقع مع قرب٪ 's الحقيقيين من بعضهم البعض. لاحظ مدى تباين٪ في المجموعات الصباحية نظرًا لوجود 250 فقط في كل مجموعة مقارنة بـ 500 في كل مجموعة من المجموعات المسائية.

بناءً على مجموعة البيانات الفردية التي تمت ملاحظتها في الجداول أعلاه ، يمكننا الإبلاغ عن٪ الذين اختاروا استخدام المصعد للنزول في فترات الذروة في الصباح والمساء ، لكن يجب أن يكون تعليقنا أنهم قريبون جدًا!

الأمثلة أعلاه عبارة عن بيانات فئوية مع فئتين فقط بحيث يمكن أن يركز النظر إلى التباين عبر العينات على النظر إلى التباين في النسب المئوية لإحدى الفئات. في المثال D ، كان هناك متغير فئوي واحد في المثال H كان هناك ثلاثة متغيرات فئوية (فترة الذروة ، الاتجاه ، اختيار المصعد أو السلالم) والاهتمام بالمثال H ليس فقط في٪ الفردية ولكن أيضًا٪ داخل مختلفة الفئات وفي مقارنة هذه٪ خلال فترتي الذروة.

بالنسبة للمتغيرات الفئوية التي تحتوي على أكثر من فئتين ، تختلف٪ 's في كل فئة عبر العينات بطريقة مشابهة للأمثلة المذكورة أعلاه. يمكن العثور على رسم توضيحي ديناميكي لهذا التباين لأحجام العينات المختلفة في قسم المتغيرات الفئوية من http & # 58 // www.censusatschool.org.nz / 2009 / غير رسمي-inference / WPRH /. هذا الرسم التوضيحي الديناميكي عبارة عن مخطط شريطي لـ٪ 's يستخدم أنواعًا مختلفة من وسائل النقل إلى المدرسة في أوكلاند. يتم اختيار العينات ذات الأحجام المختلفة عشوائيًا (مع الاستبدال) من مجموعة بيانات كبيرة تم الحصول عليها من خلال مشروع التعداد في المدرسة في نيوزيلندا.

بيانات العينة & # 58 بيانات مستمرة

بالنسبة لعينات البيانات المستمرة ، فإننا مهتمون بوصف تباين القيم داخل العينة (تمامًا كما هو الحال إذا كانت لدينا بيانات مستمرة في التعداد) وفي النظر في مقدار التباين الذي يمكن أن يكون عبر العينات التي تم جمعها في نفس الظروف.

مثال E & # 58 تقدير طول الوقت

يوجد أدناه مخطط نقطي للتخمينات (بالثواني) لمدة 10 ثوانٍ لـ 120 شخصًا تم اختيارهم عشوائيًا. طُلب من كل شخص تخمين 10 ثوانٍ من وقت قول & aposgo & apos وتم تسجيل تخمينه بواسطة ساعة توقيت. لكل شخص لم يكن هناك ممارسة أو تكرار وناقصًا كان هذا هو التخمين الأول والوحيد في 10 ثوانٍ في هذا التحقيق.

التخمينات متغيرة للغاية ، وتتراوح من حوالي 4 ثوان إلى أقل بقليل من 14 ثانية. يبدو أن معظمها أقل من 10 ثوانٍ.

ما مقدار التباين الذي يمكن أن نراه عبر هذه العينات؟ هناك عدد من مصادر الاختلاف في هذا المثال في دراسة حقيقية & # 58 الاختلاف من شخص لآخر لكل شخص ، لأن الفرد لن يخمن نفس الطول بالضبط في كل مرة يحاولون الاختلاف بسبب قياس الطول من التخمين. مصدر آخر محتمل للاختلاف هو الاختلاف بسبب ظروف التجربة على الرغم من أنه يمكن الاحتفاظ بها ثابتة قدر الإمكان.

يمكن نمذجة هذه الأنواع من التباين والناقص من شخص لآخر ، لكل شخص وبسبب القياس والطرح ، من الناحية الإحصائية ، ولكن دعنا نركز فقط على التباين بسبب أخذ العينات عن طريق أخذ عينات عشوائية من هذه المجموعة من القيم. أي ، سوف نأخذ في الاعتبار أن كل قيمة من هذه القيم الـ 120 من المرجح أن يتم اختيارها بشكل متساوٍ ، وسنختار من بين هذه القيم الـ 120 عشوائيًا. حتى تظل فرصة الحصول على كل قيمة كما هي ، سنقوم بأخذ عينات مع الاستبدال. أي أنه إذا تم اختيار قيمة ، فلن تتم إزالتها من مجموعة القيم التي يمكننا الاختيار من بينها.

يمكن إجراء هذه المحاكاة عن طريق كتابة القيم المرصودة على 120 قطعة مختلفة من الورق ، ووضعها في حاوية ، واختيار عدد من قطع الورق عشوائيًا من الحاوية ، واستبدال كل قطعة من الورق قبل الرسم التالي بعد تسجيلها. القيمة. راجع الملحق 1 للتعرف على كيفية الحصول على عينات محاكاة باستخدام Excel. هذا النوع من أخذ العينات يسمى إعادة أخذ العينات (مع الاستبدال).

فيما يلي نقاط نقطية من 120 قيمة و 5 عينات ، كل منها من 20 قيمة ، تم اختيارها عشوائيًا (مع الاستبدال) من هذه القيم الـ 120.

يرجع الاختلاف عبر العينات الخمس التي يمكننا رؤيتها في ما سبق بالكامل إلى أخذ العينات العشوائية ، ونرى أنه يمكن أن يكون هناك قدر كبير من الاختلاف بسبب أخذ العينات.

تختلف النطاقات في العينات الخمس ، حيث يبلغ الحد الأدنى لعينتين حوالي 4.5 ثانية ، والباقي حوالي 6 ثوانٍ. أحدهما له قيمته القصوى حوالي 13.5 ثانية ، والآخر حوالي 11.5 إلى 12 ثانية.

المتوسطات (لأقرب 0.1 ثانية) من هذه العينات الخمسة هي: 8.66 ثانية ، 9.49 ثانية ، 9.46 ثانية ، 9.10 ثانية ، 9.16 ثانية.

ما مقدار الاختلاف الذي يمكن أن يكون في متوسطات العينات ذات الحجم 20 من هذه القيم الـ 120؟ متوسط ​​قيم 120 هو 9.4 ثانية (لأقرب 0.1 ثانية). يوجد أدناه مخطط نقطي لمتوسطات 100 عينة من الحجم 20 تم اختيارها عشوائيًا (مع الاستبدال) من 120 قيمة.

نرى أنه يمكن أن يكون هناك الكثير من الاختلاف في المتوسط.

ماذا يمكن أن يحدث إذا أخذنا عينات أكبر؟ يوجد أدناه مخطط نقطي مكرر مع مخطط نقطي لمتوسطات 100 عينة عشوائية لكل منها حجم 80 (جميع العينات مأخوذة من القيم الأصلية 120).

نرى أن هناك تباينًا أقل بكثير في متوسطات العينات ذات الحجم 80 مقارنةً بالعينات ذات الحجم 20 ، تمامًا كما كان هناك اختلاف أقل بكثير في نسب العينة للبيانات الفئوية حيث أخذنا عينات أكبر وأكبر.

هذا هو السبب في أننا نأخذ أكبر عدد ممكن من الملاحظات لتقدير الكميات مثل النسب والوسائل.

نشاط الفصل الدراسي: ينصب تركيز المثال أعلاه على تباين العينات. توضح المجموعة الأصلية المكونة من 120 ملاحظة تباينًا كبيرًا بين مختلف الأشخاص في تقدير 10 ثوانٍ. يمكن للطلاب التحقيق في تنوع الأفراد في تقدير 10 ثوانٍ من خلال جمع عدد (على سبيل المثال ، 10) من الملاحظات لكل شخص. يمكنهم بعد ذلك مقارنة تنوع تخمينات الأفراد عبر الأفراد.يمكنهم أيضًا حساب متوسط ​​التخمينات وإلقاء نظرة على التباين في تلك التخمينات وأفضلها (أي الأقرب إلى 10 ثوانٍ) وإلقاء نظرة على التباين في أفضل التخمينات.

مثال E & # 58 تقدير طول الوقت & # 58
مقارنة بين الذكور والإناث

في بيانات التخمينات (بالثواني) لمدة 10 ثوانٍ لـ 120 شخصًا تم اختيارهم عشوائيًا ، كان هناك 60 أنثى و 60 ذكرًا. لاحظ أن هذا يعني أيضًا أنه تم اختيار عدد ثابت من الذكور والإناث عشوائيًا بدلاً من 120 شخصًا بالكامل. يوجد أدناه مخطط نقطي للتخمينات مفصولة إلى ذكور وإناث.

المتوسطات متقاربة للغاية & # 58 فهي 9.35 ثانية للإناث و 9.44 ثانية للذكور. بعد أن رأينا مقدار المتوسطات التي يمكن أن تختلف عبر العينات فقط بسبب اختلاف العينات ، لن نقول بالتأكيد أن هذه البيانات تشير إلى أن الذكور والإناث يختلفون في المتوسط ​​في تخمينهم لمدة 10 ثوانٍ! لا يوجد أيضًا اختلاف كبير في التباين في هاتين المجموعتين المكونتين من 60 ملاحظة: هناك رجلان قللوا بشكل كبير من تقدير 10 ثوانٍ ، مع تخمينات معظم الذكور في هذه المجموعة ربما أكثر من تلك الخاصة بمعظم الإناث. لكن هذه التعليقات تتعلق بهاتين المجموعتين المعينتين من الملاحظات. الآن وقد رأينا مقدار التباين الذي يمكن أن يحدث بسبب أخذ العينات ، فنحن نعلم توخي الحذر في التعميم من هذه البيانات.

ملاحظات إحصائية عامة على المعلومات من البيانات

نحصل على البيانات من أجل الحصول على المعلومات. يهدف التعداد إلى الحصول على المعلومات الإجمالية لسكان ، عادة من بلد ما. في الحصول على بيانات عينة ، سواء كانت من السكان أو في ظل ظروف معينة ، نهدف إلى الحصول على بيانات تمثيلية ، لأننا نحتاج إلى بيانات تمثيلية حتى نتمكن من الحصول على معلومات تمثيلية. الحصول على بيانات تمثيلية يعني أن ملاحظاتنا يجب أن تكون عينة عشوائية وناقصًا عن طريق الاختيار العشوائي إذا كنا نتعامل مع مجموعة سكانية ، أو عن طريق أخذ الملاحظات بشكل عشوائي في ظل نفس الظروف إذا كنا نتعامل مع حالة رصدية أو تجريبية.

نظرًا لأن الإجراءات العملية غالبًا ما تحكم ما يمكن وما لا يمكن جمعه ، فغالبًا ما يتعين علينا افتراض أن بياناتنا تمثل موقفًا أكثر عمومية. هذا هو السبب في أنه من الأهمية بمكان وصف كيفية الحصول على البيانات أو جمعها بالضبط. أيضًا ، يمكن اعتبار البيانات تمثيلية عند النظر في بعض الأسئلة ، ولكن ليس بالنسبة إلى أسئلة أخرى.

ملاحظات إحصائية عامة حول التعميم من عينات البيانات & # 58 الاستدلال الإحصائي

توضح الأمثلة المذكورة أعلاه مقدار العناية اللازمة في استخدام عينات من البيانات لتعميم الحالة التي تكون فيها البيانات ممثلة. هذا يسمى الاستنتاج من البيانات. يوفر الاستدلال الإحصائي مبادئ وطرق للاستدلال من البيانات التي تأخذ في الاعتبار التباين بسبب أخذ العينات. نظرًا لأن هذه الأساليب تم تطويرها من افتراضات ونماذج تباين محددة بوضوح ، يمكن تطبيق الأساليب وتفسيرها عالميًا. تستفيد النماذج من النماذج النظرية والرياضية للتباين التي يتم دراستها على المستوى الجامعي. لكن الأمثلة التي تتضمن مقارنة مجموعات البيانات المختلفة التي تم جمعها في ظل نفس الظروف ، أو التي تم الحصول عليها عن طريق المحاكاة على النحو الوارد أعلاه ، تساعد في فهم مقدار التباين الذي يمكن أن يحدث عبر العينات ومقدار الكميات مثل النسب المئوية والمتوسطات التي يمكن أن تختلف. هذا يساعد في توخي الحذر في التعميم من البيانات.

توضح الأمثلة المذكورة أعلاه أن المطلوب هو أن تكون قادرًا على تحديد مقدار النسبة الحقيقية أو الوسط الحقيقي الذي يمكن أن يختلف عما نحصل عليه في عينة واحدة فقط من البيانات (أي نسبة العينة أو متوسط ​​العينة). أي أن ما نحتاجه هو أن نكون قادرين على إعطاء فاصل زمني نثق فيه إلى حد ما أنه سيشمل النسبة الإجمالية أو المتوسط ​​للحالة العامة التي تمثل بياناتنا عنها. كيفية القيام بذلك وكيفية استخدامه يتجاوز هذا المستوى ، ولكن إذا كنت تقرأ الآن في وسائل الإعلام ، فإن تقريرًا مثل & نسبة المرتدين من البالغين الذين يتفقون مع …… يقدر بين 54٪ و 59٪ ثم تعلمون أن المحققين يفعلون ما ينبغي عليهم فعله ، أي إجراء استدلال إحصائي يسمح بتغير العينات.

الكميات المحسوبة من البيانات التي تم أخذها في الاعتبار في الأمثلة المذكورة أعلاه هي نسب (أو نسب مئوية) للبيانات الفئوية ، ومتوسطات البيانات المستمرة. هذه ليست بالضرورة الكميات ذات الأهمية فقط ، كما يوضح المثال التالي.

المثال الأول & # 58 كم من الوقت يجب أن يستمر اللون الأخضر
لعبور المشاة؟

عند تحديد المدة اللازمة لجعل اللون الأخضر لأي معبر مشاة معين ، يجب مراعاة ظروف المرور وعرض المعبر ، ولكن ما الذي يجب مراعاته حول سرعة عبور المشاة؟ هل يجب أن نأخذ في الاعتبار متوسط ​​سرعة عبور المشاة؟ هل يجب أن نأخذ بعين الاعتبار مجموعة أنواع المشاة الذين يستخدمون هذا المعبر؟ يثير هذان السؤالان على الفور مصدرين للتباين & # 58 التباين في سرعات العبور والتنوع في أنواع المشاة. ولكن مهما كانت أنواع المشاة التي نضعها في الاعتبار ، فإننا لا نريد تعيين طول اللون الأخضر على متوسط ​​سرعة العبور. من المرجح أن يكون مفيدًا هو تقدير سرعة العبور التي يمكن لمعظم المستخدمين إدارتها من البداية الدائمة. ومن ثم هناك حاجة إلى معلومات جيدة حول تنوع السرعات المتقاطعة. قد يكون من المقرر تقدير سرعة العبور التي يمكن لـ 95٪ من الأشخاص إدارتها من وضع الوقوف ، بحيث تلبي الإشارة الحمراء الوامضة الجميع من بداية الوقوف. ثم يجب أيضًا اختيار معايير القرار بشأن طول اللون الأحمر الوامض!

نشاط الفصل الدراسي: جمع البيانات من عدد من أضواء المشاة التي تقيس طول اللون الأخضر وطول اللون الأحمر الوامض للتحقق من التباين في هذه الأطوال عبر معابر المشاة المختلفة والعلاقات بين طول اللون الأخضر وطول اللون الأحمر الوامض.

هل يمكننا السعي لشرح التباين؟

في بعض الأمثلة أعلاه ، هناك اهتمام بالتحقيق في مقارنات البيانات حول متغير واحد فيما يتعلق بمتغير واحد أو أكثر. على سبيل المثال ، هل يميل الركاب إلى استخدام المصعد بدلاً من الدرج للصعود في محطة الحافلات في الصباح أو المساء؟ هل الذكور أفضل في تخمين أطوال الوقت من الإناث؟

هذا هو التحقيق في ما إذا كان متغير يتأثر بالآخرين. بالنظر إلى هذا من وجهة نظر أخرى ، غالبًا ما نهتم بالتحقيق فيما إذا كان متغير ما يتأثر بالآخرين ، وإذا كان الأمر كذلك ، فإلى أي مدى. وهذا يعني أننا غالبًا ما نهتم بمحاولة شرح بعض المتغيرات على الأقل في البيانات من خلال التحقق مما إذا كانت المتغيرات الأخرى قد تؤثر على البيانات. على سبيل المثال ، إذا كان يُزعم أن الإبهام الذي تم وضعه في الأعلى في يد المشبك مرتبط وراثيًا ، فقد نتساءل عما إذا كان الذكور يميلون إلى أن يكونوا مختلفين عن الإناث ، أو إذا كانت ميول اليد اليسرى مرتبطة بهذا الاتجاه. وهذا يعني أننا قد نسعى لشرح بعض التباين بين الأفراد من خلال التحقق مما إذا كانت هناك اختلافات بين الذكور والإناث ، واليسار واليمين.

بالنسبة لجوانب مثل قياس ردود الفعل أو تخمين الفترات الزمنية ، قد نرغب في التحقق مما إذا كان أي من أو كل العمر أو الجنس أو الظروف المختلفة تؤثر على النتيجة. على سبيل المثال ، هل يؤثر الاستماع إلى الموسيقى في قدرة الأشخاص على تخمين فترات زمنية أو أوقات رد فعلهم؟ يمكن تصميم التجارب أو الدراسات القائمة على الملاحظة أو مزيج من الملاحظة والتجربة للتحقيق في هذه القضايا. سيكون هناك دائمًا تنوع في أخذ العينات ، ودائمًا ما يكون هناك على الأقل بعض التباين الطبيعي بسبب التباين داخل وعبر الناس و / أو الظروف الطبيعية. ولكن يتم تطوير طرق إحصائية للسؤال عما إذا كان يمكن عزو بعض المتغيرات الملحوظة في البيانات إلى متغيرات أخرى.

بعض التعليقات العامة و
وصلات من F-7 ونحو العام 9

من F-7 ، طور الطلاب تدريجيًا الفهم والإلمام بمفاهيم واستخدام عملية استقصاء البيانات الإحصائية وأنواع البيانات والمتغيرات وأنواع التحقيقات وبعض أنواع العروض التقديمية الرسومية والموجزة على الأقل. عند تطوير هذه ، نشأت اعتبارات بشكل متزايد بشأن الحاجة إلى البيانات التمثيلية ، والوصف و / أو السماح بالتنوع داخل مجموعات البيانات وعبرها.

من أجل فهم كيفية تفسير المعلومات من البيانات والإبلاغ عنها ، يحتاج الطلاب إلى تطوير بعض الفهم على الأقل لتأثيرات تقلب العينات. يساعد هذا أيضًا في تطوير فهم الحاجة إلى الاستدلال الإحصائي الرسمي ، حتى لو لم يتم تقديم أساليب ونتائج وعمليات الاستدلال الإحصائي حتى المستويات العليا أو الجامعية. يتطلب الاستدلال الإحصائي أيضًا أن تكون البيانات ممثلة لمجموعة سكانية أو وضعًا عامًا فيما يتعلق بالأسئلة أو القضايا ذات الاهتمام.

ومن ثم ناقشت هذه الوحدة تحديات الحصول على بيانات تمثيلية ، مع التأكيد على أهمية الإبلاغ الواضح عن كيفية ومتى وأين يتم الحصول على البيانات أو جمعها ، وتحديد القضايا أو الأسئلة التي من المطلوب أن تكون البيانات ممثلة لها. استخدمت الوحدة أيضًا بيانات ومحاكاة حقيقية ، بما في ذلك إعادة أخذ العينات من البيانات الحقيقية ، لتوضيح كيف يمكن أن تختلف بيانات العينة وملخصات البيانات مثل نسب العينة والمتوسطات عبر العينات.

كما هو الحال في السنوات 4-7 ، توضح أمثلة هذه الوحدة مرة أخرى مدى التفكير الإحصائي المتضمن في جميع جوانب تحقيق البيانات الإحصائية ، لا سيما في تحديد الأسئلة / القضايا ، في التخطيط والتعليق على المعلومات التي تم الحصول عليها من البيانات.

تتم دراسة أسئلة التخطيط للحصول على بيانات تمثيلية للتحقيق في الأسئلة والقضايا اليومية التي تنطوي على عدد من المتغيرات بشكل أكبر في السنة 9 ، إلى جانب تطوير المزيد من المهارات في استكشاف البيانات وفهمها وتفسيرها. تعتمد هذه على التركيز الأكبر في هذه الوحدة على التعرف على التباين واستكشافه وتفسيره داخل البيانات وعبر مجموعات البيانات. كما هو الحال في السنوات F-8 ، يتم تقديم المفاهيم وتطويرها وإثباتها في السياقات التي تستمر في تطوير التعلم التجريبي لعملية التحقيق في البيانات الإحصائية.

لاستخدام Excel لإنشاء بيانات عشوائية ، يتطلب الوظيفة الإضافية لتحليل البيانات ضمن الأدوات.

لاستخدام تحليل البيانات ضمن أدوات لإنشاء عدد من العينات العشوائية من البيانات على متغير فئوي باحتمالية معينة للفئة محل الاهتمام ، اختر "مولِّد الأرقام العشوائية". بالنسبة إلى Number of Variables ، أدخل 1. بالنسبة إلى Number of Random Numbers ، أدخل عدد العينات المختلفة التي تريد إنشاءها & ناقص ، على سبيل المثال ، تم استخدام 100 في العديد من أمثلة هذه الوحدة. للتوزيع ، اختر ذو الحدين. ضمن المعلمات التي تظهر للقيمة ذات الحدين ، فإن القيمة p هي النسبة التي ترغب في افتراضها على أنها النسبة الحقيقية (أو إجمالي عدد السكان) ، وعدد المحاولات هو حجم العينة التي ترغب في إنشائها (على سبيل المثال ، قد ترغب للنظر في عينات من 20 شخصًا). يجب أن يكون نطاق الإخراج عمودًا واحدًا بنفس حجم الرقم العشوائي الذي اخترته. سيتألف الناتج من مجموعة من الأرقام من عدد المحاولات ، لذا اقسمها على عدد المحاولات للحصول على النسب المحاكاة.

لاستخدام تحليل البيانات ضمن الأدوات لإنشاء عدد من العينات العشوائية للبيانات من مجموعة معينة من القيم (أي إعادة العينة من مجموعة معينة من البيانات) ، يجب أن تكون البيانات الأصلية في عمود ، مع عمود ثانٍ تتكون من 1 / (عدد المشاهدات) في كل خلية. نظرًا لأن مجموع هذا العمود الثاني يجب أن يكون 1 ، فقد تحتاج إلى تعديل القيم التي تدخلها بشكل طفيف لضمان ذلك. اختر مولد الأرقام العشوائية. في عدد المتغيرات ، أدخل عدد العينات التي ترغب في إنشائها. في عدد الأرقام العشوائية ، أدخل حجم العينات. في التوزيع ، اختر منفصلة. في نطاق إدخال القيمة والاحتمالية ، أعط العمود الذي وضعت فيه البيانات الأصلية والعمود الذي تتساوى فيه كل قيمة (ربما يسمح بتعديل طفيف) واجمعها إلى 1. في نطاق الإخراج ، أعط نطاقًا لعدد من الأعمدة هي عدد العينات المختارة ، وحجم كل عمود هو حجم العينة المختار.

تم تمويل مشروع تحسين تعليم الرياضيات في المدارس (TIMES) 2009-2011 من قبل وزارة التعليم والتوظيف وعلاقات مكان العمل التابعة للحكومة الأسترالية.

الآراء المعبر عنها هنا هي آراء المؤلف ولا تمثل بالضرورة وجهات نظر وزارة التعليم والتوظيف وعلاقات مكان العمل بالحكومة الأسترالية.


جمع البيانات

يتعلم الطلاب كيفية تصميم استبيان دون تحيز لجمع مجموعات البيانات النوعية والكمية الأولية. مع تقدم التعلم ، يستخدمون أخذ العينات الطبقية لتحديد حجم العينة وكيفية تصميم جداول ثنائية الاتجاه وأشجار التردد لتنظيم هذه البيانات.

تحدث هذه الوحدة في السنة 9 الفصل الدراسي 4 وتتبع من حساب المقاييس الإحصائية.

دروس جمع البيانات

دروس حل المشكلات والمراجعة

المعرفة المسبقة
  • تفسير وبناء المخططات الإحصائية للبيانات المنفصلة والمستمرة ومعرفة الاستخدام المناسب لها.
  • تفسير وتحليل ومقارنة توزيعات مجموعات البيانات من التوزيعات التجريبية أحادية المتغير من خلال:
    • تمثيل رسومي مناسب يتضمن بيانات منفصلة ومستمرة ومجمعة
    • المقاييس المناسبة للاتجاه المركزي (الوسيط ، المتوسط ​​، النمط والطبقة النموذجية) والانتشار
    معايير النجاح
    • استنتاج خصائص السكان أو التوزيعات من عينة ، مع معرفة حدود أخذ العينات.
    • تطبيق الإحصائيات لوصف السكان
    • تفسير وتحليل ومقارنة توزيعات مجموعات البيانات من التوزيعات التجريبية أحادية المتغير من خلال التمثيل الرسومي المناسب الذي يتضمن بيانات منفصلة ومستمرة ومجمعة.
    المفاهيم الرئيسية
    • يحتاج الطلاب إلى فهم فوائد استخدام الجداول ذات الاتجاهين كوسيلة لتغطية كل نتيجة لأحداث متعددة بشكل شامل واستخدامها لحساب الاحتمالات.
    • عند تصميم الاستبيانات ، يحتاج الطلاب إلى التفكير في الفترات الزمنية وخانات الاختيار المتعددة التي لا تتداخل والحاجة إلى جمع عينة واسعة النطاق لتقليل التحيز.
    • من المهم التعرف على التقنيات الإحصائية المختلفة المستخدمة لتحليل وتمثيل البيانات النوعية والكمية والمنفصلة والمستمرة.
    المفاهيم الخاطئة الشائعة
    • غالبًا ما يواجه الطلاب صعوبة في تصميم جداول ثنائية الاتجاه.
    • عند تصميم الاستبيانات ، تتضمن الأخطاء الشائعة ما يلي:
      • لا توجد فترة زمنية
      • استجابات متداخلة
      • عدم وجود خيار "لا شيء" أو "آخر".
      • حدد مربعات ذات عروض غير متساوية.
      • أسئلة سلبية مزدوجة.

      مدونة السيد الرياضيات

      حل المتباينات التربيعية والخطية

      درس الرياضيات AS في حل المتباينات التربيعية والخطية باستخدام الرسوم البيانية المخططة.

      حل المشكلة مع Cuboids

      خمسة أسئلة لحل المشكلات تربط الأشكال المكعبة لحل المعادلات والنسبة والإحداثيات ثلاثية الأبعاد.

      التناظر الانعكاسي في الأشكال ثنائية الأبعاد

      درس المرحلة الثالثة الأساسي حول تحديد خطوط التناظر الانعكاسي في الأشكال ثنائية الأبعاد.


      طرح الأسئلة

      السؤال المطروح يؤثر على بقية عملية التحقيق الإحصائي. يتوقع السؤال الإحصائي إجابة تستند إلى بيانات تختلف مقابل إجابة حتمية. يمكن تصنيف الأسئلة على أنها أسئلة تلخيصية أو مقارنة أو أسئلة علاقة.

      أسئلة التلخيص تركز على أوصاف البيانات وعادة ما تكون حول مجموعة بيانات واحدة. أمثلة: ما هو نوع حيوانك الأليف المفضل؟ كم تملك من الحيوانات الأليفة؟

      أسئلة المقارنة تتضمن مقارنة مجموعتين أو أكثر من مجموعات البيانات عبر سمة مشتركة. أمثلة: ما هو طول طالب الصف السادس أطول من طالب الصف الثاني؟

      أسئلة العلاقة يتم طرحها للنظر في العلاقة المتبادلة بين سمتين عدديتين متزاوجتين أو بين سمتين فئتين. أمثلة: هل الطلاب الذين لديهم وظائف ما بعد المدرسة أكثر عرضة لتأخر أو فقدان واجباتهم المنزلية من الطلاب الذين ليس لديهم مثل هذه الوظائف؟

      جمع البيانات

      في بيانات عنا و العينات والسكان يقوم الطلاب بجمع بيانات ذات متغير واحد (أحادي المتغير). في النماذج الرياضية ، يقوم الطلاب بجمع بيانات ذات متغيرين (ثنائي المتغير). تؤثر البيانات التي تم جمعها والغرض من استخدامها على المراحل اللاحقة من التحقيق الإحصائي.

      يتم تقديم مفاهيم البيانات العددية والفئوية في وحدة الصف السادس ، بيانات عنا. تثير الأسئلة المختلفة أنواعًا مختلفة من البيانات التي قد نطرحها أسئلة تثير إجابات رقمية ، أو أسئلة تستخرج إجابات غير رقمية.

      أمثلة على البيانات العددية

      يمكننا جمع بيانات حول حجم الأسرة وتنظيمها حسب الترددات في مخطط خط يوضح عدد الأسر التي لديها شخص واحد وشخصان وما إلى ذلك. يمكننا جمع بيانات حول ارتفاعات الطلاب وتنظيمها على فترات من 4 بوصات في رسم بياني باستخدام ترددات ارتفاعات من 40 إلى 44 بوصة ، وهكذا.

      أمثلة على البيانات الفئوية

      يمكننا جمع بيانات حول سنوات الميلاد وتنظيمها باستخدام ترددات لعدد الأشخاص الذين ولدوا في 1980 و 1981 و 1982 وما إلى ذلك. يمكننا جمع بيانات حول أنواع الكتب المفضلة والإبلاغ عن الترددات أو الترددات النسبية في رسم بياني شريطي للأشخاص الذين يحبون الألغاز وقصص المغامرات والخيال العلمي وما إلى ذلك.

      بمجرد طرح سؤال إحصائي وتحديد أنواع البيانات ذات الصلة ، فإن الخطوة التالية من التحقيق هي جمع حالات البيانات لدراستها. يتم تناول موضوع أخذ العينات في وحدة الصف السابع العينات والسكان. الفكرة الأساسية وراء أخذ العينات هي الحصول على معلومات حول مجموعة سكانية بأكملها من خلال تحليل جزء فقط من السكان. يقوم التعداد بجمع البيانات من جميع السكان الذين تتم دراسة سماتهم. بشكل عام ، إجراء التعداد غير ممكن أو معقول بسبب عوامل مثل التكلفة وحجم السكان. ومن ثم ، هناك حاجة إلى جمع عينات من البيانات واستخدام البيانات من العينات لعمل تنبؤات حول السكان.

      القضية المركزية في أخذ العينات هي الحاجة إلى عينات تمثيلية. لضمان عينات تمثيلية ، نحاول اختيار عينات عشوائية. تم تطوير عدد من الاستراتيجيات لاتخاذ خيارات عشوائية ، مثل رسم الأسماء من قبعة ، والغزلان ، ورمي مكعبات الأرقام ، وإنشاء قوائم من القيم باستخدام آلة حاسبة أو كمبيوتر ، في وقت سابق. ماذا تتوقع؟ يتم استخدام هذه الاستراتيجيات في وقت لاحق العينات والسكان. يدرك الطلاب أن هناك فرصة متساوية في احتمال إنشاء أي رقم من خلال أي دوران أو إرم أو ضغط مفتاح. في العينات والسكان، يدرك الطلاب أنه يمكن استخدام هذه الأرقام لاختيار أفراد من المجتمع ليكونوا جزءًا من عينة. بمعنى آخر ، هناك فرصة متساوية في احتمال إدراج أي فرد من السكان في العينة عند اختيار العينات عشوائيًا.

      في العينات والسكان، يطور الطلاب إحساسًا عامًا سليمًا حول ما يجعل حجم العينة جيدًا. حتى مع إستراتيجية أخذ العينات العشوائية ، فإن الإحصائيات الوصفية مثل الوسائل والمتوسطات للعينات ستختلف من عينة إلى أخرى. الدقة المحتملة لعينة إحصائية (أي كمؤشر لإحصاء السكان) تتحسن مع حجم العينة.كقاعدة عامة ، تكون أحجام العينات من 25 إلى 30 مناسبة لمعظم المشكلات التي يواجهها الطلاب في هذا المستوى.

      قد تكون بيانات العينة عددية أو فئوية أو أحادية المتغير أو ثنائية المتغير. تساعدنا معرفة نوع البيانات على تحديد أنسب مقاييس المركز والتباين ، واتخاذ خيارات التمثيلات.


      في الرياضيات والإحصاء ، يستكشف الطلاب العلاقات في الكميات والمساحة والبيانات ، مما يساعدهم على فهم العالم من حولهم.

      من خلال بناء الأنشطة المتعلقة بالوظيفة في مجال منهجك الدراسي ، فإنك تساعد طلابك على تطوير المفاهيم والمهارات والسمات التي يحتاجون إليها لاتخاذ قرارات مهنية إيجابية طوال حياتهم.

      الأنشطة للعام السابع وما فوق

      المهن المتعلقة بالرياضيات والإحصاءات البحثية

      • شجع التفكير النقدي من خلال ربط التعلم داخل الفصل باستمرار بالسياقات خارج الفصل الدراسي.
      • امنح الطلاب وقتًا للكتابة في خططهم التعليمية والوظيفية حول المهارات التي يتعلمونها في هذا الموضوع.
      • حدد أنشطة الواجب المنزلي التي تتضمن استخدام هذا الموقع للبحث في مهن متعلقة بالرياضيات والإحصاء.
      • شجع النقاش حول المهن التي تستخدم المهارات الرياضية.
      • استخدم موقع Careers New Zealand على الويب للعثور على معلومات حول متوسط ​​الأجور لمجموعة من الوظائف. زود الطلاب بالبيانات واطلب منهم رسم النتائج بيانيًا.
      • شجع الطلاب على استخدام الإنترنت للبحث في المسارات المهنية للنماذج التي يحتذى بها.

      استخدم هذا الموقع للعثور على عدد من المهن المتعلقة بالرياضيات والإحصاءات لفصلك الدراسي. اطلب من الطلاب أن يختاروا مهنة واحدة ثم ابحث عنها من خلال:

      • إجراء مقابلة مع شخص مشهور أو شخص يعرفونه في تلك الوظيفة
      • العثور على معلومات على الإنترنت
      • سؤال الأسرة / وهاناو عما إذا كانوا يعرفون شخصًا في الاحتلال يرغب في التحدث عن عملهم
      • إرسال رسالة نصية إلى CAREER إلى 434 لإرسال حزمة معلومات وظيفية إليهم.

      أنشطة للعام 11 وما بعده

      • اسأل الطلاب عن سبب اختيارهم لهذا الموضوع ، وما هي المهارات التي يجلبونها إليه ، وما هي المهارات التي سيطورونها. ثم ناقش كيف يمكن نقل هذه المهارات والاهتمامات إلى العالم الخارجي.
      • شجع الطلاب الذين يفكرون في برنامج STAR أو Gateway على اختيار الدورات أو الخبرة العملية التي تتناسب مع مهاراتهم واهتماماتهم.
      • بالنسبة للواجب المنزلي ، اطلب من الطلاب مسح المهن وجمع بيانات محددة ومقارنة نتائجهم مع مصادر أخرى.
      • اسأل الطلاب عن الأوقات في الماضي عندما استخدموا الرياضيات والإحصاء ، وكيف استخدموها ، وما هي المهارات التي طوروها.
      • شجع الطلاب على تسجيل مهاراتهم وإنجازاتهم في سيرهم الذاتية باستخدام أداة إنشاء السيرة الذاتية على هذا الموقع.

      شجع المناقشة حول المهن التي تنطوي على جانب معين من الرياضيات أو الإحصاء. فمثلا:

      • مزارعو الألبان يحسبون الحجم
      • يركز مهندسو المناظر الطبيعية على الشكل والتصميم
      • المهندسين المعماريين تحليل الأنماط المتماثلة
      • يستخدم المسوقون الإحصائيات.

      أنشطة لجميع الأعمار

      تعتمد المهن مثل الهندسة المعمارية على مهارات رياضية قوية

      • ادعُ ضيوفًا من المجتمع للتحدث عن مسارات حياتهم المهنية.
      • عند تطوير موضوعات البحث ، حاول تضمين محتوى الوظائف. على سبيل المثال ، ابحث عن 10 مهن أو مهام متعلقة بالرياضيات أو الإحصاء والتي من شأنها أن تشارك في التخطيط لكأس العالم للرجبي المقبل.
      • ابدأ مناقشة حول تأثير الرياضيات والإحصاء على عالم العمل.
      • وفر الفرص للطلاب لإجراء مقابلات وهمية. يمكن أن تركز المقابلات على المهن المتعلقة بالرياضيات والإحصاء.
      • أنشئ ركنًا للوظائف في فصلك الدراسي. يمكن أن يحتوي هذا على ملصقات ذات صلة بالموضوع / المهنة ، وملصقات من الدرجة الثالثة ، ومجلات وكتب تتعلق بالرياضيات والإحصاء ، ومقالات صحفية.
      • عند القيام بأنشطة خارج الفصل الدراسي ، حاول ربط محتوى الوظائف بكل نشاط. على سبيل المثال ، عند زيارة مكان عمل ، لديك مجموعة من الأسئلة التي يمكن للطلاب طرحها حول المهن والمسارات المهنية.
      • حقق أقصى استفادة من الوسيلة المفضلة لطلابك. على سبيل المثال ، قم بإنشاء تمرين يتضمن التعلم المتنقل. اطلب من الطلاب إرسال رسالة نصية إلى شخص ما حول شيء ذي صلة بما يفعلونه في الفصل. (على سبيل المثال ، يمكنهم إجراء مسح عبر النص.) يمكن أن تكون هذه أيضًا جلسة رسائل نصية بين الطبقات. اطلب من الطلاب إرسال رسالة نصية إلى طالب آخر تحدد ثلاث مهارات تمتلكها الأخيرة في مجال موضوعك.
      • شجع الطلاب على إرسال رسالة نصية أو إرسال بريد إلكتروني إلى Careers New Zealand وطلب معلومات حول صناعة أو مهنة أو دورة دراسية معينة.

      أنشطة على مستوى المدرسة

      ستتم مجموعة واسعة من الأنشطة في مدرستك خلال العام. ضع في اعتبارك كيف يمكنك دمج التعليم المهني فيها. أمثلة الأحداث هي:

      • أحداث رياضية
      • جمع التبرعات المدرسية
      • الفعاليات المجتمعية
      • ماتاريكي
      • كابا هاكا
      • المعارض المهنية.

      نقاط مناقشة Classroom

      خذ خمس دقائق في نهاية الدرس لإجراء مناقشة حول الوظائف ، أو تعيين واجبات منزلية على موضوع مهني. تتضمن الأسئلة التي يمكنك طرحها ما يلي:

      • ما هي الوظائف التي يمكن أن تكون مرتبطة بالرياضيات والإحصاء؟
      • ما هي الوظائف التي تتطلب مستوى عالٍ من الرياضيات و / أو الإحصاء؟ التي لها متطلبات منخفضة المستوى؟ لماذا ا؟
      • مع من يمكنك التحدث إذا كنت تريد معرفة كيف تصبح.
      • هل يحتاج المهندسون المدنيون إلى مهارات قياس جيدة؟ لماذا ا؟ لما لا؟ (يمكنك استخدام مهن أخرى لهذا التمرين.)
      • لماذا يحتاج التجار الرياضيات؟
      • لماذا يشبه المصمم الصناعي مثمن العقارات؟ (يمكنك استخدام مجموعات وظائف أخرى.)

      أسئلة التخطيط

      • ما المهن المرتبطة بموضوعي؟ هل أعرف أي شخص يشارك في هذه المهن ويمكنني دعوته لزيارة الطلاب كجزء من برنامج التدريس الخاص بي؟
      • ما هي موضوعات البحث التي يمكن لطلابي تغطيتها والتي من شأنها مساعدتهم على استكشاف وظائف متعلقة بالرياضيات والإحصاء؟
      • ما هي الوسائط التي يمكنني استخدامها؟ ما هي الموارد المتاحة لي؟
      • ما هي معايير الوحدة التي يمكنني تغطيتها باستخدام المواد المتعلقة بالمهن؟
      • كيف يمكنني تحقيق أقصى استفادة من مستشار التوظيف في مدرستي؟
      • كيف يمكنني التأكد من أنني أشتمل على وجهات نظر العالم للماوري والباسيفيكا؟

      أسئلة تأمل المعلم

      ضع في اعتبارك كيف يمكن استخدام المهارات المكتسبة في الرياضيات والإحصاء في مكان العمل

      • هل أعرف ما هي تطلعات طلابي المهنية؟
      • هل لدي فهم حديث لأهمية واستخدام المهارات التي أقوم بتدريسها في الرياضيات والإحصاء في مكان العمل؟ إذا لم يكن كذلك ، كيف يمكنني تحسين هذه المعرفة؟
      • هل أحصل على دعم من الإدارة العليا؟ كيف يمكنني الحصول على هذا؟
      • ما مجموعة المواد التي يدرسها طلابي؟ ما هو سبب ذلك؟ كيف يمكنني مساعدة طلابي في السنة 10 بشكل أفضل خلال وقت اختيار المادة؟
      • هل أشجع الطلاب على التفكير في صلة تعلمهم بخياراتهم بعد تركهم المدرسة؟
      • هل يضع طلابي أهدافًا واضحة؟ ما هي المهارات الأخرى التي يحتاجون إليها لتطوير الرياضيات والإحصاء لتحقيق أهدافهم؟
      • كيف يمكنني الاستفادة القصوى من الأحداث المدرسية مثل أمسيات الوالدين؟
      • ماذا يعرف الآباء عن المسارات الوظيفية المتعلقة بالرياضيات والإحصاء؟ كيف يمكنني مساعدة الوالدين على تحسين فهمهم لهذا؟
      • هل مدرستي تستخدم The Real Game مع فصول المبتدئين؟ كيف يمكنني الاستفادة من عنصر الرياضيات في هذا؟
      • ما هي أنشطة الرياضيات التي يمكنني دمجها في معارض الوظائف؟

      ربط التعليم الوظيفي بمناهج الرياضيات والإحصاء

      فيما يلي بعض الأهداف من منهج الرياضيات والإحصاء التي يمكن أن تكون مرتبطة بالتعليم الوظيفي.

      مستوى 4

      الأنماط والعلاقات

      يعمم خصائص الضرب والقسمة بالأعداد الصحيحة. استخدم الرسوم البيانية والجداول والقواعد لوصف العلاقات الخطية الموجودة في الأرقام والأنماط المكانية.

      مستوى 5

      الهندسة والقياس

      حدد واستخدم الوحدات المترية المناسبة للطول والمساحة والحجم والسعة والوزن (الكتلة) ودرجة الحرارة والزاوية والوقت ، مع إدراك أن القياسات تقريبية.

      المستوى 6

      محو الأمية الإحصائية

      تقييم التقارير الإحصائية في وسائل الإعلام من خلال ربط العروض والإحصاءات والعمليات والاحتمالات المستخدمة بالمطالبات المقدمة.

      المستوى 8

      تحقيق احصائي

      قم بعمل استنتاجات من الدراسات الاستقصائية والتجارب: تحديد التقديرات وفواصل الثقة للوسائل والنسب والاختلافات ، وإدراك أهمية نظرية الحدود المركزية.


      الإحصاء الرياضي

      ما هو الرياضيات الإحصاء؟ تشمل دراسة إحصائيات الرياضيات جمع البيانات وتحليلها وعرضها وتفسيرها. عندما يتم جمع البيانات وتلخيصها وتمثيلها في شكل رسوم بيانية ، يمكننا البحث عن الاتجاهات ومحاولة عمل تنبؤات بناءً على هذه الحقائق. تعد دراسة الإحصاء أساسًا مهمًا لعلوم البيانات والبيانات الضخمة والذكاء الاصطناعي ، من بين العديد من المجالات الأخرى.

      أوراق وحلول سابقة لإحصائيات AP

      ستغطي هذه السلسلة من الدروس: جمع البيانات وتلخيصها ، والطرق الشائعة لوصف البيانات ، والطرق المختلفة لتمثيل البيانات ، وجداول التكرار ، والتكرار التراكمي ، والإحصاءات الأكثر تقدمًا ، والإحصاءات الوصفية ، والاحتمالات ، والارتباط ، والإحصاءات الاستنتاجية.

      أ. جمع وتلخيص البيانات

      ب. الطرق الشائعة لوصف البيانات

      طرق مختلفة لتمثيل البيانات

      د- جداول التردد

      E. التردد التراكمي

      F. المزيد من الإحصائيات المتقدمة

      سلسلة محاضرات الإحصاء

      تمنحك Statistics Calculator by Mathway أدناه حلولاً خطوة بخطوة لـ
      متوسط ​​الإحصاء الوصفي ،
      إحصائيات التشتت ،
      احتمالا،
      التوزيعات الاحتمالية
      التوزيع بتكرار،
      التوزيعات العادية ،
      توزيعات t ،
      اختبار الفرضيات،
      التقدير وحجم العينة ،
      الارتباط والانحدار.

      جرب آلة حاسبة Mathway المجانية وحل المشكلات أدناه لممارسة موضوعات الرياضيات المختلفة. جرب الأمثلة المعطاة ، أو اكتب مشكلتك الخاصة وتحقق من إجابتك مع شرح خطوة بخطوة.

      نرحب بملاحظاتكم وتعليقاتكم وأسئلتكم حول هذا الموقع أو الصفحة. يرجى إرسال ملاحظاتك أو استفساراتك عبر صفحة الملاحظات الخاصة بنا.


      8: الإحصاء وجمع البيانات - الرياضيات

      يمكن تعريف البيانات على أنها مجموعة من الحقائق أو المعلومات التي يمكن استخلاص الاستنتاجات منها.

      مثال على البيانات

      البيانات الموضحة أدناه هي درجات Mark & ​​# 39s في خمسة اختبارات رياضيات أجريت في 10 أسابيع.
      45, 23, 67, 82, 71
      تساعدنا البيانات في مقارنة نتائجه ومعرفة تقدمه.

      أمثلة الفيديو: مشكلة تحليل البيانات 1 ، الدليل الرسمي لمراجعة رياضيات GRE المنقحة

      مثال محلول على البيانات

      السؤال: عدد السلال التي سجلها لاعب كرة السلة هي: 8 و 15 و 11 و 13 و 9 و 12 و 10. ابحث عن نطاق البيانات.

      اختيارات:

      أ .5
      ب 17
      ج 7
      د 6
      الإجابة الصحيحة: ج

      المحلول:

      • الخطوة 1: أعلى درجة = 15
        الخطوة 2: أدنى درجة = 8
        الخطوة 3: النطاق = 15-8 = 7. [النطاق = أعلى درجة - أدنى درجة.]

      اتصالات العالم الحقيقي للبيانات

      جمع البيانات هو شيء مهم في تحليل البيانات الإحصائية. يمكن جمع البيانات من المصادر أو من خلال الملاحظة أو الاستطلاعات أو عن طريق إجراء التجارب. كل منا يعرف عن التعدادات. من خلال التعدادات يمكن توفير معلومات مفصلة عن سكان بلد ما.


      8 وظائف للإحصاء (النطاق والأهمية)

      يمكننا تمثيل الأشياء في شكلها الحقيقي بمساعدة الشخصيات. بدون دراسة إحصائية ، ستكون أفكارنا غامضة وغير محددة.

      يجب تقديم الحقائق في شكل محدد. إذا تم تقديم النتائج بالأرقام ، فإنها تكون أكثر إقناعًا مما لو تم التعبير عن النتائج على أساس الجودة.

      إن العبارات مثل ، هناك الكثير من البطالة في الهند أو أن السكان يتزايدون بمعدل أسرع ليست في شكل محدد. يجب أن تكون البيانات في شكل محدد مثل عدد السكان في عام 2004 سيكون 15 ٪ أكثر مقارنة بعام 1990.

      2. الدقة في الحقائق:

      يتم تقديم الإحصائيات في شكل محدد ، لذا فهي تساعد أيضًا في تكثيف البيانات في أرقام مهمة. لذا فإن الأساليب الإحصائية تقدم معلومات مفيدة. بمعنى آخر ، تساعد الإحصائيات في تبسيط البيانات المعقدة لتبسيطها لجعلها مفهومة.

      قد يتم تقديم البيانات في شكل رسم بياني أو رسم بياني أو من خلال متوسط ​​أو معاملات إلخ. على سبيل المثال ، لا يمكننا معرفة موضع السعر من الأسعار الفردية لكل السلع ، ولكن يمكننا معرفة ذلك ، إذا حصلنا على مؤشر المستوى العام للأسعار.

      3. المقارنات:

      بعد تبسيط البيانات ، يمكن ربطها ومقارنتها. أفضل تمثيل للعلاقة بين المجموعتين بكميات رياضية معينة مثل المتوسط ​​أو المعاملات وما إلى ذلك. تعد المقارنة إحدى الوظائف الرئيسية للإحصاءات حيث أن الأرقام المطلقة تنقل معنى أقل بكثير.

      4. صياغة واختبار الفرضية:

      تساعدنا هذه الأساليب الإحصائية في صياغة واختبار الفرضية أو النظرية الجديدة. بمساعدة التقنيات الإحصائية ، يمكننا معرفة تأثير فرض الضرائب على صادرات الشاي على استهلاك الشاي في البلدان الأخرى. يمكن أن يكون المثال الآخر هو دراسة ما إذا كانت أزمة الائتمان فعالة في ضبط التضخم أم لا.

      5. التنبؤ:

      لا يهتم الإحصاء بالوظائف المذكورة أعلاه فحسب ، بل يتنبأ أيضًا بمسار العمل المستقبلي للظواهر. يمكننا وضع سياسات مستقبلية على أساس التقديرات التي يتم إجراؤها بمساعدة الإحصاء. يمكننا التنبؤ بالطلب على السلع في عام 2005 إذا عرفنا عدد السكان في عام 2004 على أساس معدل النمو السكاني في الماضي. وبالمثل ، يمكن لرجل الأعمال استغلال وضع السوق بطريقة ناجحة إذا كان يعرف اتجاهات السوق. تساعد الإحصاءات في تشكيل السياسات المستقبلية.

      6. صنع السياسات:

      بمساعدة الإحصائيات ، يمكننا صياغة سياسات مواتية. ما هي كمية المواد الغذائية المطلوب استيرادها في عام 2007؟ يعتمد ذلك على إنتاج الغذاء في عام 2007 والطلب على الغذاء في عام 2007. بدون معرفة هذه العوامل لا يمكننا تقدير كمية الواردات. على أساس التوقعات ، تشكل الحكومة السياسات المتعلقة بالحبوب الغذائية والإسكان وما إلى ذلك. ولكن إذا لم يكن التنبؤ صحيحًا ، فسوف يتأثر الإعداد بأكمله.

      7. يوسع المعرفة:

      يلاحظ ويبل بحق أن & # 8220 الإحصائيات تمكن المرء من توسيع أفقه & # 8221. لذلك عندما يمر الشخص بإجراءات إحصائية مختلفة ، فإنه يوسع نمط معرفته. كما أنه يوسع تفكيره وقوته المنطقية كما أنه يساعده على الوصول إلى نتيجة عقلانية.

      8. لقياس عدم اليقين:

      المستقبل غير مؤكد ، لكن الإحصائيات تساعد السلطات المختلفة في كل ظاهرة العالم على إجراء التقدير الصحيح من خلال أخذ وتحليل البيانات المختلفة للجزء. لذلك يمكن تقليل عدم اليقين. نظرًا لأنه يتعين علينا إجراء توقع ، يتعين علينا أيضًا إنشاء سلوكيات اتجاهية من الماضي ، والتي نستخدم من أجلها تقنيات مثل الانحدار والاستيفاء وتحليل السلاسل الزمنية.

      نطاق وأهمية الإحصاء:

      بقدر ما يتعلق الأمر بنطاق وأهمية الإحصاءات فهي واسعة جدا. يكاد لا يوجد نشاط بشري حيث لا تكون هناك حاجة لتطبيقه.

      فيما يتعلق بالنطاق ، يتم دراسته تحت الرؤوس التالية:


      شاهد الفيديو: Introduction to Probability, Basic Overview - Sample Space, u0026 Tree Diagrams (شهر نوفمبر 2021).