Level 27 Level 29
Level 28

پردازش و تحلیل داده ها


101 words 0 ignored

Ready to learn       Ready to review

Ignore words

Check the boxes below to ignore/unignore words, then click save at the bottom. Ignored words will never appear in any learning session.

All None

Ignore?
آماده سازی داده ها از داده های خام
چهار مرحله دارد/اول- کدگذاری / دوم - تبدیل: آماده کردن اطلاعات کدگذاری شده از شکل مکتوب به کامپیوتری/ سوم - انتقال به کامپیوتر/ چهارم - تصحیح داده های وارد شده به کامپیوتر: بررسی صحت داده های وارد شده
آمار توصیفی
برای تقلیل، توصیف، تلخیص و نمایش روابط بین متغیرهاست/ شاخص های آن عبارتند از مد، میانه، معدل و همبستگی
آمار استنباطی
بر تحلیل، تفسیر و تعمیم نتایج حاصل از تنظیم و محاسبه مقدماتی آماری تاکید دارد/ برای برآورد ویژگی های جمعیت از نمونه به کار می رود/ برای محزر کردن اینکه آیا انتظار می رود که تفاوت ها یا روابط مشاهده شده در نمونه در جمعیت نیز وجود داشته باشند: آزمون های معناداری
چهار مقوله اصلی فنون تحلیل کمی
توصیف/ همبستگی/علیت/استنباط
برای پاسخ به پرسش چرا و مشخص کردن علیت از کدام روش ها استفاده می کنیم؟
تحلیل عامل/تحلیل مسیر/ رگرسیون
آماره های گرایش مرکزی سطح سنجش اسمی
نما یا حد
شاخص های آماری برای سنجش روابط متغیرهای سطح سنجش اسمی
خی دو، وی کرامر، لاندا، ضریب گودمن و کروسکال
نمودارهای مناسب سطح سنجش اسمی
میله ای یا ستونی/ دایره ای
آماره های گرایش مرکز سطح ترتیبی
مد و میانه
شاخص های آماری برای سنجش روابط متغیرهای ترتیبی
کندال، دی سامرز، گاما، اسپیرمن
نمودارهای مناسب سطح ترتیبی
دایره ای، میله ای، ستونی
آماره های گرایش مرکز سطح فاصله ای
نما، میانگین و همه شاخص های گرایش مرکز
شاخص های آماری برای سنجش روابط متغیرهای فاصله ای
ضریب همبستگی پیرسون یا ضریب همبستگی ساده
نمایش مناسب سطح فاصله ای
نمودار چند ضلعی/ نمودار هیستوگرام برای متغیرهای فاصله ای و نسبتی
ویژگی های میانه
نسبت به اعداد بزرگ یا کوچک حساس نیست/ اندازه یا حجم واحدهای اندازه گیری در میانه تاثیر ندارد/ هر جامعه آماری فقط یک میانه دارد/وقتی همه مقادیر معلوم نیستند باز هم میانه قابل محاسبه است/ وقتی توزیع چولگی قابل ملاحظه دارد میانه به کار می بریم/
میانگین
بهترین شاخص گرایش مرکز/ پایدارترین و معتبرترین شاخص گرایش مرکز/
ویژگی های میانگین
متاثر از داده های پرت/ مرکز ثقل داده ها/ در هر جامعه آماری فقط یک میانگین وجود دارد/ فقط در مورد داده های فاصله ای و نسبی کاربرد دارد
منظور از حالت تقارن در رابطه میان نما، میانه و میانگین چیست؟
حالتی که میانگین، میانه و نما با هم برابرند و بر روی هم منطبق / در منحنی نرمال دیده می شود/ M=Md=Mo/ Q3-Q2=Q2-Q1
منظور از حالت کجی یا چولگی به سمت راست یا مثبت چیست؟
میانگین بزرگتر از میانه بزرگتر از مد
منظور از حالت کجی یا چولگی به سمت چپ یا منفی چیست؟
مد بزرگتر از میانه بزرگتر از میانگین / M<Md<Mo / Q3-Q2<Q2-Q1
کجی یا چولگی
یکی از شاخص های پراکندگی است و زمانی کاربرد دارد که متغیر در سطح سنجش فاصله ای باشد / ضریب کجی sk / بین 3 و -3 قرار دارد/
نمرات استاندارد
وضعیت افراد یا نمره ها را نسبت به میانگین تعیین می کنند / دارای مقیاس فاصله ای هستند/ وضعیت نمره فرد را در بالا یا پایین میانگین نشان می دهند
انواع نمرات استاندارد
نمره Z و نمره T
نمره Z
حاصل تقسیم انحراف نمرات از میانگین به انحراف استاندارد / دارای میانگین صفر و انحراف استاندارد 1/
ویژگی های نمره Z
واحد اندازه گیری نمره های Z ، انحراف استاندارد است/ نمره های بالای میانگین دارای Z مثبت و نمره های پایین میانگین دارای Z منفی هستند/ توزیع نمرات Z دارای یک مقیاس فاصله ای است/ در محاسبه نمره های Z با نمره های خام سروکار داریم
ویژگی های نمره T
دارای میانگین 50 و انحراف استاندارد 10 است/ بر خلاف نمره Z ، نمره T همیشه مثبت است/ دامنه آن بین 20 تا 80 است/ فرمول محاسبه نمره T=10Z+50
شاخص های پراکندگی
شاخص هایی که میزان پراکندگی یا گستردگی یک توزیع را نشان می دهند/ بر دو نوعند: شاخص های پراکندگی متغیرهای کیفی و کمی
شاخص های پراکندگی متغیرهای کیفی
نسبت تغییرات V.R / شاخص تغییرات کیفی IQV
دامنه تغییرات R
ساده ترین شاخص پراکندگی/ تفاضل بین کوچکترین و بزرگترین عدد در توزیع/ مستلزم داشتن مقیاس فاصله ای/ در مقیاس اسمی و ترتیبی به کار نمی رود/ وابسته به حجم نمونه
انحراف چارکی Q.D و ویژگی های آن
تفاضل چارک اول از چارک سوم Q.D=Q3-Q1/ از دامنه تغییرات باثبات تر است چون بر پراکندگی داده ها در 50 درصد وسط توزیع مبتنی است / تحت تاثیر نمرات خیلی بزرگ و خیلی کوچک قرار نمی گیرد/ اگر انحراف چارکی صفر شود یعنی 50% اندازه ها در وسط توزیع قرار گرفته اند و چارک اول = چارک دوم = چارک سوم/ ضعف این شاخص آن است که 50 درصد از داده ها را حذف می کند/ انحراف چارکی چولگی را تعیین می کند
چارک ها
Q1 در نقطه ای قرار دارد که 1/4 اعداد از آن کوچکتر و 3/4 از آن بزرگتر هستند/ چارک وسط برابر با میانه است یعنی نقطه ای که توزیع را به دو قسمت مساوی تقسیم می کند/ چارک سوم نقطه 75 درصدی است
انحراف متوسط یا انحراف میانگین AD – M.d
یکی از شاخص های پراکندگی/ یک شاخص فاصله ای/ میزان پراکندگی موجود در توزیع نمره ها را نشان می دهد/ نسبت به واریانس و انحراف معیار شاخص پایداری نیست و دقت کمتری دارد/ اگر همه مقادیر با هم برابر باشند، انحراف از میانگین صفر است و برعکس/ انحراف متوسط اعداد ثابت صفر است/
واریانس
از شاخص های پراکندگی/ معدل مجذور انحراف نمره ها از میانگین / در سطح سنجش فاصله ای و نسبی کاربرد دارد/ فاقد واحد اندازه گیری است/ اگر همه مقادیر یک توزیع با هم برابر باشند واریانس صفر است و برعکس/ واریانس اعداد ثابت، صفر است/
انحراف معیار یا انحراف استاندارد
مشکل واریانس نداشتن واحد اندازه گیری است که با جذر گرفتن از آن این مشکل رفع می شود/ انحراف معیار جذر واریانس است/ معتبرترین و پایدارترین شاخص پراکندگی/ در سطح سنجش فاصله ای و نسبی کاربرد دارد/ هر چقدر s کوچکتر باشد، جامعه یا افراد مورد مطالعه متجانس تر است/ انحراف معیار مثل میانگین تحت تاثیر همه نمره ها قرار می گیرد/ واریانس همیشه با انحراف معیار برابر یا از آن بزرگتر است/
ویژگی های انحراف معیار
اگر همه مقادیر با هم برابر باشند انحراف معیار صفر است و برعکس/ انحراف معیار اعداد ثابت، صفر است/ مشکل انحراف معیار آن است که مقید به واحد اندازه گیری است : اگر یک توزیع دارای انحراف معیار 3 و دیگری دارای انحراف معیار 4 باشد نمی توان گفت که پراکندگی کدام بیشتر است
شاخص چولگی
بیانگر میزان کجی منحنی توزیع فراوانی است/ یعنی انحراف یک منحنی از حالت تقارن/ در صورتی که منحنی توزیع نمرات متقارن باشد، ضریب چولگی برابر صفر خواهد شد/
شاخص کشیدگی
میزان برآمدگی منحنی توزیع فراوانی را نشان می دهد/ هرگاه منحنی توزیع نرمال باشد ضریب کشیدگی صفر خواهد شد/ وقتی منحنی توزیع فراوانی دارای فرورفتگی باشد ضریب کشیدگی منفی – پراکندگی داده ها بیشتر - و وقتی که در اوج باشد ضریب کشیدگی مثبت خواهد شد- داده ها به میانگین نزدیکتر - / اگر مقدار ضریب کشیدگی کمتر از 0.1 باشد کشیدگی خفیف است/ اگر بین 0.5 تا 0.1 باشد کشیدگی متوسط است/ اگر بیشتر از 0.5 باشد کشیدگی شدید است
توزیع و منحنی نرمال یا متقارن
بسیاری از حوادث و متغیرها دارای این شکل طبیعی است/ توزیع نرمال میانگین صفر و انحراف معیار یک دارد/ حداکثر ارتفاع این منحنی در میانگین قرار دارد/ چولگی Sk=0 / کشیدگی k=0 / دنبال های منحنی با محور x موازی هستند بنابراین منحنی از مثبت بی نهایت یا منفی بی نهایت ادامه دارد/ مساحت منحنی معادل یک یا 100% است/ در هر طرف میانگین 50% نمره ها توزیع می شوند/ در منحنی نرمال همیشه با اعداد ثابت مواجه هستیم
سطوح زیر منحنی طبیعی استاندارد
پنجاه درصد توزیع در طرفین میانگین قرار دارد/ 68.26% موارد بین +1 و -1 انحراف معیار حول میانگین قرار دارند/ 95.44% از افراد بین +2 و -2 انحراف معیار/ 99.72% افراد بین +3 و -3 انحراف معیار قرار دارند/ در یک توزیع طبیعی رتبه درصدی هر فرد سطحی از منحنی است که در سمت چپ نمره استاندارد زد آن قرار دارد/
آزمون آماری
برای اینکه بفهمیم بین دو متغیر رابطه وجود دارد یا نه، از آن استفاده می کنیم/ انتخاب یک آزمون آماری مناسب به دو معیار بستگی دارد/ اول سطح سنجش متغیرهای مندرج در فرضیه/ دوم هدف مندرج در فرضیه
شاخص هایی که روابط بین متغیرهای اسمی را می سنجند
PREضرایب مبتنی بر کی 2 / ضرایب مبتنی بر*
ضرایب مبتنی بر کی 2
روابط بین متغیرهای اسمی را می سنجند/ ضریب یول کیو / ضریب فی / ضریب توافقی یا همخوانی پیرسون - سی / ضریب چوپروف - تی / ضریب وی کرامر یا کندال
ضرایب مبتنی بر/ PRE/ یا اصل کاهش نسبی خطا
ضریب لاندا/ ضریب تای گودمن کروسکال
کای اسکوئر
میزان رابطه دو متغیر را مشخص نمی کند/ تنها می گوید آیا تفاوت میان مقادیر دو متغیر معنی دار است یا خیر/ فرض ابتدایی محقق آن است که دو متغیر با هم رابطه ندارند – فرض استقلال آماری - / اگر سطح معنی داری کوچکتر از 5 درصد باشد می گوییم به احتمال 95 درصد بین دو متغیر رابطه وجود دارد/ در سطح اسمی
شرایط استفاده از کای اسکوئر یا خی 2 یا کی 2
داده ها به صورت تصادفی انتخاب شوند/ هیچ یک از خانه های جدول نباید کمتر از 10 باشد/ نمونه به قدر کافی بزرگ باشد/ این ضریب برای روابط غیرخطی کاربرد دارد/ اگر خانه های کمتر از 5 زیاد باشند اعتبار آزمون مخدوش می شود
ضرایب متقارن
ضرایبی که اگر در جدول جای متغیر مستقل و وابسته را عوض کنیم، مقدار آنها تغییر نمی کند/ یعنی فرق نمی کند که متغیر وابسته یا مستقل کدام در سطر باشند و کدام در ستون/ همچنین ضرایب متقارن جهتدار نیستند
ضریب یول Q
ضریب مبتنی بر خی 2/ ضریب متقارن/ ویژه جداول 2 در 2/ دامنه تغییرات آن از +1 تا -1 /برای سطح سنجش اسمی
ضریب همبستگی فی
متقارن است/ وقتی از آن استفاده می کنیم که سطر و ستون با هم برابر باشند/ ویژه جداول 2 در 2/ مناسب ترین ضریب برای جداول 2 در 2 / دامنه تغییرات آن از 0 تا +1
توزیع و منحنی نرمال یا متقارن
بسیاری از حوادث و متغیرها دارای این شکل طبیعی است/ توزیع نرمال میانگین صفر و انحراف معیار یک دارد/ حداکثر ارتفاع این منحنی در میانگین قرار دارد / چولگی و کشیدگی مساوی صفر است/ دنبال های منحنی با محور ایکس موازی هستند بنابراین منحنی از مثبت بی نهایت یا منفی بی نهایت ادامه دارد/ مساحت منحنی معادل یک یا 100% است/ در هر طرف میانگین 50% نمره ها توزیع می شوند/
ضریب توافقی یا همخوانی پیرسون C
ضریب مبتنی بر کی2/ مناسب برای سطح سنجش اسمی/ متقارن/ ویژه جداول مربعی/ ویژه جداول با بیش از دو خانه یعنی 3 در 3 یا بیشتر / چنانچه تعداد طبقات بیشتر از 5 در 5 باش می تواند تخمین خوبی از ضریب همبستگی آر پیرسون باشد
ضریب چوپروف t
ضریب نسبت ها/ مناسب برای جداول مستطیلی/ ضریب متقارن/ دامنه تغییرات از 0 تا 1/ زمانی که هر دو متغیر اسمی یا یکی اسمی و دیگری ترتیبی باشد استفاده می شود/ نسبت به کای اسکوئر مزیت دارد: شدت رابطه دو متغیر را نیز محاسبه می کند/
ضریب وی کرامر یا کندال V
بهترین ضریب برای جداول مستطیلی/ ضریب مبتنی بر کی 2/ مناسب برای سطح سنجش اسمی/ متقارن است و هم برای جداول مربعی و هم مستطیلی به کار می رود/ دامنه تغییرات آن از 0 تا 1 است/
ضرایب مبتنی بر اصل کاهش نسبی خطا در سطح سنجش اسمی
لاندا / تای گودمن کروسکال
ضریب لاندا
ضریب نامتقارن/ برای سطح سنجش اسمی/ گستره آن بین 0 تا 1/ شدت رابطه دو متغیر را محاسبه می کند/ جهت رابطه را نشان نمی دهد/ برای سنجش جهت رابطه باید از تحلیل جدولی استفاده کرد/
ضریب تای گودمن کروسکال
یک ضریب نامتقارن/ برای سطح سنجش اسمی/ دامنه آن از 0 تا 1/
ضرایب و آزمون های سنجش رابطه بین متغیرها در سطح ترتیبی
ضریب همبستگی اسپیرمن/ ضرایب کندال تاو آ، بی،سی/ گاما/ سامرز
ضریب همبستگی رتبه ای اسپیرمن
ضریب متقارن/ برای سطح سنجش ترتیبی/ دامنه تغییرات از 0 تا 1/ زمانی به کار می رود که نمره ها رتبه بندی شده باشند یا به جای اعداد رتبه های آنها در دست باشد/ برای سنجش ارتباط میان دو سری رتبه های متوالی ناپیوسته/ اگر مقدار محاسبه شده از مقدار جدول بیشتر باشد رابطه معنی دار است/
ضریب تاو آ کندال
یک ضریب متقارن/ دامنه از 0 تا +1/ برای سطح سنجش ترتیبی/ چنانچه داده ها به صورت منفرد و حجم نمونه کمتر از 10 باشد از این ضریب استفاده می شود/ یک شاخص مبتنی بر اصل کاهش نسبی خطا است/ معمولا میل دارد همبستگی را 0.2 کمتر نشان دهد/ ملاک خوبی برای تعیین شدت همبستگی نیست/
ضریب تاو بی کندال
یک ضریب متقارن/ دامنه از 0 تا +1/ مختص سطح سنجش ترتیبی/ ویژه جداول مربعی/ یک شاخص مبتنی بر اصل کاهش نسبی خطا است/ مناسبترین شاخص برای اندازه گیری میزان همبستگی صفات است/
ضریب تاو سی کندال
یک ضریب متقارن/ دامنه از -1 تا +1/ مختص سطح سنجش ترتیبی/ ویژه جداول مستطیلی/ یک شاخص مبتنی بر اصل کاهش نسبی خطا است/
ضریب گاما
مختص سطح ترتیبی/ از ضرایب متقارن/ دامنه تغییرات بین -1 تا +1/ یک شاخص مبتنی بر اصل کاهش نسبی خطا است/ شدت همبستگی را بیش از آنچه واقعا هست نشان می دهد و شاخص خوبی نیست
ضریب دی سامرز
مختص سطح سنجش ترتیبی/ از ضرایب نامتقارن/ دامنه تغییرات بین -1 و +1/ یک شاخص مبتنی برکاهش نسبی خطا است/
ضریب همبستگی پیرسون آر یا ضریب ساده
برای سنجش همبستگی بین دو متغیر فاصله ای یا نسبی/ ضریب متقارن/ دامنه آن از -1 تا +1 / همبستگی یعنی هم تغییری/ یعنی افزایش یا کاهش در یک متغیر با افزایش یا کاهش در متغیر دیگر همراه باشد/ این ضریب نوع رابطه، جهت رابطه، مقدار و میزان رابطه را نشان می دهد/
مفروضات اصلی ضریب همبستگی پیرسون
رابطه بین دو متغیر خطی باشد/ توزیع ها دارای شکل متشابه باشند/ نمودار پراکندگی ها یکسان باشد/ تفسیر ضریب همبستگی به صورت درصد نباشد/ صرف وجود همبستگی به معنای وجود رابطه علت و معلولی نیست
خواص ضریب همبستگی پیرسون
نسبت به داده های پرت حساس است/ سطح معنی داری این ضریب به شدت به حجم نمونه وابسته است/ اگر به مقادیر متغیرهای وابسته و مستقل عدد ثابتی اضافه کنیم ضریب همبستگی پیرسون تغییری نخواهد کرد/ اگر جای متغیر مستقل و وابسته را عوض کنیم ضریب تغییری نخواهد کرد
تفاوت آر پیرسون با آر رگرسیون
آر پیرسون صرفا بیانگر رابطه میان دو متغیر است اما آر رگرسیون بیانگر رابطه میان دو یا چند متغیر است/ دامنه تغییرات آر پیرسون بین +1 تا 1- است اما دامنه تغییرات آر رگرسیون بین 0 تا +1 است/ آر پیرسون براساس متغیر مستقل و وابسته محاسبه می شود اما آر رگرسیون براساس نمره های متغیر وابسته مشاهده شده و نمره های پیشبینی شده محاسبه می گردد.
انواع رگرسیون
تحلیل رگرسیون ساده/ تحلیل رگرسیون چندگانه/ تحلیل رگرسیون چندگانه چند متغیری
روش های مناسب برای نشان دادن روابط بین دو متغیر
ترسیم جدول تقاطعی/ ترسیم نمودار پراکندگی/ تحلیل رگرسیون/ مقایسه میانگین ها / همبستگی رتبه ای
تحلیل رگرسیون
با تحلیل رگرسیون می توان با اطلاع از نمره متغیر مستقل نمره متغیر وابسته آن را پیشبینی کرد/ مثلا اگر سطح تحصیلات را داشته باشیم، می توانیم سطح درآمد را پیشبینی کنیم/ همچنین می توان مقدار تاثیر هر واحد تغییر در متغیر مستقل را بر متغیر وابسته تعیین کرد/
تفاوت ضرایب همبستگی و رگرسیون
این دو ضریب به هم مرتبط اند اما اطلاعاتی کاملا متفاوت و در عین حال مکمل یکدیگر فراهم می آورند/ ضریب همبستگی به صورت شاخص دقت پیشبینی براساس خط رگرسیون عمل می کند/ ضریب رگرسیون برآورد مقدار تاثیر متغیری بر متغیری دیگر است/ ضریب همبستگی روشی برای تعیین دقت این برآورد است/ پس لازم است ضرایب رگرسیون و همبستگی را با هم بکار برد/
ویژگی های رگرسیون
مختص متغیرهای فاصله ای است اما در مواردی خاص می توان از تحلیل رگرسیون ظاهری برای متغیرهای اسمی یا ترتیبی استفاده کرد/ برای سنجش مقدار تاثیر متغیری بر متغیر دیگر یا مقدار تغییری که متغیری در متغیر دیگر به وجود می آور به کار می رود/ برای سنجش شدت رابطه به کار نمی رود
تحلیل رگرسیون ظاهری
کاربرد رگرسیون برای متغیرهای اسمی یا ترتیبی
نامتقارن بودن ضرایب رگرسیون
مقادیر برحسب اینکه کدام متغیر، متغیر مستقل است فرق می کنند/ هنگام کاربرد این ضرایب باید مشخص کرد که کدام متغیر، مستقل است و کدام وابسته
مقایسه میانگین ها
وقتی به کار می رود که متغیر وابسته در سطح فاصله ای بوده و تعداد طبقات متغیر مستقل کم باشد/
تحلیل واریانس یک طرفه
در روش مقایسه میانگین ها به کار می رود تا مشخص کند که آیا اختلاف های مشاهده شده در نمونه واقعی است یا فقط ناشی از خطای نمونه گیری/ برای انجام این تحلیل آماره اف. و سطح معنی داری را محاسبه می کنیم/ اگر سطح معنی داری پایین باشد – یعنی کمتر از 0.05 یا 0.01 – تفاوت میانگین های نمونه واقعی است/ احتمالا همین تفاوت در جمعیت هم وجود دارد
تحلیل واریانس یک طرفه برای بیش از دو میانگین
در مقایسه سه یا چند میانگین آنچه آزمون اف. می تواند نشان دهد این است که دست کم بین دو میانگین اختلاف واقعی وجود دارد/ برای پیدا کردن اینکه کدام میانگین ها با هم اختلاف دارند فقط کافی است میانگین ها را بررسی کنیم یا از آزمون شف استفاده کنیم
شرایط استفاده از شیوه مقایسه میانگین ها و آزمون اف.
متغیر وابسته باید در سطح فاصله ای باشد/ سطح سنجش متغیر مستقل مهم نیست اما تعداد طبقات آن مهم است/ هر چه طبقات بیشتر باشد تفسیر سخت خواهد شد/ اگر طبقات زیاد باشد باید طبقات را ادغام کرد یا از روش دیگری برای مقایسه استفاده کرد/
فرض صفر یا فرض خنثی
بین دو متغیر ارتباطی وجود ندارد
برآورد چیست و چه ویژگی هایی دارد
برآورد یعنی تخمین پارامترهای جامعه از روی شاخص های نمونه/ باید بدون اریب، دارای ثبات، دارای کارایی و مکفی باشد/
عدم اریب
هنگامی که در شاخص آماری محاسبه شده گرایش منظمی جهت بزرگتر یا کوچکتر شدن از پارامتر وجود نداشته باشد، برآورد بدون اریب نامیده می شود/ یعنی در نمونه گیری باید در تجزیه و تحلیل و در ابزار سوگیری وجود نداشته باشد
ثبات
زمانی روش برآورد دارای ثبات است که با افزایش نمونه، مقدار شاخص آماری برآورد شده به پارامتر نزدیک تر شود
کارایی
برآورد زمانی کارآست که بدون اتلاف اطلاعات بهترین نتیجه را به دست دهد
کفایت
زمانی برآورد مکفی است که واریانس نمونه گیری آن شیوه، کوچکتر از شیوه دیگر باشد
برآورد نقطه ای
زمانی که پارامتر جامعه به صورت یک نقطه براورد شده باشد
برآورد فاصله ای
زمانی که ما به جای یک نقطه، یک بازه تعریف کرده باشیم و میانگین جامعه در این بازه قرار می گیرد
فرضیه آماری
یک بیان کمی درباره پارامتر جامعه است و به دو دسته فرض صفر یا پوچ یا خنثی / و فرض خلاف یا فرض تحقیق، یا فرض پژوهش یا مقابل یا فرض یک یا بدیل تقسیم می شود
فرض صفر یا خنثی
این فرض را با اچ صفر. نشان می دهند/ این فرض اصل را بر این قرار می دهد که بین پارامترهای مورد مطالعه اختلاف یا ارتباط معنی داری وجود ندارد/ به صورت پارامتری بیان می شود/ مثلا اگر فرض کنیم هوش تمام دانشجویان کارشناسی ارشد 126 است پس فرض صفر عبارت است از - H0=µ-126=0/ H0=µ=126
فرض تحقیق
این فرض را با Ha – H1 نشان می دهند/ مخالف فرض صفر است / ممکن است به صورت یک دامنه یا دو دامنه مطرح شود/ در فرض خلاف یک دامنه می کوشیم نشان دهیم که میانگین نمونه حاصل به صورت معناداری بزرگتر یا کوچکتر از میانگین جامعه است، یعنی H1: µ>126 / H1: µ<126 / ولی در فرض خلاف دو دامنه اصولا به دنبال پیدا کردن نوعی تفاوت هستیم، بدون اینکه به جهت تفاوت توجه داشته باشیم: H1= µ=126
روند آزمون معناداری یک فرضیه
ابتدا با توجه به سطح متغیرها تصمیم می گیریم که از کدام آزمون استفاده کنیم/ بعد از انتخاب آزمون فرض صفر و فرض اصلی را بیان می کنیم/ بعد در مورد یک طرفه بودن یا دو طرفه بودن آزمون تصمیم می گیریم/ بعد به سراغ تشخیص نواحی ای که فرض صفر باید رد یا قبول شود می رویم/ معمولا اکثر آزمون ها با اطمینان 95% و خطای 5% در نظر گرفته می شوند/ آماره آزمون را از طریق یکی از توزیع های متعارف مانند Z, T, X2, F محاسبه می کنیم/ مقدار محاسبه شده را با مقدار جدول استاندارد مخصوص آماره مورد نظر مقایسه می کنیم/ اگر قدر مطلق مقدار محاسبه شده در منطقه رد فرضیه صفر قرار بگیرد و بیش از قدرمطلق مقدار جدول باشد می توان به معنی دار بودن رابطه حکم کرد
انواع خطا
خطای نوع اول یا α و خطای نوع دوم یا β یا سطح معنی داری/ هر چه آلفا بزرگتر باشد بتا کوچکتر است/ اگر خطای نوع اول افزایش پیدا کند، احتمال ارتکاب خطای نوع دوم کاهش می یابد/ باید سعی کرد که احتمال ارتکاب خطای نوع اول را کاهش داد
خطای نوع اول یا α
زمانی رخ می دهد که رابطه وجود نداشته باشد اما محقق اشتباها بگوید رابطه هست/ با سطح معنی داری آزمون یا درجه اطمینان رابطه مستقیم دارد
خطای نوع دوم یا β یا سطح معنی داری
زمانی رخ می دهد که رابطه وجود دارد اما محقق اشتباها بگوید رابطه وجود ندارد/ به چهار عامل بستگی دارد: سطح معنی داری- اندازه تاثیر متغیر مستقل- مقدار پراکندگی موجود در متغیر وابسته – اندازه یا حجم نمونه
توان آزمون
توان یک آزمون آماری برابرست با احتمال رد فرض صفر وقتی که این فرض واقعا غلط است/ برابر است با β 1-/ هر عامل یا وضعیتی که موجب کاهش β شود توان آزمون را افزایش خواهد داد/
چه زمان در آزمون فرضیه از توزیع Tتی استیودنت استفاده می کنیم؟
هنگامی که حجم نمونه کوچک بوده و توزیع نرمال نباشد
تحلیل عامل
روش ریاضی پیچیده ای برای تقلیل مجموعه بزرگی از متغیرها با مجموعه کوچکتری از متغیرهای اساسی است که عامل خوانده می شوند
چهار مرحله عمده مقیاس سازی با استفاده از تحلیل عامل
انتخاب متغیرها برای تحلیل عامل/ استخراج مجموعه ای از عوامل مقدماتی/ استخراج مجموعه عوامل نهایی به وسیله داوران/ ساختن مقیاس برای استفاده در تحلیل های بعدی
فرض های تحلیل عامل
در انتخاب متغیرهایی که در تحلیل عامل وارد می شوند باید فرض ما این باشد که همبستگی بین متغیرها غیرعلی است – در واقع همبستگی بین متغیرها باید محصول عامل دیگری، یعنی عامل مشترک سومی باشد / فرض دو: باید مطمئن باشیم متغیرهای مورد نظر دستکم همبستگی معقولی با برخی متغیرهای دیگر تحلیل دارند/
تعیین تعداد عامل ها در تحلیل عامل
هدف تحلیل عامل ارائه هر چه ساده تر یک رشته متغیر است پس بهترین تحلیل عامل دربردارنده حداقل عوامل لازم است
بهترین مدل در تحلیل عاملی
بهترین مدل ساده ترین مدل است (یعنی با کمترین عامل) که بیشترین واریانس مجموع اولیه متغیرها را تبیین می کند
فرایند آماری کنترل
همتاسازی گروه های آزمایش بعد از گردآوری داده ها/ فقط موارد مشابه را باید با هم مقایسه کرد/ محدود کردن مقایسه به افرادی که برحسب متغیری یکسان اند و بنابراین حذف اثر آن متغیر
برای انجام کنترل آماری چندگانه
نمونه را به گروه های زیادی تقسیم می کنیم به گونه ای که هر گروه در تمام متغیرهای مزبور یکسان باشد/ بعد تفاوت دو گروه را در این زیرگروه های کوچک می سنجیم/ اگر تفاوت مشاهده شده اولیه در دو گروه در این زیرگروه ها از بین رفت، می گوییم تفاوت مشاهده شده اولیه ناشی از متغیر کنترل بوده است یا اینکه متغیرهای کنترل شده تبیین کننده رابطه اولیه هستند