പി-മൂല്യം (സ്ഥിതിവിവരഗണിതം)

പി-മൂല്യം എന്നത് ഒരു സംഭാവ്യതയെ കുറിക്കുന്ന അളവാണ്‌. സംഭാവ്യതകൾ 0 (0%) മുതൽ 1 (100%) വരെയാകാം. പി-മൂല്യം 0.7 എന്ന് പറഞ്ഞാൽ സംഭാവ്യത 10ൽ 7 ആണ്‌, അല്ലെങ്കിൽ 70% ആണ്‌ എന്ന് അർത്ഥം. സ്ഥിതിവിവരശാസ്ത്രത്തിൽ പി-മൂല്യം എന്നതുകൊണ്ട് അർത്ഥമാക്കുന്നത് "ശൂന്യപരികല്പന സത്യമാകുന്ന അവസ്ഥയിൽ ഒരു സാമ്പിളിൽ നിന്ന് ലഭിക്കുന്ന ഡേറ്റക്ക് സമാനമായ ഡേറ്റ തന്നെ പൊതുജനസം‌ഖ്യയിൽ നിന്നും ലഭിക്കാനുള്ള സംഭാവ്യത"യെ ആണ്‌. ഉയർന്ന പി-മൂല്യങ്ങൾ അതുകൊണ്ടുതന്നെ ശുന്യപരികല്പന സത്യമാവാനുള്ള സാധ്യതയെ ആണു കാണിക്കുന്നത് [1].

പി-മൂല്യം തീരെ ചെറുതാണെങ്കിൽ അതിനർത്ഥം "ശൂന്യപരികല്പന സത്യമാകുന്ന അവസ്ഥയിൽ സാമ്പിൾ സജനസംഖ്യയിൽ നിന്ന് ലഭിക്കുന്ന ഡേറ്റ തന്നെ പൊതുജനസംഖ്യയിൽ നിന്നും ലഭിക്കാനുള്ള സാധ്യത തീരെ കുറവാണ്‌ " എന്നാണു. അതായത് നമ്മുടെ സാമ്പിൾ ജനസംഖ്യയിൽ നിന്ന് പരീക്ഷിച്ചു കിട്ടിയ ഫലങ്ങൾ യാദൃച്ഛികമാവാൻ സാധ്യത കുറവാണെന്നർത്ഥം. ഇങ്ങനെ പി-മൂല്യം തീരെ കുറവായി കണ്ടാൽ നാം ശൂന്യപരികല്പനയെ ഉപേക്ഷിക്കുന്നു. പിന്നെ അവശേഷിക്കുന്ന വൈകല്പിക പരികല്പനയെയാണു്‌(alternative hypothesis) നാം സ്വീകരിക്കുക.

പി-മൂല്യം ചെറുതാണെങ്കിൽ പരീക്ഷണഫലത്തെ "പ്രധാനം" (significant) എന്നും വലുതാണെങ്കിൽ "അപ്രധാനം" (insignificant) എന്നും വിവക്ഷിക്കാറുണ്ട്. കണ്ടെത്തിയ ഫലം യഥാർത്ഥത്തിലുള്ളതാവണമെന്നില്ല, മറിച്ച് യാദൃച്ഛികമാവാം എന്നതാണു "അപ്രധാനം" എന്നവാക്കുകൊണ്ട് സൂചിപ്പിക്കുന്നത്, ഫലം നിസ്സാരമാണ്‌ എന്നല്ല. സാമ്പ്രദായികരീതിയിൽ പി-മൂല്യം 0.5ൽ താഴെയാണെങ്കിൽ "പ്രധാന"മെന്നും 0.5നു മുകളിലാണെങ്കിൽ "അപ്രധാന"മെന്നും നിശ്ചയിക്കാറുണ്ട്. എന്നാൽ ഈ മൂല്യം തികച്ചും സ്വേച്ഛാപരവും കണക്കുകൂട്ടലിന്റെ സൗകര്യം പ്രമാണിച്ച് നിശ്ചയിച്ചിരിക്കുന്നതുമായ ഒന്നാണു. അതുകൊണ്ടുതന്നെ ഗവേഷണഫലങ്ങൾ പ്രസിദ്ധീകരിക്കുമ്പോൾ യഥാർത്ഥത്തിൽ കണക്കുകൂട്ടി ലഭിച്ച പി-മൂല്യം തന്നെ ഒപ്പം പ്രസിദ്ധീകരിക്കേണ്ടതുണ്ട്.

ഇവിടെ ശ്രദ്ധിക്കേണ്ട കാര്യം, ഉയർന്ന പി-മൂല്യങ്ങൾ കൊണ്ട് ശൂന്യപരികല്പന സത്യമാണെന്ന് സംശയാതീതമായി തെളിയിക്കാൻ നിങ്ങൾക്ക് കഴിയില്ല, മറിച്ച് ശൂന്യപരികല്പനയിൽ പറയുന്ന വാചകം സത്യമാകാനുള്ള സാധ്യത കൂടുതലാണെന്ന് സൂചിപ്പിക്കുക മാത്രമേ ചെയ്യുന്നുള്ളൂ. പൊതുജനസംഖ്യയിൽ നിന്നും തെരഞ്ഞെടുത്ത ഒരു ചെറു സംഘത്തിലാണ്‌ (സാമ്പിൾ ജനസംഖ്യ) പഠനങ്ങൾ നടത്തുന്നത് എന്നതുകൊണ്ടാണു്‌ ഇങ്ങനെ സാധ്യതകളെപ്പറ്റി പറയേണ്ടി വരുന്നത്. നാം പരീക്ഷിക്കാനായി തെരഞ്ഞെടുത്ത സാമ്പിൾ സംഘം യഥാർത്ഥത്തിൽ പൊതുജനസംഖ്യയെ എല്ലാ അർത്ഥത്തിലും പ്രതിനിധീകരിക്കുന്നുവെന്ന് പരിപൂർണമായും ഉറപ്പുവരുത്താൻ കഴിയില്ല. കൂടാതെ നാം പരീക്ഷിക്കാൻ എടുക്കുന്ന അളവുകൾ ആ ജനസംഖ്യയിലും നമ്മുടെ സാമ്പിളിലും ക്രമാനുസരണവിതരണത്തിന്റെ (normal distribution) നിയമങ്ങൾ പാലിക്കുന്നു എന്ന് ഉഹിക്കുകയാണു ചെയ്യുന്നത് (ഉദാഹരണത്തിന് ഒരു 70 വയസ്സു കഴിഞ്ഞയാളുകൾ മാത്രമുള്ള ഒരു സംഘത്തിന്റെ ശരാശരി രക്തസമ്മർദ്ദം). ഇത്തരം ഊഹങ്ങളും അനുമാനങ്ങളും വച്ചുള്ള കണക്കുകൂട്ടലുകളായതിനാൽ തന്നെ തെറ്റുകൾ പറ്റാനുള്ള സാധ്യതയുണ്ട്. ഇതു കൂടി കണക്കിലെടുത്ത് ശൂന്യപരികല്പനയെ സ്വീകരിക്കണോ തള്ളണോ എന്ന നിലയിൽ മാത്രം പി-മൂല്യങ്ങളെ നാം സാംഖ്യികത്തിൽ വ്യാഖ്യാനിക്കുന്നത്[2].

ഉദാഹരണം

തിരുത്തുക

ഒരു റാൻഡമൈസ്ഡ് നിയന്ത്രിത പഠനത്തിൽ (Randomized Controlled Trial) ഹൃദയാഘാത രോഗികളെ മെറ്റോപ്രലോൾ എന്ന മരുന്ന് എങ്ങനെ സം‌രക്ഷിക്കുന്നു എന്ന്‌ അന്വേഷിക്കുകയുണ്ടായി[3]. ഹൃദയാഘാതം വന്ന് 90 ദിവസങ്ങൾക്കുള്ളിൽ രോഗി മരണപ്പെടുന്നോ ഇല്ലയോ എന്നതാണു മുഖ്യ അനന്തരഫലമായി നിശ്ചയിച്ചത്. മെറ്റോപ്രലോൾ എന്ന മരുന്ന് ഈ മരണസാധ്യതയെ കുറയ്ക്കുന്നോ ഇല്ലയോ എന്നതാണു പഠിക്കാനുദ്ദേശിച്ച കാര്യം. രോഗികളെ രണ്ട് സംഘമായി തിരിച്ച് ഒരു കൂട്ടർക്ക് മെറ്റോപ്രലോൾ നൽകുകയും മറ്റേകൂട്ടർക്ക് അത് നൽകാതിരിക്കുകയും ചെയ്തു. ഇവിടെ ശൂന്യപരികല്പന (null hypothesis) എന്നത് "മെറ്റോപ്രലോൾ കഴിക്കുന്ന സംഘത്തിലെയും മെറ്റോപ്രലോൾ കഴിക്കാത്ത സംഘത്തിലെയും മരണസംഖ്യാനുപാതം ഒരുപോലെ ആയിരിക്കും" എന്നതാണ്‌. വൈകല്പികപരികല്പന (alternative hypothesis) എന്നതാകട്ടെ മെറ്റോപ്രലോൾ എടുക്കുന്ന രോഗികളിലെ മരണസംഖ്യ അതെടുക്കാത്ത രോഗികളുടെതിനു തുല്യമല്ല എന്നതാണ്‌ (ഇത് ഗുണമോ ദോഷമോ ആവാം).

ചികിത്സ മൊത്തം സാമ്പിൾ മരിച്ചവർ ശതമാനം
മെറ്റോപ്രലോൾ ലഭിക്കാത്തവർ(പ്ലസീബോ) 697 62 8.9%
മെറ്റോപ്രലോൾ ലഭിച്ചവർ 698 40 5.7%

മുകളിലെ പട്ടികയിൽ നിന്നും രണ്ട് സംഘങ്ങളും തമ്മിലെ മരണസംഖ്യാനുപാതങ്ങളിലുള്ള വ്യത്യാസം 0.032 ആണെന്ന് കാണാം. ഈ പഠനത്തിലെ 95% വിശ്വാസ്യതാ ഇടവേള (confidence interval) എന്നത് 0.005നും 0.059നും ഇടയ്ക്കായിരുന്നു. പരികല്പനാ പരീക്ഷണത്തിനായി "കൈ സ്ക്വയർ പരീക്ഷ" (Chi test) ചെയ്ത കിട്ടുന്ന പി-മൂല്യം 0.03 ആണ്‌. പി-മൂല്യം വളരെ ചെറുതായതിനാൽ ഈ പഠനത്തിൽ ശൂന്യപരികല്പനയെ നാം ഉപേക്ഷിക്കുകയും വൈകല്പികപരികല്പനയെ സ്വീകരിക്കുകയും ചെയ്യുന്നു.വൈകല്പിക പരികല്പനയിൽ തന്നെ രണ്ട് സാധ്യതകളുണ്ട് എന്നോർക്കുക. ഒന്നുകിൽ മരുന്ന് മരണസംഖ്യയെ കൂട്ടാം, അല്ലെങ്കിൽ അത് കുറയ്ക്കാം. ഇവിടെ മെറ്റോപ്രലോൾ കഴിച്ച ഹൃദയാഘാത രോഗികളിൽ മരണ സംഖ്യ കുറഞ്ഞതായിട്ടാണു കണ്ടിരിക്കുന്നത് എന്ന് പട്ടിക നോക്കിയാൽ മനസ്സിലാകും. അങ്ങനെ മെറ്റോപ്രലോൾ എന്ന മരുന്ന് ഹൃദയാഘാതരോഗികളിൽ ആദ്യ 90ദിവസത്തെ മരണസംഖ്യ കുറയ്ക്കാൻ സഹായിക്കുന്നുണ്ട് എന്ന് ഈ പഠനം സ്ഥാപിക്കുന്നതായി നമുക്ക് പറയാം.

  1. Gerard E. Dallal (2007).The Little Handbook of Statistical Practice Archived 2011-09-03 at the Wayback Machine..
  2. Schervish MJ (1996).P Values: What They Are and What They Are Not. The American Statistician 50 (3): 203–206. doi:10.2307/2684655.
  3. Hjalmarson A, et al. Effect on mortality of metoprolol in acute myocardial infarction. A double-blind randomised trial.Lancet. 1981 Oct 17;2(8251):823-7. DOI:10.1016/S0140-6736(81)91101-6. PMID: 6116950