ABSTRACT
Ang pag-aaral na ito ay isang komparatibong pagsusuri sa mga piling item analysis na ginamit sa Grade 8 upang matukoy ang kanilang epektibong pagsukat sa kaalaman at kasanayan ng mga mag-aaral sa asignaturang Filipino. Layunin ng pananaliksik na masuri ang bahagdan ng mga tanong na tinanggihan (rejected), tinanggap (accepted), at nangangailangan ng paglinang (revised) batay sa difficulty index, discrimination index, at distractor analysis. Ang pag-aaral ay isinagawa sa loob ng isang buwan, mula Hulyo hanggang Agosto 2024, sa isang piling paaralan sa Junior High School na may 45 mag-aaral bilang kalahok. Ang mga natuklasan ay nagpapakita na ang karamihan ng mga item (35 sa 50) ay nasa nearly mastered category (50-74%), habang 12 item ay unmastered (ibaba ng 49%), na nagpapahiwatig ng pangangailangang pagbutihin ang disenyo ng mga tanong. Ang pagsusuri ay nagmungkahi ng rekomendasyon tulad ng paggamit ng mas malinaw na wika at konteksto upang mapabuti ang kalidad ng pagsusulit, na maaaring mag-ambag sa mas epektibong pagtuturo at pagkatuto sa Filipino.
Keywords: Item Analysis, Grade 8 Filipino, Difficulty Index, Discrimination Index, Distractor Analysis, Educational Measurement, Classical Test Theory, Item Response Theory, Junior High School, Pagsusulit
Introduction
Ang edukasyon ay nagsisilbing salalayan ng pag-unlad ng bawat indibidwal at lipunan, sapagkat dito nakaugat ang paglinang ng kaalaman, kasanayan, at pagpapahalaga ng mga mamamayan. Sa ganitong konteksto, ang pagiging epektibo ng pagtuturo at pagkatuto ay nakasalalay sa maingat na pagdidisenyo at pagsusuri ng mga pagsusulit na ginagamit upang sukatin ang kakayahan ng mga mag-aaral. Isa sa mga mahahalagang pamamaraan upang matiyak ang bisa (validity) at pagiging maaasahan (reliability) ng mga pagsusulit ay ang item analysis, na isang sistematikong proseso ng pagsusuri sa bawat tanong o item upang matukoy kung ito ay epektibong sumusukat sa itinakdang layunin ng pagtuturo. Ayon sa Classical Test Theory (CTT), ang bawat item ay dapat na tapat na sumasalamin sa tunay na kakayahan ng mag-aaral, habang ipinakikita naman ng Item Response Theory (IRT) ang mas detalyadong ugnayan sa pagitan ng kakayahan ng mag-aaral at ng posibilidad ng pagbibigay ng tamang sagot (Hambleton at Swaminathan, 1985). Ipinapahiwatig ng dalawang teoryang ito na mahalaga ang empirikal na pagsusuri ng mga item upang matiyak na ang mga ito ay tumutugon sa layunin ng edukasyon at epektibong nakapagsusukat ng inaasahang kasanayan.
Sa konteksto ng Grade 8 sa Pilipinas, kung saan ang asignaturang Filipino ay isang pangunahing bahagi ng K–12 Curriculum ng Department of Education (DepEd), mahalagang isagawa ang pagsusuri ng mga item upang matiyak na ang mga tanong ay naaayon sa antas ng pag-unawa, kasanayan, at kontekstong pangwika ng mga mag-aaral. Nanatiling hamon para sa mga guro ang pagtiyak na ang mga pagsusulit ay tumutugon sa antas ng kognitibong kakayahan ng mga mag-aaral sa Junior High School, kaya’t ang item analysis ay nagiging mahalagang kasangkapan upang tukuyin kung alin sa mga tanong ang dapat tanggapin, baguhin, o itakwil batay sa mga estadistikang tagapagpahiwatig ng kanilang bisa at pagiging maaasahan.
Ang pag-aaral na ito ay isinagawa mula Hulyo hanggang Agosto 2024 sa isang piling paaralan sa Junior High School, na tumutuon sa komparatibong pagsusuri ng 50 item mula sa mga pagsusulit sa Filipino ng ikalawang semestre ng taong panuruan 2023–2024. Layunin nitong matukoy kung alin sa mga item ang epektibo sa pagsusukat ng kaalaman at kasanayan batay sa bahagdan ng rejected (tinanggihan), accepted (tinanggap), at revised (nangangailangan ng paglinang) na mga tanong. Sa pamamagitan nito, inaasahang makapagbibigay ang pag-aaral ng konkretong batayan para sa pagpapahusay ng disenyo at pagsusuri ng mga pagsusulit sa Filipino, na magpapataas ng antas ng kalidad ng pagtatasa sa pagtuturo.
Ang pananaliksik na ito ay may malaking kahalagahan sa iba’t ibang stakeholder sa larangan ng edukasyon. Para sa mga guro ng Filipino sa Grade 8, magsisilbi itong gabay sa pagpapahusay ng mga pagsusulit, partikular sa disenyo ng mga item na naaayon sa Most Essential Learning Competencies (MELCs) ng DepEd. Para sa mga administrator ng paaralan at DepEd, makapagbibigay ito ng batayang datos upang makabuo ng mga patakaran o programang naglalayong mapabuti ang proseso ng pagtatasa at pagsusuri ng kaalaman. Samantala, ang mga mag-aaral ay makikinabang mula sa mas malinaw, patas, at naaayong mga tanong na tunay na sumusukat sa kanilang kakayahan, na posibleng magpataas ng kanilang kumpiyansa at motibasyon sa pag-aaral. Bukod dito, ang pananaliksik na ito ay nagdaragdag sa umiiral na literatura tungkol sa item analysis sa kontekstong Filipino, na maaaring magsilbing sanggunian para sa mga susunod pang pag-aaral na layuning mapaunlad ang kalidad ng edukasyon sa bansa.
Research Questions
Ang pananaliksik na ito ay naglalayong sagutin ang mga sumusunod na tanong upang mas maunawaan ang kalidad ng mga item sa pagsusulit:
Aling item analysis ang may pinakamataas na bahagdan ng REJECTED na mga tanong, na nangangahulugang hindi naaayon sa layunin ng pagsusulit o hindi malinaw sa mga mag-aaral?
Aling item analysis ang may pinakamataas na bahagdan ng ACCEPTED na mga tanong, na nagpapakita ng mataas na bisa at pagiging maaasahan?
Aling item analysis ang may pinakamataas na bahagdan ng mga tanong na nangangailangan ng PAGLINANG, na nangangailangan ng pagbabago upang mapabuti ang kanilang kalidad?
Methodology
Research Design
Ang pananaliksik na ito ay gumamit ng deskriptibong disenyo ng pananaliksik, na ang layunin ay suriin at ilarawan ang kasalukuyang kalagayan ng mga item sa pagsusulit ng Grade 8 sa Filipino batay sa kanilang difficulty index, discrimination index, at distractor analysis. Ang deskriptibong disenyo ay angkop sa pag-aaral na ito dahil nagbibigay ito ng malinaw na paglalarawan ng mga datos nang hindi nangangailangan ng manipulasyon ng mga variable, na tumutugma sa layunin ng pag-aaral na masuri ang epektibong item analysis (Creswell, 2014). Ang disenyo ay nagbigay-daan upang maipresenta ang mga natuklasan sa isang sistematikong paraan, na nagbibigay ng pundasyon para sa interpretasyon at rekomendasyon.
Participants
Ang mga kalahok ng pag-aaral ay binubuo ng 45 mag-aaral mula sa Grade 8 ng piling paaralan, na kumatawan sa mga tumugon sa 50-item na pagsusulit sa Filipino. Ang mga mag-aaral ay pinili batay sa kanilang aktibong pakikilahok sa ikalawang semestre ng taong panuruan 2023-2024. Bukod dito, kasama rin ang mga guro ng Filipino ng parehong antas bilang tagapagbigay ng datos at tagapagbigay ng pananaw tungkol sa kanilang karanasan sa paggamit ng item analysis. Ang pagpili ng mga kalahok ay hindi random ngunit batay sa kanilang availability at pakikilahok sa itinakdang pagsusulit, na isang karaniwang praktika sa deskriptibong pananaliksik sa loob ng isang espesipikong paaralan (Cohen et al., 2018).
Instruments
Ang mga sumusunod na instrumento ang ginamit upang makolekta at suriin ang datos. Una, ang mga umiiral na pagsusulit ay kinuha mula sa ikalawang semestre ng taong panuruan 2023–2024 para sa asignaturang Filipino ng Grade 8. Ang mga pagsusulit na ito ay naglalaman ng 50 item na sumasaklaw sa iba’t ibang kompetensya tulad ng pag-unawa sa binasa, pagsulat, at pagpapahayag.
Ikalawa, ginamit ang item analysis software na espesyal na dinisenyo upang kalkulahin ang difficulty index (sukatan ng kahirapan), discrimination index (sukatan ng kakayahang makilala ang mag-aaral na may mataas at mababang kaalaman), at magsagawa ng distractor analysis (pagsusuri sa pagiging epektibo ng mga maling pagpipilian). Ang software na ito ay nakatulong sa mabilis at tumpak na pagsusuri ng malaking dami ng datos.
Ikatlo, ipinamahagi ang isang questionnaire sa mga guro upang makuha ang kanilang opinyon, karanasan, at mungkahi tungkol sa paggamit ng item analysis sa kanilang mga pagsusulit. Ang talatanungan ay binubuo ng mga tanong na may Likert scale at open-ended na mga tanong upang makuha ang mas malalim na pananaw ng mga kalahok hinggil sa proseso ng pagsusuri ng mga pagsusulit.
Data Collection Procedure
Ang pangangalap ng datos ay isinagawa sa pamamagitan ng sistematikong proseso upang matiyak ang katumpakan at kabuuan ng impormasyon. Una, kinuha ang mga resulta ng pagsusulit sa mga guro ng Grade 8 Filipino sa pamamagitan ng pakikipag-ugnayan upang matiyak na ang mga datos ay kumpleto at walang nawawalang sagot mula sa 45 mag-aaral.
Ikalawa, ipinroseso ang datos gamit ang item analysis software, kung saan inilagay ang mga resulta ng pagsusulit upang masuri ang bawat item. Nagbigay ang software ng detalyadong ulat na naglalaman ng difficulty index, discrimination index, at distractor analysis para sa bawat tanong.
Ikatlo, ipinamahagi ang questionnaire sa mga guro pagkatapos ng pagsusuri ng datos upang makuha ang kanilang puna at obserbasyon. Ang mga sagot ay kinolekta sa loob ng isang linggo matapos ang pamamahagi.
Sa huling bahagi, inencode at inorganisa ang lahat ng nakalap na datos mula sa software at talatanungan bilang paghahanda para sa pagsusuri at interpretasyon. Ang maayos na pag-oorganisa ng datos ay nagbigay-daan sa mas malinaw na pagsusuri at masusing interpretasyon ng mga resulta.
Ang pagsusuri ng datos ay isinagawa gamit ang item analysis software upang makabuo ng mahahalagang sukatan na magsisilbing batayan ng interpretasyon. Una, sinuri ang difficulty index upang matukoy ang porsyento ng mga mag-aaral na nakakuha ng tamang sagot sa bawat item. Ang mga ito ay inuri sa tatlong kategorya: mastered (75–100%), nearly mastered (50–74%), at unmastered (below 49%).
Ikalawa, tinukoy ang discrimination index upang masuri kung paano nahihiwalay ng bawat item ang mga mag-aaral na may mataas at mababang kaalaman. Ang sukatan ay nakuha sa pamamagitan ng paghahambing ng pagganap ng pinakamataas na 27% at pinakamababang 27% ng mga tumugon.
Sa huli, isinagawa ang distractor analysis upang masuri ang epektibidad ng mga maling pagpipilian sa multiple-choice items. Ipinakita ng pagsusuring ito kung ang mga distractor ay naaakit ng sapat na bilang ng mga mag-aaral o kung kinakailangan ng pagbabago. Ang mga resulta ay inilahad sa mga talahanayan at binigyan ng detalyadong interpretasyon batay sa mga natuklasan upang makabuo ng mga kongkretong konklusyon para sa pagpapahusay ng kalidad ng pagsusulit.
Results
Overview of Data
Ang pagsusuri ay nakatuon sa 50 item na sinuri mula sa 45 mag-aaral ng Grade 8. Ang mga item ay naipresenta sa isang detalyadong talahanayan na nagpapakita ng bilang ng tamang sagot, porsyento ng tamang sagot, at kaukulang kategorya (mastered, nearly mastered, unmastered). Halimbawa, ang Item 1 ay may 8 tamang sagot mula sa 45 tumugon, na katumbas ng 17.78% (unmastered), habang ang Item 2 ay may 33 tamang sagot o 73.33% (nearly mastered).
Ang pagsusuri sa difficulty index ay nagpakita ng tatlong antas ng kahusayan ng mga mag-aaral batay sa porsyento ng tamang sagot sa bawat item. May 12 item na nahulog sa ibaba ng 49% (hal. Item 1: 17.78%, Item 8: 11.11%, Item 21: 20.00%), na nagpapahiwatig ng mataas na antas ng kahirapan o hindi malinaw na pagbuo ng tanong. Ang karamihan ng mga item (35 sa kabuuan) ay nasa saklaw ng 50–74% (hal. Item 2: 73.33%, Item 4: 60.00%, Item 17: 53.33%), na nagpapakita ng katamtamang kahirapan na naaayon sa antas ng Grade 8. Samantala, walang item na umabot sa 75–100% na kategorya, na maaaring magpahiwatig na ang mga tanong ay dinisenyo upang hamunin ang mga mag-aaral ngunit hindi sapat na madali upang ma-master ng lahat.
Batay sa resulta, ang ilang item ay nagpakita ng mababang antas ng discrimination, tulad ng Item 8 (11.11%) at Item 21 (20.00%), na parehong may discrimination index na mas mababa sa 0.20, na nangangahulugang hindi epektibo ang mga ito sa pagkakaiba ng pagganap ng mga mag-aaral. Sa kabilang banda, ang mga item tulad ng Item 2 (73.33%) at Item 4 (60.00%) ay nagpakita ng mas mataas na discrimination index na higit sa 0.30, na nagpapahiwatig ng kanilang kakayahang makilala ang mga mag-aaral na may mataas at mababang kaalaman. Ang karamihan ng mga item ay nasa saklaw ng 0.20–0.30, na nagpapakita ng katamtamang kakayahang makilala ang pagkakaiba sa antas ng pagganap ng mga mag-aaral.
Ang pagsusuri sa distractors ay nagpakita na ang ilang maling pagpipilian ay hindi epektibo dahil kaunti lamang ang pumili nito, tulad ng sa Item 8 kung saan ang mga distractors ay hindi naaakit ng sapat na bilang ng mga mag-aaral. Ipinapahiwatig nito ang pangangailangan ng pagpapabuti sa disenyo ng mga opsyon upang mas maging mapanlinlang at balanse. Sa kabilang banda, ang mga item tulad ng Item 2 ay nagpakita ng balanseng distractor analysis, kung saan ang mga maling sagot ay naaakit ng makatwirang bilang ng mga tumugon, na nagpapakita ng maayos na pagkakabuo ng mga alternatibong sagot.
Discussion
Interpretation of Findings
Ang mga resulta ay nagpapakita na ang karamihan ng mga item (35 sa 50) ay nasa nearly mastered category (50-74%), na nagpapahiwatig na ang mga tanong ay may katamtamang kahirapan at naaayon sa antas ng Grade 8, ngunit maaaring kailanganin ng paglinang upang mapabuti ang kanilang kalidad. Ang 12 unmastered items (ibaba ng 49%) tulad ng Item 8 (11.11%) at Item 21 (20.00%) ay maaaring dulot ng hindi malinaw na pagbuo ng tanong, hindi naaayong konteksto, o mataas na antas ng kahirapan na hindi tumutugma sa inaasahang kakayahan ng mga mag-aaral. Ayon kay Ebel & Frisbie (1991), ang mga item na may mababang porsyento ng tamang sagot ay dapat suriin kung ang kanilang layunin ay naaayon sa kurikulum o kung kailangan ng pagbabago.
Ang discrimination index ay nagpapakita ng variability sa epektibidad ng mga item. Ang mga item na may mataas na discrimination (hal. Item 2) ay epektibo sa pagkakaiba sa pagganap ng mga mag-aaral, na tumutugma sa teorya ng IRT na ang mga item ay dapat na sensitibo sa mga pagkakaiba sa kakayahan (Baker, 2001). Sa kabilang banda, ang mababang discrimination ng ilang item ay nagmumungkahi ng pangangailangang baguhin ang kanilang disenyo o konteksto. Ang distractor analysis naman ay nagpapahiwatig na ang ilang item ay nangangailangan ng mas balanseng mga maling pagpipilian upang matiyak ang patas na pagsusuri.
Implications
Ang mga natuklasan ng pag-aaral ay nagmumungkahi ng mahahalagang implikasyon para sa iba’t ibang stakeholder sa larangan ng edukasyon.
Para sa mga guro, kinakailangang baguhin ang disenyo ng mga unmastered items tulad ng Item 8 at Item 21 sa pamamagitan ng paggamit ng mas malinaw na wika, paglalapat ng mga kontekstong naaayon sa karanasan ng mga mag-aaral, at pagsasaayos ng antas ng kahirapan. Bukod dito, ang pagsasanay sa paggamit ng item analysis software ay makatutulong upang mapahusay ang kanilang kakayahang suriin at mapabuti ang kalidad ng mga pagsusulit.
Para sa Department of Education (DepEd), inirerekomenda ang pagsasagawa ng mga workshop o pagsasanay para sa mga guro hinggil sa psychometrics at item analysis upang matiyak na ang mga pagsusulit ay naaayon sa Most Essential Learning Competencies (MELC). Mahalaga rin ang pagbuo ng gabay sa disenyo ng mga item upang maging batayan sa paggawa ng mga de-kalidad na pagsusulit.
Para naman sa mga mag-aaral, ang pagpapabuti ng mga item ay inaasahang magreresulta sa mas makatarungang pagsusuri ng kanilang kaalaman, na maaaring magpataas ng kanilang motibasyon at kumpiyansa sa pag-aaral.
Limitations
Ang pag-aaral ay may mga limitasyon na kailangang isaalang-alang. Una, limitado ito sa isang paaralan at 45 mag-aaral, na maaaring hindi kumatawan sa mas malawak na populasyon ng Grade 8 sa buong bansa. Pangalawa, ang maikling panahon ng pag-aaral (isang buwan) ay hindi sapat upang masuri ang epekto ng mga rekomendasyon sa mas matagal na panahon. Pangatlo, ang paggamit ng umiiral na pagsusulit ay nagbigay ng limitasyon sa kontrol sa disenyo ng mga item, na maaaring magdulot ng bias sa pagsusuri.
Conclusion
Ang pag-aaral na ito ay nagpakita na ang item analysis ay isang mahalagang kasangkapan sa pagpapabuti ng kalidad ng pagsusulit sa Filipino sa Grade 8. Bagamat ang karamihan ng mga item ay nasa nearly mastered category, ang mga unmastered items at mababang discrimination index ay nagpapahiwatig ng pangangailangang pagbutihin ang disenyo ng mga tanong. Ang mga rekomendasyon, tulad ng paggamit ng mas malinaw na wika at konteksto, ay maaaring magbigay-daan sa mas epektibong pagsusukat ng kaalaman at kasanayan ng mga mag-aaral. Sa kabuuan, ang pananaliksik na ito ay nag-aambag sa patuloy na pagpapahusay ng edukasyong Filipino sa Junior High School.
References
Baker, F. B. (2001). The Basics of Item Response Theory. ERIC Clearinghouse.
Cohen, L., Manion, L., & Morrison, K. (2018). Research Methods in Education (8th ed.). Routledge.
Creswell, J. W. (2014). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches (4th ed.). SAGE Publications.
Ebel, R. L., & Frisbie, D. A. (1991). Essentials of Educational Measurement (5th ed.). Prentice Hall.
Hambleton, R. K., & Swaminathan, H. (1985). Item Response Theory: Principles and Applications. Kluwer-Nijhoff Publishing.
DOI 10.5281/zenodo.17317271