妥当性、タイプ、形式、概念、および測定の定義
妥当性の定義
妥当性は言葉から来る 有効 これは、測定機能を実行する際の測定器の精度と精度を意味します(Azwar1986)。 妥当性は、機器の妥当性または妥当性のレベルを示す尺度です。 有効性の原則は、データ収集における機器の信頼性の原則を意味する測定または観察です。
機器は、測定することになっているものを測定できなければなりません。 したがって、妥当性は、測定ツールまたは観察に重点を置きます。 直接測定できない変数や概念を含む研究では、妥当性の問題は単純ではなく、 しかし、理論レベルから経験レベル(指標)までの概念の精緻化は、結果を得るために研究手段が有効でなければならないことは簡単ではありません。 信頼できる。
関連する可能性のある記事も読んでください: 定量的定性的差異–定義、アプローチ、タイプ、調査、設計
形 有効 専門家によると
エベルによると(ナジル1988年)
- 同時妥当性は、スコアとパフォーマンスの関係に関する妥当性です。
- 構成概念の妥当性は、心理的側面が測定されるものの品質に関する妥当性です。 測定し、特定の構成が良好なパフォーマンスにつながる可能性があるという評価があります 測定。
- 顔の妥当性は、測定されることになっているものではなく、何かを測定しているように見えるものに関連する妥当性です。
- 測定器の階乗妥当性は、測定器との同時因子間の相関関係です。 グループまたは他の行動測定、この妥当性は分析技術teknikを使用して取得されます 因子。
- 経験的妥当性とは、スコアと基準の関係に関する妥当性です。 基準は、測定値が予測したいものの独立した直接的な測定値です。
- 本質的な妥当性は、証拠を得るための試験技術の使用に関する妥当性です 測定器が実際に何を測定すべきかを測定することをサポートするための定量的かつ客観的 測定されます。
- 予測的妥当性とは、測定器のスコアと将来の人のパフォーマンスとの関係に関する妥当性です。
- コンテンツの妥当性は、母集団の良いサンプリングまたは悪いサンプリングの妥当性です。
- カリキュラムの妥当性は、測定の内容を見て、どれだけ評価することによって決定される妥当性です これまでの測定は、目的に応じて実際にアスペクトを測定する測定ツールです。 教育。
ケネスベイリーによると
- 視覚的妥当性(顔の妥当性)。
は、測定器/研究機器が測定したいものを明らかに測定するという観点から、測定器/研究機器であるかどうかを示す妥当性です。この妥当性は、測定器の形状と外観を指します。 Djamaludin Ancokによると、視覚的妥当性は、正直さ、知性、才能、スキルの測定など、個々の能力を測定する上で非常に重要です。 -
コンテンツの有効性(コンテンツの有効性)。
コンテンツの妥当性は、測定する必要のあるコンテンツ(概念)を測定する機器の能力に関連しています。 これは、測定器が測定対象の概念または変数の内容を明らかにできることを意味します。 たとえば、社会科研究のフィールドテストは、研究分野の内容を明らかにすることができなければならず、動機の測定は モチベーションの概念に関連するすべての側面を測定することができます。
ケネス・ホプキンによれば、コンテンツの妥当性の決定は主に論理的分析プロセスに関連しており、これに基づいて、コンテンツの妥当性は欠けている視覚的妥当性とは異なると主張しています。 体系的な論理分析を使用して、彼はさらに、コンテンツの妥当性を持つ楽器は通常視覚的な妥当性も持っているが、反対の状況は必ずしも有効ではないと述べた。 正しい。
-
基準の妥当性。
すでに有効な他の機器と比較することによる機器の検証であり、 それを相関させることによって信頼性があり、相関が有意である場合、機器は有効性を持っています 基準。 基準の妥当性には、同時妥当性、予測妥当性の2つの形式があります。 同時妥当性とは、現時点で特定の症状を測定し、それを同じ構成の他の測定器と比較する測定器の能力です。
予測の妥当性は、将来何が起こるかを正確に予測する測定器の能力です。 たとえば、入学試験に予測的妥当性があるかどうかは、有意な相関関係があるという事実によって決定されます。 入学試験の結果と学生になった後の学習成果には大きな違いがありますが、それは試験に妥当性があることを意味します。 予報
-
妥当性を構築します(妥当性を構築します)。
構成概念は概念のフレームワークであり、構成概念の妥当性は、測定されている概念の理解を測定する際の測定器の能力に関連する妥当性です。 ジャックRによると。 Fraenkelコンストラクトの検証(コンストラクトの有効性の決定)は、 コンテンツの検証や検証を含む多くの手順が含まれるため、他の検証と一緒に 基準。
関連する可能性のある記事も読んでください: 完全なデータマイニング資料
有効性の種類
研究の目的は真実を見つけることです。 この取り組みにおいて、妥当性の問題は非常に重要な側面です。 真実は、かなり有効な手段でのみ得ることができます。 そして、それは研究結果の真実の本質であるため、有効であると言われています。 妥当性は、研究において最も重要な概念と見なされています。 すべての研究において、使用されるツールの有効性は常に疑問視されています。 したがって、有効な機器を作るためには、すべての研究者の注意を引く必要があります。 測定器は、測定器が測定することになっているものを測定する場合に有効であると言われます。 たとえば、はかりを使用してオブジェクトの重量を測定します。 さて、ここに研究に存在するいくつかのタイプの妥当性があります、すなわち:
コンテンツの有効性
このタイプのコンテンツの有効性の目的は、テストされるコンテンツまたは資料が、テストされる人の知識、レッスン、経験、または背景の能力に関連することです。 たとえば、調査対象外の資料をテストする場合、そのテストには内容の妥当性がありません。 たとえば、英語のスキルをテストするためにテストする必要があるのは、構造、文法、語彙、読解、作文、リスニング、さらには会話と発音のテストです。
したがって、コンテンツの妥当性は、調査対象に関連する資料全体から代表的な項目を選択するなど、適切なサンプリングを行うことによって得られます。 コンテンツの妥当性に関して通常直面する困難は、使用されるアイテムの選択が通常主観的である、つまり研究者自身の論理に基づいていることです。 このため、素材全体と代表的なアイテムの選択との互換性が必要です。
予測的妥当性
このタイプの妥当性の目的は、人の行動に関する予測と実際の行動との間に一致があることです。 テストは高い予測値を持つことが期待されます。つまり、テストが人の行動について予測することは、その人によって行われることが実際に証明されていることを意味します。
研究者によって作成された測定ツールは、多くの場合、将来何が起こるかを予測することを目的としています。 社会調査では、研究者が将来何が起こるかを予測しようとすることがよくあります。
妥当性を構築する
人の性格など、人間の行動には直接表れない特徴があります。 性格はさまざまな要素で構成されており、性格検査では、実際に測定している側面を知りたいと考えています。 因子分析と呼ばれる統計的手法を使用すると、性格のさまざまな要素を調査できます。 そのコンポーネントに基づいてテストを構成できるように、そのようなテストには妥当性があると言えます。 構築します。
構成概念の妥当性は、テストされている症状に実際に1つの次元しか含まれていないかどうかを確認するときに使用されます。 症状に複数の次元が含まれていることが判明した場合、テストの有効性は疑わしいです。 この構成概念の妥当性の利点は、テストによって測定される態度または特性のコンポーネントを知っていることです。
外部妥当性
社会調査の世界では、社会現象を測定するために研究者によって作成された測定ツールがかなりあり、これらの測定装置はすでに有効性を持っています。 外部妥当性は、新しい測定器を、すでに有効な測定器の形で外部ベンチマークと相関させることによって得られる一種の妥当性です。
たとえば、人口の質を測定するために、平均余命と乳児死亡率を相関させることができます。 2つの数値が有意に相関している場合、両方のタイプの測定には外部の妥当性があります。
文化的妥当性
民族グループが大きく異なる国で行われる研究にとって、文化的妥当性、またはむしろ異文化的妥当性は非常に重要です。 さらに、同じ測定器を使用して複数の国で同時に行われる研究も、文化的妥当性の問題に直面します。 ある国での研究にすでに有効な測定器は、異なる文化を持つ別の国で使用されている場合、必ずしも有効であるとは限りません。
外観の妥当性
このタイプの有効性は、上記の有効性のタイプとは異なります。 視覚的妥当性は、測定器が測定したいものを測定するかどうかを示すのではなく、外観の観点から、測定器が測定したいものを測定しているように見えることを示しているだけです。
この妥当性は、知性、才能、スキルの測定など、個々の能力を測定する上で非常に重要です。 これは、能力の側面を測定する際に、測定器の視覚的要因が、測定器の質問または質問に答えることへの人々の関心の程度を決定するためです。
関連する可能性のある記事も読んでください: 定性的調査方法
有効性の概要の形式
大まかに言えば、妥当性には論理的妥当性と経験的妥当性の2種類があります。
論理的妥当性
論理的妥当性という用語には、論理という言葉から派生した論理的な言葉が含まれています。これは、推論を意味します。 この意味で、評価機器の論理的妥当性とは、推論の結果に基づいて有効な要件を満たす機器の条件を指します。 問題の機器が既存の理論と規定に従って適切に設計されているため、有効な条件が満たされていると見なされます。 エッセイを書くなどの他のタスクと同様に、作者が執筆のルールに従っている場合、論理的にはエッセイは良いでしょう。
この説明に基づいて、機器準備の理論に基づいてコンパイルされた機器は論理的に有効です。 この説明から、既存の規定に従って計測器を配置すれば、論理的な妥当性を実現できることがわかります。 したがって、論理的妥当性は条件についてテストする必要はありませんが、機器がコンパイルされた直後に取得できると結論付けることができます。
計測器で実現できる論理的妥当性には、コンテンツ妥当性と構成概念妥当性の2種類があります。
-
コンテンツの有効性
テストは、与えられたレッスンの内容または内容と並行する特定の目的を測定する場合、内容の妥当性があると言われます。 教えられた資料はカリキュラムに記載されているため、コンテンツの妥当性はカリキュラムの妥当性とも呼ばれます。 コンテンツの妥当性は、カリキュラム資料や教科書資料を詳述することにより、準備の時点から達成できます。 テストの内容の妥当性を得るために資料を詳細に説明する方法については、テストの構造を説明するときにさらに詳しく説明します。 -
建設の妥当性
テストを構成する項目が、特定の教育目的で述べられているように思考のあらゆる側面を測定する場合、テストは構築の妥当性があると言われます。 言い換えれば、思考の側面を測定する項目が、指導目標である思考の側面と一致している場合。
経験的妥当性
経験的妥当性という用語には、経験を意味する経験的という言葉が含まれています。 計測器は、経験からテストされた場合、経験的に妥当であると言えます。 日常の例として、経験上、その人が正直であることが証明できれば、その人はコミュニティによって正直であると認識されます。 これらの説明と例から、経験的妥当性は 論理的妥当性などの規定に基づいて機器をコンパイルしますが、 経験。
経験的妥当性には2種類あります。つまり、計測器が有効であることをテストするために実行できる2つの方法があります。 テストは、問題の機器の状態を基準または測定値と比較することによって実行されます。 機器の状態の比較として使用される2つの基準があります。つまり、すでに利用可能な基準と、まだ存在していないが将来発生する基準(予測)です。
-
有効性「現在存在する」(同時有効性)
この妥当性は、より広く経験的妥当性として知られています。 結果が経験に基づいている場合、テストは経験的妥当性があると言われます。 もちろん、「適切」という用語がある場合、ペアになっているものが2つあります。 この場合、テスト結果は経験結果とペアになります。 経験は常に過去のものであるため、経験データはすでに存在します(現在、同時)。
テストの結果を比較するには、基準または比較ツールが必要です。 次に、テスト結果を比較する必要があります。 わかりやすくするために、例を以下に示します。 たとえば、教師は、コンパイルされた合計テストが有効かどうかを知りたいと考えています。 そのためには、現在どのデータが所有されているかという過去の基準が必要です。 たとえば、毎日のテストスコアや過去の合計テストスコアなどです。
-
予測的妥当性
予測とは、今起こっていないことが起こることを常に予測することによって予測することを意味します。 テストには、将来何が起こるかを予測する能力がある場合、予測妥当性または予測妥当性があると言われます。 たとえば、大学入試は、将来の大学進学における受験者の成功を予測できると推定される試験です。 候補者のテストスコアが高い場合、それは確かに将来の彼の成功を保証します。
一方、スコアが低い場合は失敗したと言われ、今後の講義に出席できない見込みです。 比較ツールとして、予測の妥当性は、受験者が大学でレッスンを受けた後に得られた値です。 と比較して、より高いテストスコアを持っている人が1学期の試験に不合格であることが判明した場合 以前のテストスコアが低いため、問題の入試には妥当性がありません 予測。
関連する可能性のある記事も読んでください: 複合研究手法
妥当性測定の概念ペングラン
妥当性の測定は、実際に実行されて、(定量的な意味で)どのくらいの大きさであるかを調べます。 測定器のスコアで表される、人に含まれる心理的側面 心配している。 社会科学の測定に関しては、理想的な妥当性を達成するのは簡単ではありません。 心理的および社会的側面の測定には、より多くのエラーの原因が含まれています(エラー)物理的側面を測定するのではなく。 経験的に直接証明することはできないため、本質的な妥当性が満たされていることを確信することはできません。
測定器の有効性の概念は、すべての測定目的に適用されるわけではありません。 測定器は、1つの特定の測定目的に対してのみ有効な測定値を生成します。 さまざまな測定目的で有効な測定値を生成できる測定器はありません。 したがって、「この測定器は有効です」などの記述は、その目的を示す情報、つまり何に対して有効で誰に対して有効であるかを示す情報が続かない場合は完全ではありません。 それが、クロンバック(Azwar 1986)が、検証プロセスでは実際には目的としないことを強調したことです。 測定器を検証しますが、手順によって得られたデータの解釈を検証します 確かに。
関連する可能性のある記事も読んでください: 定量的調査方法
アイテムの有効性またはアイテムの有効性
たとえば、教師または研究者がテスト項目の有効性が低すぎるまたは低すぎることを知っている場合、次のステップは次のとおりです。 妥当性があるので、どのテスト項目が全体的な質問を悪くするのか知りたい 低。 このため、アイテムの有効性を探す必要があります。
一般に、アイテムの有効性は、アイテムが合計スコアを大きくサポートしている場合に有効であると言われることです。 それを引き起こすアイテムのスコアは高くても低くてもかまいません。 言い換えれば、アイテムのスコアが合計スコアと類似している場合、アイテムは高い妥当性を持っているとここで言うことができます。
客観的な形式の質問の場合、通常の項目のスコアは1(正解の項目)と0(正解の項目)で与えられます。 間違って答えた)、次の合計スコアは質問を構成するすべての項目のスコアの合計です それ。
関連する可能性のある記事も読んでください: 形式知–定義、要因、レベル、方法、測定、基本、専門家
妥当性を決定する際の基準としてのテスト式
標準化されたテストは、その良さを保証できるように何度も試行されたテストです。 標準化されたテストには通常、試行された回数と場所、有効性の係数、信頼性、難易度、識別力などのアイデンティティがあります。
標準化されたテストを基準として質問の妥当性を判断する方法は、標準化されたテストの妥当性係数によって得られた妥当性係数を乗算することによって行われます。
式 製品の瞬間 大まかな数字で:
式 製品の瞬間 偏差あり:
相関係数は常に-1.00から+1.00の間です。 ただし、数値を四捨五入して計算することが多いため、1.00以上の係数が得られる可能性があります。 負の係数は逆の関係を示し、係数は平行線の存在を示し、相関係数の大きさを次のように解釈します。
- 0.88から1.00の間:非常に高い
- 0.600〜0.800:高
- 0.400から0.600の間:十分
- 0.200〜0.400:低
- 0.00から0.200の間:非常に低い
因子の妥当性
質問全体の妥当性とアイテムまたはアイテムの妥当性に加えて、その妥当性について知る必要がある何か、すなわち、資料全体の要因または部分があります。 主題全体のそれぞれは、主要なポイント、または単一のユニットである主題のグループで構成されています。
例:
教師は、音、光、電気の3つの科目の生徒の習熟度を評価します。 そのために、先生は30の質問をします。音は8つ、光は12つ、電気は10つです。
教師が要因の妥当性を知りたい場合、この質問には3つの要因があります。 アイテムの有効性の概念と同様に、因子の有効性の概念は次のとおりです。アイテムの質問 全体として質問を大いに支持している場合、その要素は有効であると言われます。 これらの要素項目がすべての質問を強力にサポートしていることを示すものとして、 つまり、これらの要素項目の合計スコアがスコアとの整合性を示している場合 合計。
スコアと合計スコアの整合性を示すアイテムは有効であると言われます。 並列処理を知る方法も相関式で使用されます 製品の瞬間.
参考文献
- アリクント、スハリニ。 2005. 教育評価の基礎. ジャカルタ:地球リテラシー。
- スディホノ、アナス。 1996. 教育評価入門. ジャカルタ:PTラジャグラフィンドペルサダ。
- トーハ、M。 ハビブ。 2003. 教育評価手法. ジャカルタ:PTラジャグラフィンドペルサダ。