研究におけるデータ解析とは?
データ分析における研究の定義 によると
ルコント
と
シェンサル
研究データ分析とは、研究者がデータをストーリーに落とし込み、それを解釈してインサイトを導き出すためのプロセスである。 データ分析プロセスは、大きなデータの塊を、意味のある小さな断片に減らすのに役立ちます。
データ分析のプロセスでは、3つの重要なことが行われます。1つ目はデータの整理です。 Sを実現するために、ummarizationとcategorizationを組み合わせています。 データ圧縮に使用される2番目の既知の方法です。 データからパターンやテーマを見つけ出し、簡単に識別・リンクするのに役立ちます。 3つ目の方法はデータ分析で、研究者はトップダウンとボトムアップの両方の方法で分析を行います。
一方、MarshallとRossmanは、以下のように説明しています。
データ分析
は、データ分析とは、面倒で曖昧で時間がかかるが、収集した大量のデータに秩序と構造と意味を持たせる創造的で魅力的なプロセスであると述べている。
“データ解析とデータ解釈は、研究とデータ解析に演繹的論理と帰納的論理を適用したことを表すプロセスである “と言えるでしょう。
研究においてなぜデータを分析するのか?
研究者は、語るべきストーリーや解決すべき問題があるため、データに大きく依存します。 疑問から始まり、その答えに他ならないのがデータです。 しかし、質問することがない場合はどうでしょうか。 まあ! 問題がなくても、データを探索することは可能です。
データマイニング」。
は、しばしばデータの中に探索する価値のある興味深いパターンを発見します。
研究者は、データの種類に関係なく、研究者の使命や視聴者のビジョンから、伝えたいストーリーを形成するためのパターンを見出すことができるのです。 データ分析において研究者に求められることのひとつは、予期せぬパターンや表現、結果に対してオープンであり、偏見を持たないことです。 データ分析は、時に、データ分析を開始した時点では予想もしなかったような、エキサイティングなストーリーを語ってくれることがあることを忘れないでください。 ですから、手元にあるデータを頼りに、探索的研究の 旅を楽しんでください。
研究データの種類
あらゆる種類のデータは、特定の値を付与した上で物事を記述するという稀有な性質を持っている。 分析のためには、これらの値を加工し、与えられた文脈の中で提示することで、有用なものとして整理する必要があります。 データにはさまざまな形態がありますが、ここでは主なデータの種類を紹介します。
- 定性的なデータ。 提示されたデータに言葉や説明がある場合、それを質的データと呼ぶ。
質的データ
. このデータを観察することはできても、研究でのデータ分析、特に比較は主観的で難しくなります。 例 品質データとは、味、経験、質感、あるいは意見などを記述したものすべてが品質データとみなされることを表しています。 この種のデータは通常、フォーカスグループ、個人的な定性インタビュー、またはアンケート調査での自由形式の質問を使って収集されます。 - 定量的なデータ。 数値で表現されたデータを「定量データ」と呼ぶ。
定量的データ
. この種のデータは、カテゴリーに区別され、グループ化され、測定され、計算され、ランク付けされることがある。 例 年齢、順位、コスト、身長、体重、得点など、すべてがこのタイプのデータに含まれる。 このようなデータをグラフやチャートで表示したり、統計解析の手法を適用したりすることができます。 調査における(Outcomes Measurement Systems)OMSのアンケートは、数値データを収集するための重要なソースである。 - カテゴリカルデータ。 データである をグループに分けて発表しました。 ただし、カテゴリデータに含まれる項目は、複数のグループに属することはできない。 例 アンケートに回答した人が、自分の生活スタイル、配偶者の有無、喫煙習慣、飲酒習慣などを伝えると、カテゴリーデータに該当します。 このデータの分析には、カイ二乗検定が標準的な方法として用いられている。
定性調査におけるデータ分析
データ分析や質的データ調査は、質的データが言葉、説明、画像、物、時には記号で構成されているため、数値的データとは少し異なる働きをします。 このような複雑な情報から洞察を得るのは、複雑なプロセスです。 したがって、一般的に探索的な研究やデータ分析に使用されます。
定性データからパターンを見出す
テキスト情報のパターンを見つける方法はいくつかあるが、単語ベースの方法は、研究やデータ分析に最も信頼され、広く使われている世界的な手法である。 注目すべきは、質的研究におけるデータ分析プロセスがマニュアル化されていることです。 ここでは、研究者は通常、利用可能なデータを読み、繰り返し使用される言葉やよく使われる言葉を見つける。
例えば
例えば、アフリカの国々で収集したデータをもとに、人々が直面する最も緊急な問題を理解しようとしたとき
“食”
と
“hunger”(飢餓
という単語が最もよく使われていることに気づき、さらに分析するためにハイライトすることがあります。
キーワードコンテキストも、広く使われている単語ベースの手法の一つである。 この方法では、研究者は、参加者が特定のキーワードを使用する際の文脈を分析することによって、コンセプトを理解しようとするものである。
例えば例えば、「糖尿病」という概念を研究するために調査やデータ分析を行っている研究者は
糖尿病
を研究する研究者は、回答者がいつ、どのように「糖尿病」という言葉を使ったか、言及したかという文脈を分析することができるかもしれません。
精査に基づく手法もまた、質の高いデータパターンを特定するために非常に推奨される手法の一つです。
テキスト分析
質の高いデータパターンを特定するために使用される手法の一つです。比較対照は、特定のテキストが互いにどのように似ているか、または異なっているかを区別するために、この手法の下で広く使用されている方法です。
例えば、こんな感じです。 企業における研修医の重要性」を知るために、収集したデータを「研修医を雇う必要がある」と考える人と「不要」と考える人に分けました。 比較対照は、単一回答の質問タイプを持つ世論調査を分析するために使用することができる最良の方法です。
メタファーは、データの山を減らし、そこにパターンを見出すことで、データと理論の結びつきを容易にするために用いることができる。
変数分割は、研究者が膨大なデータからより一貫した記述や説明を見出すために、変数を分割するために使われるもう一つの手法である。
質的研究においてデータ分析に用いられる方法
質的調査でデータを分析する手法はいくつかありますが、ここではよく使われる手法を紹介します。
- コンテンツ分析。 これは広く受け入れられており、研究方法論におけるデータ分析の手法として最も頻繁に採用されている。 テキストや画像、時には物理的なものから文書化された情報を解析するために使用することができます。 に依存します。
リサーチクエスチョン
を設定し、いつ、どこで、この方法を使うかを予測します。 - ナラティブ・アナリシス(Narrative Analysis)。 この方法は、個人的なインタビュー、フィールド観察、など様々なソースから収集した内容を分析するために使用されます。
サーベイ
.
回、物語、あるいは人々が共有する意見の大半は、リサーチクエスチョンに対する答えを見つけることに焦点が当てられている。 - 談話分析。 物語分析と同様に、人とのやり取りを分析するために、談話分析が用いられます。 しかし、この特殊な方法では、研究者と回答者の間のコミュニケーションがどのような社会的背景の下で行われるのか、あるいはその中で行われるのかが考慮されます。 さらに、談話分析では、ライフスタイルや日常的な環境にも着目しながら、結論を導き出していきます。
- グラウンデッド・セオリー ある現象がなぜ起こったのかを説明したいとき、質の高いデータを分析するためにグラウンデッド・セオリーを使うのは最良の手段です。 グラウンデッド・セオリーは、異なる環境で発生する類似事例のホストに関するデータを研究するために適用されます。 研究者はこの方法で、ある結論に達するまで、説明を変えたり、新しい説明を作り出したりすることがあります。
定量研究におけるデータ分析
解析用データの準備
調査やデータ分析の最初の段階は、分析用に作るので、名目データ
名目データ
は、意味のあるものに変換することができます。 データ作成は以下のフェーズで構成されます。
第一段階データバリデーション
データバリデーションは、収集されたデータサンプルが事前に設定された基準に従っているか、または偏ったデータサンプルであるかを理解するために行われ、4つの段階に分けられます。
- 不正行為 実際の人間が調査やアンケートの各回答を記録していることを確認するため
- スクリーニング(Screening)。 参加者または回答者が、研究基準に準拠して選択されていることを確認すること。
- 手順 データサンプルの収集中に倫理的基準が維持されたことを確認するため
- 完成度の高さ。 オンライン調査において、回答者がすべての質問に回答したことを確認するため。 エルゼ インタビュアーが、質問票の中で考案したすべての質問をしたとき。
フェーズII:データ編集
多くの場合、広範な調査データのサンプルには誤りが含まれています。 回答者は、いくつかの項目を誤って記入したり、誤って省略したりすることがあります。 データ編集は、提供されたデータにそのような誤りがないことを確認する作業である。 必要なチェックや異常値チェックを行い、生編集を行い、分析できる状態にする必要がある。
フェーズ III: データコーディング
この3つのうち、データ準備の最も重要な段階は、アンケートの回答をグループ分けし、値を割り当てることです。 1000人規模の調査であれば、調査員は回答者を年齢で区別するために年齢層を設定することになります。 そのため、膨大なデータの山を処理するよりも、小さなデータバケットを分析することが容易になります。
定量研究におけるデータ解析の方法
研究者は、データを分析するために準備した後、意味のある洞察を導き出すために、さまざまな調査やデータ分析の方法を用いることができます。 確かに、数値データの解析には統計的手法が最も好まれる。 この方式もまた、2つのグループに分類される。 最初に 「記述統計量 は、データを記述するために使用されます。 2番目。 データを比較するのに役立つ「推測統計学」 。
記述統計学
この方法は、研究において汎用性の高いタイプのデータの基本的な特徴を記述するために使用されます。 データのパターンが意味を持ち始めるように、意味のある方法でデータを表示します。 とはいえ、記述的な分析では、結論を出すまでには至らない。 結論は、やはり研究者がこれまでに立てた仮説に基づいている。 ここでは、記述的分析手法の主な種類を紹介します。
周波数の測定
- カウント、パーセンテージ、頻度
- ある事象が発生する頻度を表すのに使われる。
- 研究者は、回答の頻度をアピールしたいときに使う。
中心的傾向の測定法
- 平均値、中央値、最頻値
- この方法は、様々な点による分布の実証に広く用いられている。
- 研究者は、最も一般的または平均的に示される回答を紹介したい場合に、この方法を使用します。
分散やばらつきの尺度
- レンジ、バリアンス、標準偏差
- ここでは、フィールドが高得点/低得点に相当します。
- 分散標準偏差=観測されたスコアと平均値の差
- 間隔を記載してスコアの広がりを確認するために使用される。
- 研究者は、データを広げて見せるためにこの方法を使います。 これは、データがどの程度まで広がっているかを特定するのに役立ち、それが平均に直接影響します。
ポジションの測定
- パーセンタイルランク、クォータイルランク
- 標準化されたスコアに依存するため、研究者は異なるスコア間の関係を特定することができます。
- 研究者がスコアを平均カウントと比較したい場合によく使われる。
定量的な市場調査の場合、記述的な分析で絶対的な数字を出すことが多いのですが、その数字の根拠を示すには分析が十分ではありません。 しかし、調査票の内容や伝えたいストーリーに合わせて、最適な調査・データ分析の方法を考える必要があります。 例えば、学校における生徒の平均点を示すには、平均値が最適である。 研究者が調査や結果を提供されたものに限定するつもりなら、記述統計に頼るのがよいでしょう。 試料 一般化することなく 例えば、2つの異なる都市で行われた平均的な投票を比較したい場合、差分統計で十分である。
記述的分析は、単一の変数を分析するために一般的に使用されるため、「単変量解析」とも呼ばれます。
推論統計学
推論統計は、代表的な母集団の収集したサンプルを調査・データ分析した後、より大きな母集団について予測を立てるために使用されます。 例えば、映画館で奇数100人の観客に、今見ている映画が好きかどうかを尋ねることができます。研究者は、集めたデータを推論統計学で分析し、約80-90%の人が映画を好きだと推論します。
サンプル
て、約80-90%の人がその映画を好きだと推論する。
ここでは、推測統計の重要な2つの分野を紹介します。
パラメータを推定する。
サンプル調査データから統計を取り、母集団のパラメータについて何かを示すものです。
仮説の検証
Iの答えを出すために、調査データをサンプリングすることです。
調査研究
の質問をします。 例えば、最近発売された口紅の色合いが良いかどうか、マルチビタミンのカプセルは子供のゲームの成績を上げるのに役立つかどうかなど、研究者の関心は様々です。
これらは、高度な
解析手法です。
は、単一の変数を説明する代わりに、異なる変数間の関係を示すために使用されます。 研究者が変数間の関係を理解するために、絶対的な数字以上のものを求める場合によく使われる。
ここでは、研究でよく使われるデータ解析の方法を紹介します。
- クロス集計のこと。 分割表とも呼ばれる。
クロス集計
は、複数の変数間の関係を分析するために使用される。 年齢と性別が行と列で表示されているデータがあるとします。 二次元クロス集計は、各年齢区分の男性・女性の人数を示すことで、シームレスなデータ分析・調査に役立てることができます。
- 回帰分析。 2つの変数の間の強い関係を理解するために、研究者は主要かつ一般的に使用される回帰分析法を超えて見ていない、これはまた、使用される予測分析の一種である。 この方法では、従属変数と呼ばれる本質的な因子が存在します。 また、回帰分析では、複数の独立変数がありますね。 独立変数が従属変数に与える影響を調べる努力をするのです。 独立変数と従属変数の値は、誤差のないランダムな方法で測定されたものと仮定しています。
- 度数表。 実験において、2つ以上がどの程度異なるかを調べるための統計手順である。 かなりのばらつきがあることは、研究結果が有意であることを意味します。 多くの文脈で、ANOVAテストと分散分析は似ています。
- 分散分析。 ある実験において、2つ以上がどの程度異なるかを調べるための統計手順。 かなりのばらつきがあることは、研究結果が有意であることを意味します。 多くの文脈で
ANOVAテスト
と分散分析は似ています。
研究データ分析における留意点
- 研究者は、データを分析し、操作するために必要なスキルを持ち、高い水準の研究実践を行うための訓練を受ける必要があります。 理想的には、研究者は、より良いデータ洞察を得るために、ある統計手法を他の統計手法よりも選択する根拠について、基本的な理解以上のものを持たなければなりません。
- 通常、研究プロジェクトやデータ分析プロジェクトは科学分野によって異なるため、分析の初期段階で統計的なアドバイスを受けることで、調査票の設計、データ収集の選択、分析結果の分析が容易になります。
データ収集
を選択し、サンプルを選択するのに役立ちます。
- データ調査・分析の第一の目的は、偏りのない究極の洞察を導き出すことである。 データ収集、分析手法の選択、対象者の選択において、いかなる間違いや偏った考え方があっても、そのようなことはありません。
聴衆
を選択すると、偏った推論をすることになります。
- 研究データと分析に使用される精巧さとは無関係に、不十分な客観的結果測定を是正するのに十分である。 デザインに問題があっても、意図が明確でなくても構いませんが、明確でないことは読者に誤解を与える可能性がありますので、このような行為は避けてください。
- 研究におけるデータ解析の動機は、正確で信頼性の高いデータを提示することにある。 可能な限り統計的エラーを避け、外れ値、欠損データ、データの改変、データマイニング、グラフ表示の開発など、日常的な課題に対処する方法を見つけること。
日々生成されるデータの膨大さには恐れ入るばかりです。 特に、データ分析が中心になっているときは。 を2018年に発表しました。 昨年のデータ供給量は2兆8,000億ギガバイトに達しています。 したがって、超競争的な世界で生き残ろうとする企業は、複雑な調査データを分析し、実用的な洞察を導き出し、新しい市場のニーズに適応する優れた能力を持たなければならないことは明らかである。
QuestionProは、データ分析・調査において組織を強化し、魅力的なアンケートを作成することでデータを収集する媒体を提供するオンライン・アンケート・プラットフォームです。