データの見える化

調査研究に適した統計的仮説検定を選ぶ際の7つの重要項目

実験などから得られたデータの統計処理を行う場合、どの統計手法を用いればよいのか、この方法でよいのか分からないということも多いと思います。統計的仮説検定の選択を誤ると、研究結果への信頼性に疑問を持たれたり、論文が不採用にされたりすることになりかねません。この記事では、母集団の分布の型(パラメトリック/ノンパラメトリック)の違いから、統計的仮説検定の手法を選択するために重要な項目について解説します。 統計的仮説検定とは 統計検定(hypothesis testing)、あるいは統計的仮説検定(statistical hypothesis testing)とは、ある仮説が正しいのか否かを統計学的に検証する方法です。2つのデータセットが互いに有意に異なるかどうかを数学的に検定するもので、母集団分布の母数に関する仮説を標本から得た情報(データ)に基づいて統計学的な方法で検証し、対象となる変数の母集団に関する条件になんらかの差があるといえるかどうかについて確率論的な分析を行うものです。統計的仮説検定では、平均、標準偏差、変動係数などいくつかの統計的尺度を用いて計算し、それらをあらかじめ決められた基準のセットと比較します。もしデータが基準を満たせば、2つのデータセット間に有意差があると結論づけることができます。 分析するデータの種類によって、使用できる統計的仮説検定は異なりますが、一般的な手法としては、t検定、カイ二乗検定、分散分析(ANOVA)などが挙げられます。 統計的仮説検定の種類 統計的仮説検定にはいくつかの手法があり、解析の種類 や母集団の分布などに適した手法を選択する必要があります。最初に母集団のデータ分布を事前に仮定している(パラメトリック検定)か、仮定していない(ノンパラメトリック検定)かを大別して、解析の種類を狭めていきます。 1.パラメトリック検定 パラメトリック検定とは、データの母集団が何らかの分布に従っていると仮定している場合に用いられる検定手法です。分布を決める際の重要な要素(パラメータ)を持っており、事前にデータの分布が仮定できるものに用いられます。特定の分布に従っていると想定できる観測値(データ)に対して実施することで、データの分布が想定したモデルと一致しているか否かを主張する際の定量的な根拠となります。一般的なパラメトリック検定としては、回帰分析、比較分析、相関分析が挙げられます。 1.1.回帰分析 回帰分析とは、データにおける関係性や影響力を調べる統計的な手法で、主に原因と結果の関係を推測する際に利用されます。回帰分析には、単回帰分析と、その応用ともいえる重回帰分析、さらにロジスティック回帰分析があります。 単回帰分析は、従属変数と独立変数の間の関係を直線で示すもので、2つの量的変数の関係、つまり目的の変数に対して説明の変数がどのように影響を与えているかを示す式(回帰式)を導き出されます。…

データ利用可能性ステートメント(DAS)の重要性

公開された研究論文の根拠となっているデータの公開は、学術研究にとって不可欠なのか?そもそも、データは公開されるべきなのか?論文のオンライン化が広がるにつれ、研究データのオープン化に関する議論も活発化しています。知識の共有を促進することにより新たな知見を生み出し、科学の発展に大いに寄与することができる――との考え方を背景に、学術界でもデータ共有と利用促進が進められており、Data Availability Statement(データ利用可能性ステートメント、以下DAS)が注目されています。今回は、このDASについてご紹介します。 データ利用可能性ステートメント(DAS)とは DASとは 公開された研究論文のオリジナルデータを著者以外がどのように入手および利用可能かを示すものです。ここでいうオリジナルデータには、生データや加工データも含まれ、また状況に応じてデータへのリンク情報や引用情報(識別番号など)も対象となります。 なぜ論文中にDASを記載する必要があるのか 著者がDASを論文中に記載することで、研究に使用したデータセットを著者以外も効率的に再利用・再分析することが可能になり、研究の再現性が高まり、ひいては研究分野の更なる発展へとつながっていくことが期待できます。 DASの掲載箇所 DASの掲載箇所は学術雑誌(ジャーナル)の書式にもよりますが、たいていは参考文献の前に記載されることが多いようです。 DAS情報の形式 著者にはデータの登録を促進し、利用者には再利用しやすいよう、DASによる情報公開はFAIR原則と呼ばれるデータ共有の基準に従って行われます。FAIRとは、Finable(見つけられる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる)の頭文字を取ったもので、データ公開の実施方法を示しています。基本的に、研究データは誰もが簡単にダウンロードして再利用・再分析しやすいように管理・共有されていることが求められており、DASは以下のような形式で表すことができます。 ・要請に応じてデータを提供する 倫理的な理由から、公開に適さないデータは、要請に応じてのみ利用可能とすることができます。例えば、被験者から入手した情報をすべて開示することができなくても、病院などの第三者から入手した情報によっては開示できるものもあるような場合、情報提供が可能な人について情報開示が制限される理由と詳細を明記する必要があります。 ・データを補足文書や論文中に記載する データを補足文書あるいは論文中に記載します。ジャーナルでは、補足文書にデータをまとめるのが一般的です。 ・データを公開リポジトリに登録する…

論文をわかりやすくする 画像作成 の10のポイント

学術研究論文に画像や図表を掲載することは、研究成果を簡潔かつ視覚的な方法で伝えるためにたいへん有用です。ほとんどの学術ジャーナルは、画像や図表の掲載方法について投稿規定内で指定しています。論文を作成する際には、その指示に従う必要があります。 例えば、画像や図表を挿入するときには、本文中で必ずその図表を言及しておく必要があります。そのために図表に番号を付けておくのですが、この番号も論文全体の通し番号にするか、章ごとにするか、統一しておかなければなりません。また、自分で作成した図表とは別に、必要に応じて他の文献から図表を引用する場合には、その出典情報(論文名、著者名、出版年、掲載されているページなど)を記載しておかなければなりません。最近の論文ではデジタル画像を挿入することも増えていますが、画像の解像度やファイル形式などにも注意が必要です。 このように、論文に掲載する画像や図表を準備するには細かいルールがあり、かつ研究内容をわかりやすく伝えるためにはコツが必要です。論文に掲載する画像を作る時に覚えておくべき重要なポイントをご紹介しましょう。 6について補足を。時間をかけて作成した画像をいざ印刷してみたら「あれ?」となってしまったことはありませんか。画面で見るのと紙面で見るのとでは印象が異なるはずです。図の大きさや配置、解像度、画素数など細かいところに注意しないと、期待するような効果が得られないことになってしまいます。最近はオンラインで読める学術ジャーナルが増えていますので、画像をよりきれいに作ることが求められつつあります。 各ジャーナルによって画像に関する投稿規定は多少異なりますが、共通する主な項目を記します。 ・サイズ:幅の指定 ・解像度:写真などの画像は300dpi以上だが、模式図などや文字を含む場合の解像度は異なる場合があるので規定を確認すること ・色:RGB形式、または、CMYK形式 ・文字(フォント):キャプションやタイトルに付ける文字のフォントやサイズ ・ファイル形式:TIFF、PDF、EPSなど デジタル画像の処理が簡単にできるようになったことで、画像に関する不正なども取りざたされるようになりました。必要な修正を加える場合でも、誇張やごまかし、実験結果の理解に誤解を与えるような作為的な編集を行うことは許されません。不適切に処理された画像によって実験結果や結論に誤った印象を与えることは、避けるべきです。 図表はどのような形であれ、わかりやすく、確実に正しいメッセージを伝えるように作成しましょう。

第16回 “魅”せるプレゼンテーション – チェックリスト!

より多くの人に伝わりやすく・わかりやすい、色覚バリアフリーなスライドを作るために覚えておきたい「CUD: カラーユニバーサルデザイン」について迫る連載シリーズ。第16回目の今回は、これまでにご紹介した色覚バリアフリーの資料作りのポイントを一挙ご紹介します。 ここでは、CUDOによる「CUDチェックリスト」から、学術発表に関係する項目をピックアップします。本連載で取り上げていない内容もありますので、 色覚バリアフリー の発表資料を作成するための参考資料として役立ててください。 色の選び方 ・赤は濃い赤を使わず、朱色やオレンジを使う ・黄色と黄緑は色弱者には同じ色に見えるので、なるべく黄色を使い、黄緑は使わない ・濃い緑は赤や茶色と間違えられるので、青みの強い緑を使う ・青に近い紫は青と区別できないので、赤紫を使う ・細い線や小さい字には、黄色や水色を使わない ・明るい黄色は白内障では白と混同するので使わない ・白黒でコピーしても内容を識別できるか確認する 色の組み合わせ方 ・暖色系と寒色系、明るい色と暗い色、を対比させる…

第11回 デジタル画像 作成時のひと工夫

国際学会でのプレゼンを成功させるには、聞き手を引きこむ英語スピーチに加え、見やすいスライド作りも重要な鍵となります。より多くの人に伝わりやすく・わかりやすい色覚 バリアフリー なスライドを作るために覚えておきたい「カラー ユニバーサル デザイン」について迫る連載シリーズです。 学術発表におけるデジタルカラー画像の使用頻度が高まっています。第11回の今回は、医学生物学領域で使用頻度の高い蛍光多重染色画像を例にとり、多くの色覚型に伝わりやすい“ほんの一工夫”を紹介します。 単色画像はグレースケールで 今日、蛍光顕微鏡や共焦点レーザー顕微鏡の画像はデジタルカメラで撮影して、パソコン上で疑似カラーを用いて表現します。単色の画像を黒バックに赤や緑や青で提示しているものが多くありますが、この場合、色には意味がありません。むしろデメリットの方が多くなります。特にP型の人には黒い背景に赤い色は見にくく、一般型の人にとっても黒い背景に青色などは見にくいものです。 また、ポスターや論文などの印刷物においてカラー画像は不鮮明になる欠点があります。特に緑色はトラブルが多いと言われます。これは、顕微鏡で取得された画像がRGB 形式であるのに対し、印刷は一般的にCMYK方式であるため、変換により階調が飛んでしまうためです。白黒画像であれば、細かいシグナル強度の差も鮮明に表現でき、印刷時のトラブルが少なくなります。単色画像はぜひ白黒のグレースケールで提示しましょう。 2重染色画像では「赤―緑」を「マゼンタ―緑」に 蛍光2重染色では、黒い背景に「赤」と「緑」で表現し、赤と緑が共存する部分が「黄色」で表現されるのが一般的です。ところが、この色の組み合わせは、P型、D型の人には非常に見づらいものです。P型色覚の見え方をシミュレーションしたものが図11-1下段の一番左の画像です。赤が暗く、緑と黄色が見分けにくいことがわかります。 そこで、岡部正隆氏(東京慈恵会医科大学解剖学講座)は、P型、D型のみならず一般型のC型の人も含め、ほぼすべての人に理解できる蛍光二重染色画像の提示方法として、赤のシグナルをマゼンタ(赤と青を1対1で混ぜた赤紫色)に変更することを提唱しています。こうすれば、もともと赤かった部分は青寄りに見え、マゼンタと緑が共存する部分は「白色」で表現されるため、3つの色が明確に区別できます(図11-1下段の一番右の画像)。 Photoshop上で赤チャンネルの絵を青チャンネルにコピーするだけ! では、「赤―緑」から「マゼンタ―緑」への変更はどのようにすればよいのでしょうか。多くの顕微鏡では疑似カラーとしてマゼンタを選択できますので、それを活用するのが最も簡単ですが、すでに撮影した赤緑画像についても、RGBモードの画像であればPhotoshopで簡単に変更できます。…

第10回 プレゼンに有効な色の組み合わせを知ろう

国際学会でのプレゼンを成功させるには、聞き手を引きこむ英語スピーチに加え、見やすいスライド作りも重要な鍵となります。より多くの人に伝わりやすく・わかりやすい色覚 バリアフリー なスライドを作るために覚えておきたい「カラー ユニバーサル デザイン」について迫る連載シリーズです。 12色や24色のクレヨンや色鉛筆のセットのように、CUD(カラーユニバーサルデザイン)に配慮した色のセットがあれば・・・そのような要望に応えて、CUD推奨配色セットができました。印刷業界や塗装業界では、導入に向けてすでに動き始めています。 多くの色覚型に対応 色弱の人にも見やすいオレンジ色寄りの赤色はRGB3原色の表現で(R:255, G:40, B:0)の色であると第7回で紹介しました。色の見え方や感じ方には個人差があるため、このような明確な指定はとても便利です。そこで、CUDO (カラーユニバーサルデザイン機構)では、赤色のみならず全部で20色(代替色を含めて22色)の「CUD推奨配色セット」を公開しています。 CUD推奨配色セット http://www.cudo.jp/resource/CUD_colorset 伊藤啓氏(東京大学分子生物学研究所)によるCUD配色セットの詳細 http://jfly.iam.u-tokyo.ac.jp/colorset/…