AIによる研究不正とデータ操作のリスク
人工知能(AI)の登場は、科学研究を含む広範な分野に革命をもたらしました。 データ分析から予測モデリングまで、AIは様々な形で研究分野に貢献するようになっています。しかし、AIを過度に使用したり使い方を間違えたりすれば、問題を引き起こすとリスクがあるのは否めません。AIは新たな科学的発見の機会を増やすとともに、そのスピードを速め、膨大な量のデータを分析することが可能な反面、科学的な不正行為やデータ操作における懸念につながる恐れもあります。
学術的・科学的不正行為は、知的公正性に対する脅威であり、さらなる研究の進展を妨げるものです。 問題となったデューク大学におけるがん研究不正にしても、幹細胞研究不正にしても、関与した研究者がキャリアを絶たれ、研究活動からの撤退につながりました。このような事件は、学術研究コミュニティの信頼性に疑問を投げかけるだけでなく、科学的公正性(研究インテグリティ)に対する大きな脅威と言えるでしょう。
データ操作と科学的不正行為の影響
不正なデータ操作は、研究の質と科学的信頼性に重大な影響をもたらしかねません。データ操作および科学的不正行為がもたらす影響を以下に挙げます。

科学研究におけるAIの脅威
AIを使用する際には、いくつかの隠れたリスクが伴い、科学的公正性を損なう恐れがあることを認識しておく必要があります。科学研究におけるAIの脅威を、以下に示します。
1. 剽窃・盗用
AIアルゴリズムは、研究論文、学術論文、科学報告書などの文章を生成することができるので、論文の執筆を自動化することはできますが、AIが生成したコンテンツを誤ってそのまま使用してしまうとの懸念があります。しかも、AIアルゴリズムは人間の文体を忠実に模倣した文章を作成することができるため、AIが生成したコンテンツと人間による著作物を区別することが難しくなっています。
2. 誤情報
AIが生成したコンテンツの真偽を確認しないまま使用すると、不正確な情報や誤解を招く情報を広めることに成りかねません。AIが生成するコンテンツが洗練されていると、誤解を招く情報を特定することがより困難になります。また、AIが誤った情報を参照するリスクもあり、情報の出所を追跡し、その真偽を確認することは困難です。
3. 画像の複製と操作
画像生成に特化したAIアルゴリズムは、オリジナル画像と見分けがつかないほどリアルで説得力のある画像を生成することができます。しかも、AIツールやソフトウェアが利用しやすくなったことで、基本的な技術しか持たない人でも容易に画像生成や編集を行うことができるようになりました。
論文執筆の際には、投稿先学術雑誌(ジャーナル)の投稿規程あるいはAI使用に関するガイドラインで注意事項を確認する必要があります。また、不正な画像操作のリスクを回避するためのさまざまな情報を事前に確認しておくことをお勧めします。
4. 結果の改ざん
結果の改ざんは、研究インテグリティ(研究公正)を損ない、研究結果の再現を阻むことになるので、結果として科学の進展を妨げることになります。AIアルゴリズムによって生成された文章は洗練されてきているので、結果の微妙な変化を識別することが困難になってくることも懸念されます。つまり、真の結果と改ざんされた結果を見分けることが難しくなってしまうのです。
5. 共著者としてのAIツールの使用
科学論文におけるAIの関与は、研究インテグリティにもたらす潜在的な脅威への懸念を引き起こしています。AIとの共著は、作業効率や生産性の向上といった利点をもたらす一方で、オーナーシップに関する疑問を投げかけ、倫理的、法的、知的財産的な課題をもたらすこととなっています。
さらに、AIが研究の質と科学的公正性に重大な脅威をもたらすこともあります。科学研究の信頼性を守ることは、知的公正性を守るために必要です。AIは科学研究を発展させる大きな可能性を秘めてはいますが、科学的不正行為やデータ操作の脅威が増していることを認識し、対処していくことが不可欠です。
AIによる科学的不正行為の脅威を軽減する7つの方法
責任を持ってAIを利用し、透明性を促進し、倫理的ガイドラインに準じ、AIに関する教育と認識を培うことによって、AIを科学コミュニティに取り入れることに伴うリスクを軽減することができます。そのための7つの方法を以下に記します。
1. 厳密なデータ管理を行う
研究機関および研究者は、データの収集、保管、アクセスに関する厳密なプロトコルを確立しておく必要があります。その上で研究者は、厳密なデータ収集方法を遵守するとともに、適切な文書化を行うようにします。データ収集方法の透明性は、審査をしやすくすると共に、研究の信頼性と信憑性を高めることになります。よって、研究データの完全性を維持するためには、データの監査と検証を含めた厳密なデータ管理の枠組みを導入することが必要です。
2. 高度な検出ツールを開発する
検出アルゴリズムは剽窃・盗用を検出するのに役立つので、技術者は、AIが生成したテキストを含む多様なデータセットで機械学習モデルに学習させることにより、剽窃検出アルゴリズムを継続的に強化する必要があります。剽窃やAI生成コンテンツの使用といった意図せぬ研究不正を防ぎ、研究インテグリティの順守をサポートするツールやサービスを利用することも一案です。
3. デジタルウォーターマークを活用する
デジタルウォーターマーク(digital watermark)または「電子透かし」とは、デジタルコンテンツに埋め込まれる情報であり、著作権の保護や不正コピーの検出に用いられるものです。AI規制における重要な技術として期待されるこのデジタルウォーターマークを実装し、画像などにメタデータを埋め込むことで、知的財産を保護し、改ざんを防止し、該当コンテンツがどのように利用されているかを追跡するトレーサビリティを向上させることができます。また、デジタルウォーターマークは、コンテンツの真贋の確認にも使用できるので、画像のオリジナル性を検証するのにも利用できます。ウォーターマークには可視的なものと不可視的なものがあり、写真などに可視的なウォーターマークを表示すれば、視覚的に所有権を示すことができます。不可視的なウォーターマークは目視はできず、改ざんの検出やトレーサビリティの強化に使用されます。画像に使われるだけでなく、法的文書や契約書などに埋め込まれていることもあり、多様な用途で利用されています。
4. 透明性とオープンサイエンスを重視する
研究データや方法論、コードを共有するといったオープンサイエンスの履行を重視することは、研究の透明性を促進すると共に、より良い査読を促進することにもつながります。さらに、研究データをオープンにすることは、データ操作の可能性を検出するための独立した検証が可能になります。
5. 模擬査読をしてもらう
査読は、研究の質とインテグリティを評価する上で重要な役割を果たしています。さらに、他の研究者が独自に研究を再現することは、データ操作が行われたかどうかを特定するのに役立ち、研究結果の確実性を高め、データ操作を見逃す可能性を低減することができます。
6. 倫理ガイドラインを策定して監視する
科学コミュニティは、AIの応用に特化した倫理ガイドラインを策定して、施行するべきでしょう。倫理審査委員会や監視委員会は、AI研究プロジェクトの倫理的意味を評価し、コンプライアンスを確保する上で重要な役割を果たすことができます。
7. 教育と啓発を推進する
研究者、学生、専門家は、AIによる科学的不正やデータ操作のリスクに関する知識を習得しておくことが必要です。また、研究インテグリティを重要視する環境を整えることで、データ操作を容認しない文化を醸成することができます。研究者は、非倫理的な行為がどのような結果をもたらすか理解しておかなければなりません。オープンな議論を奨励し、倫理的な行動を促し、研究者が課題に対処するための支援を提供することは、これからの研究者の教育に役立つものとなります。
研究インテグリティを高い水準に保ち、データ操作に効果的に対処することは、研究者、研究機関、科学コミュニティの連帯責任です。正確性と人間の知性とのバランスを取り、AIと人間の研究者の協業を促すことによって、研究に付加価値を与えることも可能です。研究者は、文章を改善したり、データの解釈をしたりするためにAIツールを使うことができます。科学的倫理と行為を損なうことなく、研究成果の妥当性を確保するには、生成AIによる貢献を人間が監視し、批判的に評価することが不可欠です。
科学のためのAI使用は次の段階へ
2024年、AI技術の中核とも言える機械学習・深層学習の基礎を開発した研究者二名がノーベル物理学賞を受賞し、翌日にはAIを活用したタンパク質の構造解析に関する研究を行った研究者三名が化学賞を受賞しました。生成AIが爆発的に広がり、画像や音声認識などのAI技術が日常生活に溶け込んでいるに留まらず、実用的な利用が広がっていることが強く印象付けられた年となったわけです。もはやAIは学術研究にとっても欠かせない技術となっていますが、一部の研究者は次の段階として自律的にノーベル賞レベルの発見ができる「AI科学者」の開発を目指しています。
AI科学者が登場すれば、科学はまさに飛躍的な速度で発展すると予想されます。2024年8月に日本のスタートアップである「Sakana AI」がAIの研究をテーマとした一連の研究プロセス(計画、実行、評価、論文執筆まで)の自動化に成功したと発表しました。実験器具も使わず、コンピューター内部で研究が完結できることを示したのです。
・3月-大規模言語モデル(LLM)を含む複数の基盤モデルの統合を自動化する方法を開発
・6月-LLMを使って、LLMをより効率的にトレーニングする方法を発見
・8月-LLMを用いて「研究開発プロセスそのものを自動化する」という革新的な技術を実現、「AIサイエンティスト(AI Scientist)」と命名
「AIサイエンティスト」は、研究アイデアの作成、コードの記述、実験の実行、結果の要約、さらに論文の執筆まで含めた研究プロセス全体を自動でこなすシステムで、完全とは言いがたいものの、AIが科学研究に欠かせないツールから次の段階に進みつつあることを示しました。結果を改善するための自動査読まで導入しており、人間に近い精度で評価することも可能です。
AIは人間の社会や経済、学術研究にも大きな影響を与えており、科学研究では欠かせないツールとなっています。AIが自律的に研究を実行し論文まで書けるようになっても、ノーベル賞を授与されることはありませんが、AIのサポートによりノーベル賞レベルの研究の発見が次々に現れてくる時代は、すぐそこなのかもしれません。
参考
AI Scientistに関する論文:The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery
AI Scientistが作成したサンプル論文:DUALSCALE DIFFUSION: ADAPTIVE FEATURE BAL
ANCING FOR LOW-DIMENSIONAL GENERATIVE MODELS
関連する質問
こんな記事もどうぞ
エナゴ学術英語アカデミー:学術界・教育界のAI導入への姿勢について考える
エナゴ学術英語アカデミー:学術出版におけるChatGPTなどのジェネレーティブAIツールのリスクと可能性 – 学術英語アカデミー



