コラム

ビッグデータ統計は、中立や客観性を保証せず、しばしば偏りを生む

2021年10月26日(火)16時59分

研究サプライチェーンの問題

AI、統計、計算社会学などで大量のデータを利用する研究は研究サプライチェーンと無縁ではいられない。研究サプライチェーンは、研究者がサプライチェーンを支える人々の意図に沿った行動を取るように誘導し、意図に沿わない場合はサプライを中止する。

AIの研究者自身は純粋にAIを研究しているかもしれないが、資金や施設を提供する側には経済的便益や軍事利用、政治利用などの意図がある。その意図に沿った研究には資金や施設が提供され、そうではないものには提供されない。結果として研究サプライチェーンの意向に沿った研究者だけが残る。ほとんどの人は好きな研究を好きなだけする自己資産を持っているわけではないので、ほとんどの研究分野に研究サプライチェーンの問題は存在する。多くの国や企業がしのぎを削っているビッグデータの分野ではよりわかりやすい形で現れる。

ケイト・クロフォードは、AIの社会的影響を考える際には、AIを支える権力を把握する必要があるとして、AIを構成する原材料、電力、データなどあらゆるものを調査し、それらが差別的に安価なコスト、安価な労働力、人権を侵害する形でのデータ入手、政府の支援(つまり税金)、軍や諜報機関からデータや支援に支えられていることを明らかにしている。安価な電力を提供してもらうために、グーグルなどは多額の資金を費やしてロビイスト活動にいそしんでいる。現在AIを支えている組織が好ましいと感じて支援する研究者のAI研究が進むという研究サプライチェーンの意向に縛られた世界ができている。

程度の差こそあれ、同じ問題は統計や計算社会学にも起こる。世界の多くの国では政権与党や為政者による国内向けのネット世論操作が行われており、SNSはその影響を受けている。また、SNS運営企業は自社の利益確保のためのコンテンツ管理方針とアルゴリズムを持っており、それによってSNSデータは歪められる。研究の原材料であるデータは汚染されているのだ。

特に気になるのは、これらが自覚なく行われている可能性だ。当たり前に自分や周囲と同じ視点や価値観のみでデータを分類・解釈し(たとえば調査対象者などの視点や価値観による異なる分類・解釈には思い至らず)、当たり前に利用している偏りのあるデータを利用し、当たり前に同じ基準で選ばれた研究サプライチェーンを支える側の意向に沿った同僚に囲まれていたりする。

たとえば、顔認識ソフトのテストのベンチマークとされる「Faces in the Wild」というデータセットでは、男性が70%、白人が80%だった(Forbes)。当然、このデータでは白人男性以外の精度を確認することは難しい。与えられたデータや研究チームの構成などの環境を疑いなく受け入れてしまうと研究サプライチェーンの罠に陥る危険がある。

研究者のみなさんには自覚的であってほしいものだが......

本稿の内容について、「そこまで考える必要があるのか?」と感じる方もいると思う。しかし、データと解釈の問題に関してはSNSデータに調整を行ったり、SNSデータを使わない他の方法で代替したり、複数の方法を組み合わせることで問題を回避することが可能だ。それを行わないのは手軽に大量のデータを使えるというSNSデータのメリットが減ってしまうからだ。『Big Crisis Data』(Castillo, Carlos、Big Crisis Data、2016年、Cambridge University Press)では「街灯の下で鍵を探す」という寓話が紹介されている。

寓話はこういう話だ。夜にある男が街灯の下で鍵を探していた。通りすがりの人が手伝ったが、いっこうに見つからない。「どこで鍵を落としたんですか?」と訊ねたところ男は離れた暗がりを指さし、「あそこで落としたのですが、暗くて見えないので明るいここで探しています」と答えた。

SNSなら従来に比べてはるかに容易に大量のデータを利用できるが、万能ではない。「街灯の下で鍵を探す」ことにならないように注意が必要であると同書は戒めている。

SNSデータの活用が広がった時期に刊行された『Twitter A Digital Socioscope』を見ると、ツイッターは世界規模で社会に関する大量の包括的なデータを簡単に入手できる素晴らしいツールであると随所に書かれていて、「街灯の下で鍵を探す」危険性を感じさせる。

この世界で研究活動を行うことは、研究サプライチェーンの最終工程に飛び込むことである。そのことに自覚的であることは研究を中立的、客観的にする助けになる。自分自身がおかれた社会的文脈を理解し、自分と異なる文脈の人々とチームを組み、データの内容を生い立ちから理解していかないと、自覚なしに研究サプライチェーンの意向に沿ったアウトプットを出してしまいやすくなる。

しかし、研究者には自覚的であってほしい、というのは私の願いにすぎないし、正直おすすめできない。AI、統計、計算社会学を研究する方々の多くは、研究サプライチェーンのまっただ中にいる人であり、同じ立場の人々に共有される成果をあげていった方が認められやすいだろう。当たり前と思っていることに疑義を唱えることにはリスクがある。ただ、自覚せずに研究サプライチェーンの罠にはまる人が増えれば増えるほど、社会には「特定の人々」(ケイト・クロフォード風に言うと権力を持った層)に都合のよい大量のデータから得られた「科学的事実」と、それに基づく仕組みが生まれてゆくことになる。私は「特定の人々」ではないので嫌だと思うが、「特定の人々」にとっては好ましいことだろう。本稿が研究サプライチェーンから産み出される成果を受けとる側の人々にとって参考になれば幸いである。

プロフィール

一田和樹

複数のIT企業の経営にたずさわった後、2011年にカナダの永住権を取得しバンクーバーに移住。同時に小説家としてデビュー。リアルに起こり得るサイバー犯罪をテーマにした小説とネット世論操作に関する著作や評論を多数発表している。『原発サイバートラップ』(集英社)『天才ハッカー安部響子と五分間の相棒』(集英社)『フェイクニュース 新しい戦略的戦争兵器』(角川新書)『ウクライナ侵攻と情報戦』(扶桑社新書)など著作多数。X(旧ツイッター)

今、あなたにオススメ
ニュース速報

ビジネス

米4月雇用17.5万人増、予想下回る 賃金伸び鈍化

ワールド

欧州委、中国EV3社に情報提供不十分と警告 反補助

ビジネス

米4月雇用17.5万人増、予想以上に鈍化 失業率3

ビジネス

米雇用なお堅調、景気過熱していないとの確信増す可能
今、あなたにオススメ
MAGAZINE
特集:世界が愛した日本アニメ30
特集:世界が愛した日本アニメ30
2024年4月30日/2024年5月 7日号(4/23発売)

『AKIRA』からジブリ、『鬼滅の刃』まで、日本アニメは今や世界でより消費されている

メールマガジンのご登録はこちらから。
人気ランキング
  • 1

    屋外に集合したロシア兵たちを「狙い撃ち」...HIMARS攻撃「直撃の瞬間」映像をウクライナ側が公開

  • 2

    ロシア兵がウクライナ「ATACMS」ミサイルの直撃を受ける瞬間の映像...クラスター弾炸裂で「逃げ場なし」の恐怖

  • 3

    常圧で、種結晶を使わず、短時間で作りだせる...韓国の研究チームが開発した「第3のダイヤモンド合成法」の意義とは?

  • 4

    サプリ常用は要注意、健康的な睡眠を助ける「就寝前…

  • 5

    ロシア「BUK-M1」が1発も撃てずに吹き飛ぶ瞬間...ミ…

  • 6

    「TSMC創業者」モリス・チャンが、IBM工場の買収を視…

  • 7

    ウクライナ軍ブラッドレー歩兵戦闘車の強力な射撃を…

  • 8

    「500万ドルの最新鋭レーダー」を爆破...劇的瞬間を…

  • 9

    ロシア軍の拠点に、ウクライナ軍FPVドローンが突入..…

  • 10

    元ファーストレディの「知っている人」発言...メーガ…

  • 1

    ロシア「BUK-M1」が1発も撃てずに吹き飛ぶ瞬間...ミサイル発射寸前の「砲撃成功」動画をウクライナが公開

  • 2

    一瞬の閃光と爆音...ウクライナ戦闘機、ロシア軍ドローンを「空対空ミサイルで撃墜」の瞬間映像が拡散

  • 3

    どの顔が好き? 「パートナーに求める性格」が分かる4択クイズ

  • 4

    AIパイロットvs人間パイロット...F-16戦闘機で行われ…

  • 5

    日本マンガ、なぜか北米で爆売れ中...背景に「コロナ…

  • 6

    「おやつの代わりにナッツ」でむしろ太る...医学博士…

  • 7

    「2枚の衛星画像」が伝える、ドローン攻撃を受けたロ…

  • 8

    常圧で、種結晶を使わず、短時間で作りだせる...韓国…

  • 9

    ロシアの大規模ウクライナ空爆にNATO軍戦闘機が一斉…

  • 10

    ウクライナ軍ブラッドレー歩兵戦闘車の強力な射撃を…

  • 1

    韓国で「イエス・ジャパン」ブームが起きている

  • 2

    ロシア「BUK-M1」が1発も撃てずに吹き飛ぶ瞬間...ミサイル発射寸前の「砲撃成功」動画をウクライナが公開

  • 3

    「おやつの代わりにナッツ」でむしろ太る...医学博士が教えるスナック菓子を控えるよりも美容と健康に大事なこと

  • 4

    最強生物クマムシが、大量の放射線を浴びても死なな…

  • 5

    ロシアが前線に投入した地上戦闘ロボットをウクライ…

  • 6

    「燃料気化爆弾」搭載ドローンがロシア軍拠点に突入…

  • 7

    世界3位の経済大国にはなれない?インドが「過大評価…

  • 8

    一瞬の閃光と爆音...ウクライナ戦闘機、ロシア軍ドロ…

  • 9

    タトゥーだけではなかった...バイキングが行っていた…

  • 10

    NASAが月面を横切るUFOのような写真を公開、その正体…

日本再発見 シーズン2
CHALLENGING INNOVATOR
Wonderful Story