Wikipedia、AI開発!生成AI開発大手5社にデータ提供

AI活用

ウィキペディアを運営するウィキメディア財団は、2026年1月15日(創設25周年記念日)

生成AI開発大手5社と、AI学習・活用のための有償データ提供で提携したことを公式に発表しました。

AI企業による「データのタダ乗り」を防ぎ、
ウィキペディアの持続可能性を確保するための大きな転換点として注目されています。

1. 提携の概要

新たに「ウィキメディア・エンタープライズ(Wikimedia Enterprise)」の有料パートナーに加わったのは以下の5社です。

  • マイクロソフト (Microsoft)
  • メタ (Meta)
  • アマゾン (Amazon)
  • パープレキシティ (Perplexity)
  • ミストラルAI (Mistral AI)
    ※Google(グーグル)は、先行して2022年から提携しています。

2. 提供されるデータの内容

通常の閲覧用とは異なり、AI開発に特化した以下の高品質なデータがAPIを通じて提供されます。

  • 構造化データ: AIが処理しやすい形式(Parsed JSON等)で、複雑な表や統計データも正確に読み込めるように提供。
  • リアルタイム更新: 世界中のボランティアによる編集を、ほぼリアルタイムで配信。
  • 編集履歴: どの情報がいつ、どのように修正されたかの詳細なコンテキスト。

3. データ提供の背景と目的

  • サーバー負荷とコストの削減: AIによる大量の自動スクレイピング(データの引き抜き)は、サーバーに多大な負荷をかけ、運用コストを増大させていました。有料化により、これらの企業に「応分の負担」を求める狙いがあります。
  • ハルシネーション(幻覚)の抑制: 人間が検証・編集した信頼性の高いデータを直接提供することで、AIが誤情報を生成するリスクを減らし、回答の正確性を高めます。
  • 適切な帰属表示の確保: AIの回答において、出典がウィキペディアであることを明確に示すよう促し、ボランティアコミュニティへの還元を図ります。

4. ウィキペディアの基本姿勢

  • コンテンツは引き続き無料: 一般ユーザーがウィキペディアを無料で利用できる方針に変わりはありません。また、コンテンツ自体はクリエイティブ・コモンズ・ライセンスの下で公開されており、販売しているのは「データを大規模かつ高速に取得するためのインフラ(API)」であるとしています。
  • 持続可能な運営: 共同創業者のジミー・ウェールズ氏は、「数十億ドルの価値を生むAI開発のコストを、一般からの寄付金で補助すべきではない」とし、企業が正当な対価を支払うことの重要性を強調しています。

この提携により、ウィキメディア財団は将来的に運営コストの最大30%をこれらの事業収入で賄うことを目指しており、寄付頼みの運営体制からの脱却を模索しています。

ウィキペディアさん~~がんばってください。
だんごは応援してます。

タイトルとURLをコピーしました