データ収集と著作権法


データは著作権法で守られています。

AI構築する際、何をおいても必要なのはデータです。データがない場合、インターネット上のデータ(画像とか文章とか)を利用する場合も結構あるのではないでしょうか?

インターネット上にあるからと言って自由に使えるわけではありません。これらのルールを定めている法律が著作権法です。

 

ひらめきを守る法律たち・・・そもそも著作権法とは

なにかひらめいたら特許法など法律によって守られます(図参照)。そのうち、書いた文書や描いた絵などを守る法律が著作権です。

著作権法の目的

「著作物並びに実演、レコード、放送及び有線放送に関し著作者の権利及びこれに隣接する権利を定め、これらの文化的所産の公正な利用に留意しつつ、著作者等の権利の保護を図り、もつて文化の発展に寄与する」

著作物とは何か、著作権者とはだれか、さらにその権利などを定めて、権利を保護することで、文化の発展に寄与していこう!というものです。

つまり、みんなで文化を発展させましょう!ってことです。

 

著作権法の保護対象

  • 以下の要件を満たすことが必要です。
    • 思想または感情に関するもの
      • 単なる事実はダメ・・・例えば東京スカイツリーは634メートルの高さなど
    • 創作的であること
      • 独自の発想で新しく作り出したことが必要です。
      • 子供が描いた絵であっても著作物として該当します。
    • 表現したものであること
      • 思想または感情が頭の中にある状態ではなく、視聴できる形で表す必要があります。
    • 文芸、学術、美術または音楽の範囲に属するものであること
      • 文化の範囲に属する必要があります。(※工業製品は除かれます。)

 

著作物とは

  • 言語の著作物(1号)⇒ 小説、脚本、論文、講演、短歌、俳句など
  • 音楽の著作物(2号)⇒ 楽曲、楽曲をともなう歌詞
  • 舞踏・無言劇の著作物(3号)⇒ 日本舞踊、バレエ、パントマイムの振り付けなど
  • 美術の著作物(4号)⇒ 絵画、版画、彫刻、マンガ、美術工芸品など
  • 建築の著作物(5号)⇒ 芸術的な建築物
  • 図形の著作物(6号)⇒ 地図、学術的な性質を有する図面、図表、模型など
  • 映画の著作物(7号)⇒ 劇場用映画、アニメ、ゲームソフトの映像部分などの「録画されている動く影像」
  • 写真の著作物(8号)⇒ 写真(証明写真はダメ)、グラビアなど
  • プログラムの著作物(9号)⇒ コンピュータプログラム(プログラム言語はダメ)

その他の著作物

  • 二次的著作物 ⇒ 上表の著作物(原著作物)を翻訳、編曲、変形、翻案(映画化など)し作成したもの
  • 編集著作物 ⇒ 百科事典、辞書、新聞、雑誌、詩集など
  • データベースの著作物 ⇒ 編集著作物のうち、コンピュータで検索できるもの

逆に、著作物ではないモノ

  1. 憲法そのほかの法令(地方公共団体の条例、規則も含む。)
  2. 国や地方公共団体又は独立行政法人の告示、訓令、通達など
  3. 裁判所の判決、決定、命令など
  4. 1から3の翻訳物や編集物で国や地方公共団体又は独立行政法人の作成するもの

著作者とは

  • 著作者とは、「著作物を創作する者」のことです(著作権法第2条第1項第2号)。
  • 職務著作の著作者
    • 会社や国などの法人に従事する者が職務上著作物を創作した場合は、会社が著作者となります(著作権法15条第1項)。
    • 職務著作になる要件
      • 法人、その他使用者の発意に基づいていること
        • ⇒ 著作物の作成についての意思決定が使用者の判断によるものであることを意味する。
      • 法人等の業務に従事する者が職務上作成したものであること
        • ⇒ 雇用関係のない外部の者が請負契約により著作物を作成した場合は職務著作ではない
      • 法人等が自己の著作名義のもとに公表するものであること
        • ⇒ プログラムの著作物については、公表されずに内部で使用される場合も多いため、職務著作ではない
      • 作成時の契約や就業規則等に別段の定めがないこと
        • ⇒ 契約や就業規則に「従業員を著作者とする」というような定めがないことを意味している

インターネット上のデータは大体著作物

上記の通り、インターネット上にある写真や文章は著作物で、著作者に以下の権利が与えられています。

権利とは

  • 著作者人格権・・・著作権の発生とともに付与される権利
    • 公表権、氏名表示権、同一性保持権
  • 著作権(財産権)・・・著作者の財産的な利益を保護するための権利
    • 複製権、上演権及び演奏権、上映権、公衆送信権等、口述権、展示権、頒布権、譲渡権、貸与権、翻訳権、翻案権、二次著作物の利用に関する原著作物の権利
  • 著作隣接権・・・著作物を伝達した物に与えられる権利
    • 実演家、レコード製作者、放送事業者・有線放送事業者が有する権利
  • その他の権利・・・明文化されていないが判例による権利
    • 肖像権、パブリシティー権、商品化権

著作者がフリーで使っていいよと言っているモノはフリーで使っていいのですが、そう明言されていないモノは確認しないと怖くて使えません。しかし、以下のように、利用できる場合があります。

著作権の制限・・・権利者の許諾を得ずに利用できる場合

  • 私的利用のための複製
  • 引用
  • 営利を目的としない上演など
  • 教育目的の利用

 

AI構築で使う場合

他人が撮った写真の画像を自分のHPにつかうっていう場合、著作権を侵害していることは自明ですが、AIの学習時に100回読み込みたいだけという場合はどうなんですかね?

原則的には問題ありません。去年までははっきりしていませんでしたが、2019年1月の改正で、明文化されました。

1月の改正項目

  1. デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定の整備
  2. 教育の情報化に対応した権利制限規定等の整備
  3. 障害者の情報アクセス機会の充実に係る権利制限規定の整備
  4. アーカイブの利活用促進に関する権利制限規定の整備等
  5. TPP11発行に伴う著作権法改正(保護期間の延長、一部非親告罪化)

このうち、1番の「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定の整備」の中で、他人の著作物(画像や音楽などのコンテンツ)を利用する場合であっても、

  1. AIによる情報解析や技術開発など、視聴者等の知的・精神的欲求を満たす効用を得ることに向けられた行為でなく、著作物を享受する目的で利用しない場合(著作物の非享受利用)
  2. 新たな知見や情報を創出することで著作物の利用促進に資する行為で、権利者に与える不利益が軽微である一定の利用を行う場合(著作物の軽微利用)

には、著作権者の同意がなくとも付随的な利用が認められることとなりました。

この「非享受利用」や「軽微利用」が明文化されたことで、さらなる利用の促進が期待されています。

逆に守りたい場合

「非享受利用」や「軽微利用」もされたくないという著作権者は、使われたくない意思を明確に示しておく必要があります。この基準が政省令で定められています。

47条の5における政省令が定める基準(概要)

  1.  サービスに使用するデータベースに係る情報漏えいの防止のための措置を講ずること
  2.  サービスが改正法の要件に適合するものとなるよう、あらかじめ、当該要件の解釈を記載した書類の閲覧、学識経験者に対する相談その他の必要な取組を行うこと
  3.  サービスに関する問合せを受けるための連絡先その他の情報を明示すること
  4.  IDやパスワードにより受信が制限された情報や、業界慣行に沿って情報収集禁止措置がとられた情報(robots.txtやメタタグ等による検索回避措置)を使用しないこと(※インターネット情報検索サービスのみ)

まとめ

  • 著作者等の権利の保護 ⇒ 文化の発展に寄与
  • 著作物とそうでないものがあります。
  • 著作者・著作物には権利があります。
    • 権利者の許諾を得ずに利用できる場合があります。
    • 一定条件下では、非享受利用と軽微利用も認められる

AI構築の際、データをインターネット経由で収集する(クローラーを作る)際、サイト内の情報やrobots.txt、メタタグなどの確認を怠らなければ、データ収集が可能であることが分かって頂けたかと思います。

これで安心して、AIが作れますね。