AIと著作権──ビジネスパーソンが押さえるべき4つのポイント【機械学習入門⑪】

前回（機械学習入門⑩）は、MBAデータサイエンス講座の集大成となるDemo Dayの体験記と、6回分の学びの振り返りを書いた。

シリーズの最終回は、講座の最終日にもう一つ大きく扱われたテーマ──AIと著作権・知的財産──を整理する。

「AIの著作権なんて法律家の話でしょ？」と思っている人ほど読んでほしい。生成AIを業務で使う時代になった今、契約書にも社内規程にも「AIで作ったかどうか」が顔を出すようになっている。基本構造を知っておくと、トラブルを未然に避けられる。

1 AIを4つの構成要素に分けて考える
2 ① 学習用データ──日本は「機械学習天国」
3 ② プログラム──ほとんどがオープンソース
4 ③ 学習済みモデル──法的にはグレーゾーン
5 ④ AI生成物──「創作的寄与」がカギ
6 AI関連の特許はどうか？
7 実務でのチェックポイント
8 シリーズを読んでくださった方へ
9 もっと深く学びたい人へ
- 9.1 ① AIと著作権・法務を実務目線で押さえたい
- 9.2 ② 生成AIと著作権の論点を最新動向まで追いたい

AIを4つの構成要素に分けて考える

講座で最も「目から鱗」だったのが、AIをひとくくりに考えるのではなく、4つの構成要素に分解して権利関係を整理するアプローチだった。

学習用データ（モデルを訓練するための素材）
プログラム（学習や推論を行うソフトウェア）
学習済みモデル（重みパラメータの塊）
AI生成物（モデルから出てきたテキスト・画像・音声など）

この4つは、それぞれ法的扱いが異なる。一つずつ見ていこう。

① 学習用データ──日本は「機械学習天国」

講座で最も驚いたのがここ。日本の著作権法は、機械学習にとって世界でも有数に「やさしい」法律だ。

2019年に施行された改正著作権法第30条の4では、「著作物に表現された思想又は感情の享受を目的としない利用」であれば、原則として著作権者の許諾なしに著作物を利用できると定められた。具体的には、機械学習の学習データとしてWebからダウンロードした画像や文章を使うことが、ここに該当する。

諸外国（特にEUや米国）と比べてもこの規定は適用範囲が広く、日本は機械学習の研究・開発にとってきわめて好ましい法環境にある──だから「機械学習天国」と呼ばれる。

ただし注意点がある。条文には「著作権者の利益を不当に害することとなる場合は、この限りでない」というただし書きがある。たとえば有料データベースを丸ごとスクレイピングして学習に使うような行為は、この例外にあたる可能性が高い。「無料で見られる」と「自由に使える」は別問題だ。

② プログラム──ほとんどがオープンソース

機械学習のコアとなるソフトウェア──TensorFlow（Google）、PyTorch（Meta）など──は、ほぼすべてがOSS（オープンソースソフトウェア）として公開されている。商用利用も無料だ。

ただし、それぞれのライセンス条項（Apache 2.0、BSD、MITなど）を守る必要がある。よくある落とし穴は、コードの一部を流用したのに著作権表示やライセンス文を残し忘れること。社内でAIシステムを構築するときは、使ったOSSのライセンス一覧をきちんと管理しておくのが基本だ。

③ 学習済みモデル──法的にはグレーゾーン

これが一番むずかしい論点だ。「学習済みモデル」とは、プログラムと学習で得られたパラメータ（重み）の組み合わせのこと。

著作権法では？「プログラムの著作物」として保護される可能性はあるが、創作性が認められないとして保護されない見解も強い。判例も少なく、グレー。
特許法では？アルゴリズムや関数そのものは「発明」として認められないため、特許での保護は基本的に難しい。
派生モデル・蒸留モデル：あるモデルを土台に追加学習したり、入出力を抜き取って別モデルを作ったりした場合、「元のモデルを使った」と立証することは技術的にきわめて困難。

では実務ではどう守るか。最も現実的なのは、不正競争防止法上の「営業秘密」として管理する方法だ。社外に出さない、アクセス権を限定する、契約で守秘義務を課す──こうした管理を徹底することで、モデル自体を会社の重要資産として保護する。

④ AI生成物──「創作的寄与」がカギ

「ChatGPTで書いた文章は誰のもの？」「Midjourneyで作った画像に著作権はある？」──ここがビジネスで最もよく聞かれる論点だ。

講座で示された整理は次のとおり。

人による創作：当然、創作した人に著作権が帰属する
AIを「道具」として使った創作：人に創作的意図と創作的寄与があれば、著作物として認められ、著作権が発生する
簡単な指示だけで生成された場合：「猫の絵を描いて」レベルの指示だけで出てきた画像は、創作的寄与が認められず、AI生成物として著作物とは認められない

問題は、「創作的寄与」の境界線がきわめて曖昧なこと。プロンプトを何度も練り直した、画像を何枚も生成して選んだ、ペンタブで一部を加筆した──これらが寄与にあたるか否かは、現時点では裁判例が積み重なっておらず、ケースバイケースだ。

実務的に安全側に倒すなら、「AIが出した素材を、人が大きく手を加えて完成させた」と説明できる工程を残しておくのが現実的。プロンプト履歴、選別の記録、加筆の痕跡──こうしたものをログとして残しておくと、後から「これは私の創作です」と主張する根拠になる。

AI関連の特許はどうか？

「AIで革新的なものを作ったから特許を取りたい」──これも実務でよくある相談だ。ただし、特許のハードルはそれなりに高い。

自然法則を利用した技術的思想の創作であること（=「発明」性）
アルゴリズム単独ではNG。ハードウェア資源を使って具体的に実現されている必要がある
新規性（先行技術と異なる点があること）
進歩性（通常の技術者が容易に思いつかないこと）。「単に既存のニューラルネットワークを別の問題に適用しただけ」はマイナス要因
先願主義（最初に出した人のみ取得可能）

つまり、AI技術そのものを純粋に発明として守るのは難しく、「具体的なシステム実装」や「業務との組み合わせ」を絡めた請求項で出願するのが現実解になる。

実務でのチェックポイント

講座で得た知識を、自分の実務に当てはめてみたチェックリストを共有しておく。

学習データを収集する前：データのライセンスと第30条の4の例外条件（不当に利益を害さないか）を確認
OSSを使う前：ライセンス条項を読み、必要な著作権表示やソースコード公開義務がないかチェック
独自モデルを開発したら：著作権では守りにくいので、営業秘密として社内管理体制を整える
AI生成物を成果物として納品するとき：契約書に「AI使用の有無と範囲」「権利帰属」を明記する
クライアントから「AIで作ったものですか？」と聞かれたとき：プロンプト履歴と加筆プロセスを説明できるようにしておく

この分野は今後も法改正や判例の積み重ねで動いていく。「この記事を書いた時点での整理」として読んでいただきたい。最新動向は文化庁の著作権テキストや、生成AIをめぐる経産省・公正取引委員会の議論を継続的にチェックするのがおすすめだ。

シリーズを読んでくださった方へ

機械学習入門シリーズはこの記事で最終回。Day1のタイタニックから始まって、回帰・分類・モデル評価・予測AIのバイアス・生成AIの仕組み・プロンプト設計・Demo Day、そしてAIと著作権まで、合計11本のブログを書き切った。

講座を終えた今、改めて強く感じるのは「AIは特殊技能ではなく、ビジネスパーソン全員のリテラシーになっている」ということだ。技術者でなくても、仕組みを大づかみで理解し、自分の仕事の中で使いこなせるようになっておくことが、これからの数年でじわじわと差を生む。

このシリーズが、誰かのAI学習の入り口になれば嬉しい。

もっと深く学びたい人へ

① AIと著作権・法務を実務目線で押さえたい

福岡真之介編『AIの法律』（商事法務）は、本記事で扱った4つの構成要素を含めて、契約・知財・データ保護・個人情報まで実務目線で網羅している定番書だ。法務担当でなくても、AIプロジェクトの責任者には一度目を通しておいてほしい。

AIの法律

created by Rinker

② 生成AIと著作権の論点を最新動向まで追いたい

松尾剛行『生成AIの法律実務』は、生成AIに特化した法律解説書。「ChatGPTで書いた文章の権利はどこにあるのか」「学習データに自社コンテンツが使われたら」といった問いに対して、実際の論点と実務対応を整理してくれる。一冊持っておくと、迷ったときの判断軸になる。

生成AIの法律実務

created by Rinker