これまで、平均的な人より OSS ライセンスに対して気持ちがある人間として、個人的に GitHub Copilot の使用を避けてきた。理由は単純明快で、改変や再配布がされた著作物に原著作者の表記が必要な OSS ライセンスのコードを見て学習した AI がコードを吐いているからだ。GitHub にせよ OpenAI にせよ、AI サービスのベンダーはしかるべきライセンス対応をすべきだという立場である。
では、人間自身のプログラミングはこの問題と無縁なのだろうか?私達もやはり、再配布された著作物を見てコードを学んできたし、切り捨てることはできないはずだ。
過去を振り返ってみれば、音楽の「オマージュか模倣か問題」のように、他人が生み出した価値ある何かを受け取って発信する行為は多く議論を呼んだ。だいたいの場合は、誠実さで善悪を切り分けたり、フェアユースの概念を導入してシステマティックに解決したりしている。OSS が事をより難しくしているのは、許諾によって押し広げられた著作物の利用範囲が、やはり著作権という法的なものの上に成り立っているがゆえに、非常に厳格に定められていることだ。このような背景にあっては、誠実かどうかはただの気持ちでしかないし、フェアユースが踏み込みグレーゾーンを作る隙もない。
法的な厳格さを前にしてなお、私達は自分の頭に浮かんでくるコードに、ペタペタと他人の著作権表示を貼ることはない。どこかから『コピー』してきたものではなく、自分で『考えた』コードだからだ。しかし、AI が生み出すコードには著作権がどうのと突っ込むのに*1、人間のする『考える』という行為にそれを適用しないのはおかしいのではないか、という気がしてくる。人間のする『思考』とコンピューターの『計算』は、何が違うのだろうか。違いがあったとして、何が人間の『思考』を特別なものにしているのだろうか。個人的には、この『思考』と『計算』の違いという点について、人間は自ら(の脳みそ)を無条件に特別あるいは神聖なものと考えている気がしてならない。私は哲学者ではないのでこのあたりで止めるが、人間がコードを書くことが言わずとも前提であった時代の OSS ライセンスは、AI の学習に使用されることを想定していないし、準備もできていないことは明らかになっただろう。
AI のもたらす実利的なところは、承前の Copilot などを見れば言うまでもない。AI と OSS とが相補的に気持ちよく進化していくためには、どちらにも新たな一歩が必要であると思う。AI を開発する側は OSS という文化への理解と具体的なアクションを、OSS 開発者側には AI-ready なライセンスをという具合である*2。誰がどのようにその道を作るだろうか。今後注目していきたい。
追記:
こんな記事を書きつつ、OSI-approved license の大半は著作者とリポジトリへのリンクをバッチでまとめれば普通にクリアできるんじゃねとは思っているし、それくらいやれよ GitHub とも思っている
— Takumi Sueda (@puhitaku) 2023年3月24日