撰文:袁如陵
生成式 AI 在全球掀起風潮,但各地創作者卻對此感到擔憂。
2024 年 7 月,擁有超過 30 萬追蹤數的日本知名繪師 jima 表示,自己的作品被他人拿來訓練 AI 模型,還被用來生成與自己風格雷同的作品。這個 AI 模型不但被公開分享,還直接被命名為 jima;之後生成的繪畫作品,甚至被網友營利使用,在社群媒體上獲得 10 萬以上的按讚數。
類似事件幾乎每天在世界各地上演,但許多 AI 開發商卻宣稱,取用網路上的公開資料是一種「合理使用」,並將訓練 AI 形容為「人類讀書」──這樣的比喻真的恰當嗎?既有的法律制度,能否繼續保障創作者的利益?
本文將從法律與專利觀點出發,探討日本的相關發展,有什麼我們可以借鏡的地方?
避免「兩敗俱傷」的局面,是各國政府無法迴避的議題
在網路上,有許多藝術家公開反對 AI,例如一個名為「藝術家反對生成式 AI」(Artists Against Generative AI)的臉書社團,就號召了超過 15 萬成員加入。在數據分析公司 YouGov 的調查中,當美國人被問到對生成式 AI 的感受,49% 的受訪者感到「擔心」,22% 甚至覺得「恐懼」。
這股反對力量也開啟了法律行動。AI 大廠如 OpenAI、Meta、Midjourney 正於美國面臨諸多來自藝術家、新聞媒體的訴訟。為應對社會大眾的反彈聲浪,像是歐盟即推出《AI 法案》來規範人工智慧的各種應用。

不過實際上,各國政府仍對 AI 監管感到兩難,沒有一個國家願意真的出手,深怕一不小心阻撓了 AI 發展,而使自己國家在這火熱的軍備競賽中落隊。然而,若忽視社會各界對 AI 的不滿情緒,恐怕只會讓這名為「著作權」的壓力鍋,一步步逼近極限。
最糟的情況是,AI 廠商若無法自我約束,且政府也欠缺規範來引導,最終只能在法院與創作者正面衝撞。若法官在公眾的期待下,宣判 AI 公司擅自使用他人創作的行為侵犯了著作權,即可能造成過去訓練 AI 所投入的龐大成本難以回收,形成兩敗俱傷的局面。
在台灣為何鮮少受到關注?答案有點「悲傷」
這個問題的背後原因,或許有些「悲傷」:一是主流 AI 模型大多是以英文資料訓練而成,未用到台灣的本土資料;二是台灣既沒有歐美的迪士尼、華納兄弟、Netflix 等媒體公司,也沒有日本強大的動漫產業,自然相對不會有太多作品面臨侵權的問題。
另外,近年我國各界更關注反詐騙、隱私、國安等 AI 應用層面的問題,也或多或少掩蓋掉前述議題的能見度。
不過試想,若有一個 AI 應用違反當地法律,頂多是停止服務,但當 AI 模型本身侵權,則會影響到所有奠基於此模型的 AI 工具,而目前主要的 AI 公司如 OpenAI、Meta 都身陷著作權官司,台灣日後豈能不受影響?
台灣的《人工智慧基本法》已在 2024 年 7 月推出草案,然而內容果然相當「基本」,只提供了政策的概略方向;也就是說,除了宣示效果外,許多問題仍懸而未決,尤其在著作權議題上,更是隻字未提。
日本與台灣一樣,缺乏強大的跨國媒體集團或是本土的社群平台,不過,由於動漫文化及電玩產業興盛,該等產業在這波 AI 浪潮下也受到不小衝擊,因此日本的應對方式,或許可供台灣政府作為未來參考。

日本官方的努力:致力打造規範框架
為了盡早打造健全的 AI 發展環境,日本經濟產業省在徵集各方意見後,於 2024 年 4 月公布了「AI 廠商準則」(AI 事業者ガイドライン,AI Guidelines for Business),以供 AI 開發商參考。
緊接著,日本文化廳也在 2024 年 5 月發布了「日本人工智慧與著作權的一般理解」(General Understanding on AI and Copyright in Japan,以下簡稱「AI 報告」),政府以此讓外界理解 AI 時代下應如何詮釋著作權法,並讓企業有所依循。
前述廠商準則或 AI 報告,無論是從開發角度提供建議,還是從《著作權法》的角度解釋,說明生成式 AI 在什麼情況下可能引發侵權行為,雖沒有直接的法律效力,但皆可一窺日本政府對於生成式 AI 的態度,進一步預測未來立法趨勢,頗值得細細品味。
創作權益 vs. 公共利益,不可偏廢
為了傳播知識與保障創作自由,各國的著作權法,都會允許第三方「有限度地」使用具有著作權的作品。例如老師在課堂上,可以為了教育目的擷取文章內容給學生閱讀討論;新聞媒體也能引用他人的創作,以利報導。

日本的《著作權法》也不例外,提供了公眾運用作品的彈性空間。依據該法,只要不是以「享受著作」為目的(受し又は他人に享受させることを目的としない場合,non-enjoyment purpose),就可以在一定程度內利用著作。
所謂「享受著作」,可以理解為「閱讀」小說、「聆聽」音樂、「執行」電腦程式、「觀賞」電影等行為;反之,「下載電影來分析不同時期的電影主題」,就不屬於「享受」的範圍了。而過去十多年常聽到的大數據分析,由於只是從資料中獲取有意義的資訊,也屬於此類豁免,以保障研究自由。
然而,這樣的豁免條款,還是有附帶條件,即「不能損害著作權人利益(著作権者の利益を不当に害することとなる場合)」。
換句話說,使用著作時,不能影響到創作者該拿到的好處。前述 AI 報告中也特別提醒,會不會損害著作權人利益,需要考量「是否會在市場上與原作品競爭」和「是否會阻礙原作品未來的潛在銷售管道」。
使用 AI 的兩大階段,可能會怎樣侵犯著作權?
前述 AI 報告中,日本官方將有潛在風險的行為,拆分為二階段:
一、開發及訓練階段
這是指為了訓練 AI 而蒐集、複製作品,以及使用那些資料來訓練 AI 的行為。目前 AI 的訓練資料大多來自網路上的公開資料,但必須要特別小心以下 3 種資料來源:
- 盜版書籍或是非法網站上的影音資料,絕對不能拿來訓練 AI,否則有非常高機率侵害著作權。
- 資料來自網路,但須付費取得(有時是以「付費牆」的形式出現,需要購買單篇或訂閱才能閱讀),但 AI 開發商在使用前卻未付費。
- 著作權人已經採取「科技保護措施」(technological protection measures),例如在網站上使用「robots.txt」來告知 AI 開發商不可擅自抓取內容。
簡言之,如果明知是盜版的資料而拿來使用,利用不恰當的手段獲取原本需要付費的內容,或是忽視著作權人拒絕被抓取資料的要求,就會衍生極大風險。不過,在使用沒有特別標示的網路資料時,風險則相對較低,這或許就是日本想要留給 AI 產業的空間,以確保 AI 模型仍有足夠的訓練資料。
而在訓練階段,依據 AI 報告,訓練 AI 的基礎模型不算是「享受著作」,所以原則上可不經著作權人同意,就拿作品來訓練 AI。然而,下述情況,可能會被認定符合「享受目的」:
- 為了生成與資料相似的內容,而蒐集資料來訓練 AI:這也被稱為「微調」(Fine-tuning),是一種追加訓練基礎模型的技術。
- 直接提供資料給 AI 作為回答的參考:這一般是為了提高回答特定問題的正確性,通常是利用常見的「檢索增強生成」(Retrieval Augmented Generation,RAG)技術來達成。
另外,在「AI 廠商準則」中也提及,如果 AI 開發者蓄意調整模型,以方便使用者產生侵權的作品,就必須擔負責任。
從以上的說明,很明顯可以看出日本政府只想排除「蓄意侵權」的 AI 模型。

現在我們可以回頭看看,本文開頭所提到的,日本繪師 jima 的作品被拿去訓練模型的例子,試著討論一下「蓄意模仿他人風格」是否合理。
著作權法只保護創作的「表達方式」,而不保護「想法」本身。例如,超現實主義藝術家達利擅長將常見的物品「變形」,像是以融化的鐘錶表達時間的流逝;不過,只要不繪製類似形狀的鐘錶,其他藝術家仍可繪製變形的日常物品,創作出屬於自己的超現實主義作品。
由於「風格」一般不受著作權法保護,所以即使是模仿特定的藝術家,頂多受到輿論撻伐,不至於被判定侵權。
然而,或許是因為 AI 技術過於強大,日本政府在 AI 報告中表達了立場:如果是「刻意」複製特定藝術家的作品來訓練 AI,就是不恰當的。這是因為,在日本著作權法的脈絡下,來自相同藝術家的系列作品集,可能已經不僅僅是「想法」,而涵蓋了其獨特的「創意表達」,讓後續的訓練帶有「享受目的」,進而踩踏到侵權的紅線。
這恰好就是本文開頭中,讓藝術家頭疼的抄襲困境:網友刻意複製一整組日本繪師的作品,用來訓練 AI,目的就是為了再現繪師的作品。除了道德上的疑慮外,也可能侵犯了繪師的權利。
二、生成及使用階段
接著讓我們談談,使用 AI 生成內容,或是將這些內容上傳、公開時可能衍生的風險。
最常發生的問題是,創作者發現 AI 生成的內容與自己的作品很相似,卻不知該如何證明自己被抄襲,而這在 AI 報告中也有所指引:
- 若要被認定侵害著作權的情況,兩個作品必須要是相似的,這在台灣被稱為「實質相似性」。
- 著作權人要證明侵權作品的確參考了原作品,這在台灣被稱為「接觸」。
但是,AI 生成內容在判斷有沒有「接觸」時有其特殊難處,因為除了開發商之外,外界很難得知 AI 模型使用了哪些資料進行訓練。因此,日本的 AI 報告中就提到,著作權人若能證明侵權者「有機會」接觸原作品,或是 AI 生成的內容與原作品有高度相似性,就很可能滿足「接觸」的要求。
另外,當著作權人能夠證明自己的作品被用來訓練 AI 時,即使 AI 的使用者不知情,一般來說也可以滿足「接觸」的要求,因此使用者如果選擇利用 AI 生成內容,對內容是否侵權也要有一定的敏銳度。
以上這幾點指引,都明顯降低了在日本舉證 AI 侵權的難度。
值得提醒的是,不管是在蒐集資料、訓練模型、生成內容中任一階段違反著作權法,都有打斷 AI 內容價值鏈的機率。當侵權行為發生時,無論是 AI 服務的使用者,或是 AI 的開發者,都可能要為此負責。
前述的侵權責任大小,會因具體狀況而不同。例如,若一個 AI 服務時常產出侵權的內容,或開發商沒有試圖避免系統產生侵權內容時,就要負上更多責任;反之,若 AI 工具在設計層面已盡量避免產生不適當的內容,而侵權內容是由使用者以不當手段利用 AI 工具所產生,則使用者就須承擔較多的侵權責任。

日本已不是「AI 天堂」,台灣又該走向何方?
相較其他國家對著作權的保護,過往日本對 AI 的態度是相對支持的,日本文部科學大臣甚至曾公開表示,日本的 AI 公司可以使用「任何他們想要的東西」來訓練 AI,包括盜版資料。Meta 首席 AI 科學家 Yann LeCun 也曾這樣形容:「日本是機器學習的天堂」。
但近來前述幾份官方文件的發布,可看出日本不會繼續作為「AI 天堂」,日本民間──如日本新聞協會──也在 2024 年 7 月發布聲明,指出 AI 搜尋侵犯著作權,要求日本政府進一步修法。
針對類似的衝突,歐盟在《AI 法案》中要求,開發商必須公開哪些資料被用於訓練 AI 模型,讓創作者有更多機會爭取適當補償,也對 AI 開發商產生更多自律效果。
在抄襲文化盛行的中國,有許多 AI 判決已經出爐;美國身為諸多 AI 開發商的宗主國,各方勢力仍在積極角力。那麼台灣又是如何呢?
在 AI 盛大的國際擂台上,台灣並非主要的內容產生者或消費者,但仍有「AI 硬體設備生產」這個獨特的連結點。我們是只打算挑一個「抄答案」的對象,還是能夠研擬出最符合台灣利益、具有國際戰略的法律體系?
訓練資料對 AI 的開發是重中之重,而著作權在這之中扮演極為重要的角色,台灣能否透過 AI 風潮,將軟實力延伸到過往鞭長莫及之處?台灣有諸多產業受惠於此波 AI 風潮,因此任何對 AI「踩剎車」的理由,在經濟成長的大旗下都是螳臂當車。
然而,站在創作者的角度,是否真的應該犧牲自己來成全 AI?《人工智慧基本法》勢必要出來面對,調和文化產業所面臨的衝擊;雖然目前還沒看到太多相關討論,不過以其它國家的經驗來看,只是時機未到而已,就讓我們拭目以待。
《關於作者》
袁如陵
對智財有著無限熱情、喜歡攪動同溫層的年幼大叔。台灣大學植病所碩士、倫敦大學智財管理碩士。曾任上市醫材公司法務主管、英國顧問公司產業分析師、科技業專利工程師。台灣專利師。近期興趣是研究 LLM 以彌補讀不到法學碩士的遺憾。
執行編輯:羅思涵
核稿編輯:孫雅為