大模型挑戰(zhàn)既有版權(quán)邊界的爭執(zhí)又起:據(jù)報道,加拿大多家主流媒體日前入稟法院,對美國科技公司OpenAI聯(lián)合提起訴訟,理由是OpenAI“經(jīng)常違反”版權(quán)和在線使用條款,從加拿大媒體上抓取大量內(nèi)容,以幫助開發(fā)ChatGPT等產(chǎn)品。
這是繼今年年初《紐約時報》起訴OpenAI之后,又一起有代表性的、傳統(tǒng)出版帝國與人工智能的版權(quán)之爭,訴訟的爭執(zhí)點大體相同。站在報業(yè)集團立場上,OpenAI未經(jīng)授權(quán)以原告優(yōu)質(zhì)媒體內(nèi)容填喂大模型,并由此獲得商業(yè)利益,既是對版權(quán)的侵犯,也影響了有價值新聞的產(chǎn)生生態(tài),破壞了現(xiàn)代新聞倫理確定的基本邏輯。OpenAI則傾向于認(rèn)為(正如上次它針對《紐約時報》訴訟的聲明所言),包括《紐約時報》在內(nèi)的單一數(shù)據(jù)源無論有沒有,都不會對大模型的表現(xiàn)造成重要影響,且大模型的訓(xùn)練,是一種學(xué)習(xí)模式,其機制和抄襲有根本不同。
有論者如是解釋OpenAI的道理,“就像你不能因為閱讀海明威的作品、學(xué)習(xí)了簡短有力的文風(fēng),就向他付版權(quán)費一樣! 這也道出了通用人工智能公司與傳統(tǒng)報業(yè)在基本認(rèn)識上的分野。人工智能公司是在“類人”“新人”這樣的維度上看待大模型的,它的學(xué)習(xí)和訓(xùn)練過程應(yīng)該按照人的成長機制理解,即,學(xué)習(xí)公開資料、獲取知識儲備、在與被服務(wù)者的互動中輸出“平生所學(xué)”。而傳統(tǒng)報業(yè)集團,是在新型技術(shù)媒介的意義上看待大模型的,就像電視是對紙媒的迭代,大模型也只是一個新迭代的技術(shù)媒介,是媒介就要以“版權(quán)”為圭臬。
越是具有深厚歷史、優(yōu)質(zhì)的傳統(tǒng)媒體,越是傾向于將新事物看成與我同構(gòu)的東西,而不是對我所在世界基本邏輯的顛覆!都~約時報》是代表,此次發(fā)起訴訟的加拿大主流媒體也是代表。其中加拿大通訊社已經(jīng)有百年歷史、由110多家報紙聯(lián)合建立,《多倫多星報》的報史甚至可稱跨越了三個世紀(jì)。它們本身就是活著的媒介歷史,包括版權(quán)在內(nèi)的媒介基本原則,是由它們親證并確立的。這使它們傾向于認(rèn)為,大模型作為“后來者”、新的技術(shù)媒介類型,破壞了可靠信源、獨立創(chuàng)作、版權(quán)付費等基本媒介法則,而這與大模型的自我定義是錯位的。
可以說,已經(jīng)進入人類倫理、法律“無人區(qū)”的大模型,能否被版權(quán)法及其背后的邏輯所約束,并不樂觀!都~約時報》對OpenAI的訴訟為2024開年,但直到2024年末尾的此時,訴訟仍未有明顯進展。與之相關(guān)的背景是,OpenAI正與越來越多的新出版商簽署了許可協(xié)議,為其訓(xùn)練內(nèi)容付費,其中包括美聯(lián)社、金融時報等等。換句話說,通用人工智能公司正以付費多少的具體問題,取代大模型是否能用版權(quán)法約束的法理之爭。在只具體付錢、不系統(tǒng)爭論的策略中,大模型飛身而進,創(chuàng)造著傳統(tǒng)媒體越來越無法把握的世界。