2023年是人工智能的商用元年,在其野蠻生長(zhǎng)的一年時(shí)間里,生成式人工智能、大模型遍地開(kāi)花。僅2023一年,我國(guó)人工智能相關(guān)企業(yè)就新增52.92萬(wàn)家,可以說(shuō)人工智能在2023年迎來(lái)了爆發(fā)性增長(zhǎng)。
不可否認(rèn)的是,人工智能技術(shù)、企業(yè)的發(fā)展為我國(guó)經(jīng)濟(jì)發(fā)展帶來(lái)了新的增長(zhǎng)點(diǎn),但人工智能的產(chǎn)業(yè)發(fā)展還存在明顯的弊病——侵犯隱私和著作權(quán)等權(quán)益。
最近一段時(shí)間,有關(guān)AI侵權(quán)的案件屢屢發(fā)生,從國(guó)外的“OpenAI遭起訴,涉嫌竊取數(shù)百萬(wàn)用戶信息以及面臨賠款”,到國(guó)內(nèi)的杭州數(shù)字人侵權(quán)、“山寨通義千問(wèn)”以及國(guó)內(nèi)第一AI繪畫侵權(quán)等案件的先后發(fā)生,都反映了生成式人工智能的確存在侵權(quán)問(wèn)題。
科學(xué)技術(shù)是第一生產(chǎn)力,生成式人工智能可否作為生產(chǎn)力?有人認(rèn)為借助各種生成式人工智能工具或者平臺(tái),用來(lái)寫文章、繪畫、生成音頻、視頻等,由此產(chǎn)生的作品的著作權(quán)又歸屬于誰(shuí)呢?
筆者認(rèn)為,生成式人工智能的內(nèi)容產(chǎn)出本質(zhì)就是“抄襲”。生成式人工智能以億萬(wàn)的龐大的數(shù)據(jù)為參數(shù),盡管具有出色的生成能力和巨大的應(yīng)用價(jià)值,但其產(chǎn)出的內(nèi)容一度受到了各界的質(zhì)疑。
2023年3月,意大利宣布暫時(shí)禁止訪問(wèn)ChatGPT,原因是沒(méi)有法律依據(jù)來(lái)證明用于訓(xùn)練 ChatGPT 的大規(guī)模數(shù)據(jù)是合法的。
2023年12月21日,科技部監(jiān)督司發(fā)布的《負(fù)責(zé)任研究行為規(guī)范指引(2023)》指出,不得使用生成式人工智能直接生成申報(bào)材料,不得將生成式人工智能列為成果共同完成人,不得直接使用未經(jīng)核實(shí)的由生成式人工智能生成的參考文獻(xiàn)等。
生成式人工智能的發(fā)展面臨的最大挑戰(zhàn)就是引發(fā)侵權(quán)風(fēng)險(xiǎn)。以ChatGPT為例,其生成式人工智能系統(tǒng)使用從互聯(lián)網(wǎng)上獲取的大量數(shù)據(jù)創(chuàng)建內(nèi)容,這些數(shù)據(jù)涵蓋了未經(jīng)授權(quán)使用的文章、圖片,甚至是敏感的個(gè)人信息。
有分析稱,OpenAI 的訓(xùn)練數(shù)據(jù)包含了超過(guò) 30 萬(wàn)本書,當(dāng)中有許多是沒(méi)有獲得許可、非法獲取的有版權(quán)圖書。有研究表明,大語(yǔ)言模型在某些情況下可以重現(xiàn)或者生成訓(xùn)練集內(nèi)的初始文本。
生成式人工智能在爬取海量數(shù)據(jù)的基礎(chǔ)上都可能會(huì)侵犯哪些權(quán)利?首先是侵害隱私和個(gè)人信息。有研究發(fā)現(xiàn),由于大模型收集大量個(gè)人信息和隱私,且模型越大,所搜集的信息和隱私越多。在數(shù)據(jù)泄露頻發(fā)的當(dāng)下,大模型搜集的海量個(gè)人信息極易成為不法分子攻擊的目標(biāo),從而提取出個(gè)人隱私的信息。
其次是名譽(yù)權(quán)。OpenAI公司首席執(zhí)行官山姆·阿爾特曼在接受采訪中說(shuō),“我特別擔(dān)心這些人工智能被用于大規(guī)模制造虛假信息”。我國(guó)禁止使用生成式人工智能作為材料申報(bào)、成果共同完成人的一個(gè)重要原因就是無(wú)法保證生成式人工智能提供的內(nèi)容的真實(shí)性。
中國(guó)人民大學(xué)法學(xué)院教授王利明指出:“生成式人工智能自動(dòng)生成的包含虛假信息的圖片、視頻、聲音,已經(jīng)達(dá)到了以假亂真的地步,甚至生成式AI都難以辨別其生成的圖片等是真實(shí)拍攝的還是自動(dòng)生成的?!逼渖傻膬?nèi)容已經(jīng)到了自身都難辨真假的地步,產(chǎn)業(yè)界應(yīng)該重視起來(lái)。
最后是侵害肖像權(quán)。生成式人工智能能夠自動(dòng)生成圖片、視頻的原理同生成文字一樣,同樣需要將大量的原始畫作、視頻提供給AI。在生成過(guò)程中,AI根據(jù)不同的要求產(chǎn)生不同的“作品”,需要注意的是,AI有可能會(huì)生成虛假等非法的信息。
數(shù)據(jù)已經(jīng)成為新的生產(chǎn)要素。未來(lái),數(shù)據(jù)也將會(huì)成為各大平臺(tái)爭(zhēng)搶的重要資源,一些知名網(wǎng)站、APP將進(jìn)一步封鎖數(shù)據(jù)的流出,保證優(yōu)質(zhì)的數(shù)據(jù)資源留在自身的平臺(tái)內(nèi)。而這將進(jìn)一步影響以爬取海量數(shù)據(jù)為基礎(chǔ)的大模型訓(xùn)練,長(zhǎng)此以往,生成式大模型的訓(xùn)練必定難以為繼。且當(dāng)下,我國(guó)越來(lái)越重視數(shù)據(jù)安全,這些因素都將影響生成式人工智能的良性發(fā)展。
生成式人工智能已經(jīng)深入大多數(shù)用戶的生活和工作中,面對(duì)法治越發(fā)健全和訴訟增多的雙重發(fā)難,在這里提出一些建議。
一方面,各國(guó)應(yīng)該積極完善AI領(lǐng)域的版權(quán)政策和法規(guī),以法律法規(guī)引領(lǐng)產(chǎn)業(yè)健康發(fā)展;另一方面,AIGC公司應(yīng)當(dāng)全力保障AI生成式輸出的內(nèi)容具有版權(quán)的合規(guī)性,或及時(shí)向作者支付版權(quán)費(fèi),以提高內(nèi)容的真實(shí)性和質(zhì)量,形成良性循環(huán)。
作者:孫? ?天
責(zé)編/版式:蓋貝貝
審校:王 濤?梅雅鑫
監(jiān)制:劉啟誠(chéng)