200個(gè)“AI垃圾網(wǎng)站”追蹤 信息雜亂無章毫無可信度_當(dāng)前看點(diǎn)

2023-06-28 16:40:12來源:中關(guān)村在線  


(資料圖片)

隨著生成式AI的成本降低,越來越多的“垃圾網(wǎng)站”通過使用爬蟲抓取其他網(wǎng)站內(nèi)容,并利用AI重新生成信息。據(jù)報(bào)道,目前已經(jīng)追蹤到超過200個(gè)此類網(wǎng)站。 今年年初,一家機(jī)構(gòu)開始標(biāo)記這些使用AI生成內(nèi)容的網(wǎng)站。在今年四月份,他們登記了49個(gè)相關(guān)網(wǎng)站,到了六月已經(jīng)超過200個(gè)。這些被稱為“AI垃圾場(chǎng)”的網(wǎng)站缺乏人類監(jiān)管,信息雜亂無章,沒有任何可信度,其存在的目的只是為了從在線廣告中獲取收益。 調(diào)查顯示,這些“垃圾網(wǎng)站”以誘導(dǎo)用戶點(diǎn)擊訪問為主,通過顯示的廣告賺取收入。

其中有一個(gè)名為TNN的網(wǎng)站每天可以生成超過1200篇文章,該網(wǎng)站完全由爬蟲和AI腳本控制。 到六月26日為止,已經(jīng)追蹤標(biāo)記了277個(gè)“AI垃圾網(wǎng)站”,這些網(wǎng)站涵蓋了13種語(yǔ)言,包括中文、英文、阿拉伯語(yǔ)、捷克語(yǔ)、荷蘭語(yǔ)、法文、印尼文、意大利文、韓文、葡萄牙語(yǔ)、菲律賓語(yǔ)、泰文及土耳其語(yǔ)等。 事實(shí)上,這種利用爬蟲批量抓取其他媒體信息,并在抓取的頁(yè)面中加入大量廣告,并通過吸引訪問者獲取廣告補(bǔ)貼的網(wǎng)站,在AI時(shí)代來臨之前就已經(jīng)相當(dāng)常見,而生成式AI的普及只是降低了這些網(wǎng)站的運(yùn)營(yíng)成本。 同時(shí),一些在線廣告平臺(tái)的政策明確表示,不允許在自動(dòng)生成的內(nèi)容網(wǎng)站文章中使用它們的廣告API,但這些“垃圾網(wǎng)站”大多數(shù)都違反了這一政策。

標(biāo)簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀