快科技本日(8月22日)最新资讯显现,近期百度百科接纳了一项主要行动,对包含谷歌、必应在内的大都搜刮引擎实行了拜候限定,此举据猜测旨在提防这些搜刮引擎及未经受权的爬虫法式私行抓取其内容,进而用于AI模子的练习,以掩护其内容的独家性和版权宁静。
深切察看百度百科的robots.txt设置设备摆设文件,不难发明,以后仅对百度搜刮、搜狗搜刮、中国搜刮(Chinaso)、YYSpider和宜搜搜刮(EasouSpider)等多数几家颠末严酷挑选的搜刮引擎开放了内容抓取权限,这一变更标记着百度百科在内容办理上迈出了加倍邃密化的一步。

与此同时,谷歌搜刮、必应搜刮、微软MSN的Bingbot、UC阅读器的Yisouspider,和一切未获明白受权的搜刮引擎爬虫,均已被明白参加了制止拜候的黑名单中,此举无疑为百度百科的内容宁静筑起了一道坚固的防地。
值得注重的是,固然360搜刮并未在封禁名单中间接说起,但按照百度百科的“白名单”战略,任何未取得明白受权的爬虫均被视为不法拜候,这也象征着360搜刮及其他未获允许的搜刮引擎一样没法自在抓取百度百科的内容。
但是,虽然百度百科接纳了如斯周密的防护办法,但“道高一尺,魔高一丈”,仍有能够存在手艺崇高高贵的爬虫经由过程各类隐蔽手腕绕开限定,延续不法获得并操纵其内容。是以,百度百科的这一行动更多被视为一种主动的进攻姿势,旨在晋升内容掩护认识,而非与日俱增的处理计划。将来,跟着手艺的不时前进和法令律例的完美,信任内容掩护的题目将获得加倍周全和有用的处理。




























