动态 版块 发帖 消息 我的
外链论坛LOGO
请勿发布违规信息!
SEO优化Lv2 
人工智能时代下:网站内容与SEO策略的革新挑战与机遇     

近段时间以来,人工智能在全球范围内刮起了一场颠覆性的风暴,无论是在SEO领域还是整个科技界,AI都成为了最炙手可热的焦点话题。回顾过去的二十多年,尽管搜索引擎算法不断迭代更新,SEO从业者亦始终紧跟步伐,不断创新优化手法,但实际上,SEO的核心理念并未发生根本转变——优质内容的创造、搜索引擎爬虫的有效抓取以及用户友好体验的优化仍是不变的主题。直至ChatGPT的横空出世,这一格局似乎出现了动摇的迹象,首次让我感受到SEO领域可能出现重大转折。


ChatGPT的登场,引发了业界对于未来SEO形态的深度思索。其生成式AI技术不仅能够自动生成高质量的内容,而且在某些情况下并不会明确标注内容出处,这就意味着,网站精心制作的内容可能被AI无偿利用,却无法转化为直接的流量回馈。面对这种局面,众多站长不禁发出疑问:若AI不再指向源头,我们为何还要继续允许搜索引擎蜘蛛抓取我们的网站内容,任由它们用于AI训练而不产生任何收益呢?


究竟如今有多少网站的内容已被用于AI训练?这是一个颇为棘手的问题,毕竟AI生成的内容并非简单的复制粘贴或组合拼接,而是基于海量数据深度学习后的原创成果。相较于Google,Bing在某种程度上更透明,会在部分回答中标注内容来源,这表明这些被标注的网站确实在一定程度上参与了AI的训练过程。


近日,《华盛顿邮报》发布的一篇文章揭示了AI训练背后的秘密——有一份包含大量网站的清单,正是这些网站构成了诸如ChatGPT之类的智能AI背后的知识库。文中还介绍了一个实用的小工具,可以帮助用户查询特定网站是否被Google用于AI训练及其在训练数据中的占比。


AI训练所需的数据源繁多且庞大,涵盖了各类已出版书籍、专业数据库、维基百科以及其他普通网站等。以Google使用的C4数据集为例,其中包含了超过一千五百万个网站的数据。通过对各网站中token(可以理解为“词汇单元”或“信息片段”)出现的频次进行分析,可以大致推断出该网站被用于训练的数据量。需要注意的是,C4数据集虽庞大,却并非Google用于AI训练的全部网站资源,因此,不在C4列表中的网站,仍有可能被纳入了Google的AI训练体系中,例如中国的知乎(zhihu.com)就难以置信地在C6中未发现任何token痕迹,但这并不排除知乎内容实际上已被用于AI训练的可能性。


事实上,已经有热心人士借助相关工具统计出了被Google用于AI训练的网站及其token占比,谷歌自身的专利文档高居榜首,紧随其后的是维基百科和Scribd。这一现象预示着一个崭新时代的到来,网站内容与SEO策略将面临前所未有的挑战与机遇:一方面,如何在维护自身内容权益的同时,适应并利用好AI带来的变革;另一方面,探索如何在AI主导的信息环境中,通过优化内容质量与结构,提升网站在AI生成搜索结果中的曝光度与引用率,从而在新一轮的SEO竞争中立于不败之地。

 0  已被阅读了155次  楼主 2024-03-07 15:25:51
回复列表

回复:人工智能时代下:网站内容与SEO策略的革新挑战与机遇

声明:本站内容为用户自主发布,不对其内容真实性负责,虽然本站会一一审核,但能力有限,如您发现违规内容,请及时联系管理员。sitemap  浙ICP备19037637号-1

主页

欢迎您的浏览

QQ联系图标

自助查询

99%的问题都能找到答案

联系站长

工作时间:9:00~17:30

微信二维码

回到顶部

向上滚动到顶部

个人中心

去个人首页看看吧

转到底部

向下滚动到底部

您的IP:18.97.14.89,2025-02-09 16:42:38,Processed in 0.10538 second(s).
外链论坛里的文章帖子图片属于用户自主发表,仅代表作者个人意见,与本网站立场无关,本站不承担任何法律责任!