在8月10日的“站长门诊开放日”活动中Lee为站长们答疑。Lee这个帐号是来自百度网页搜索产品市场部。
百度网页搜索产品市场部对外界而言,这个团队就是个传说,在百度内部,这个团队也同样带着极其浓郁的神秘色彩,也因神秘,外界对他们充满了好奇和猜测,甚至还有一些误解。
下面为百度站长门诊开放日问答整理:
keywords(关键词)还有用吗?
meta keywords早就进历史的垃圾堆了,我们会直接忽略。
网站快照一直停留不动是什么原因?
关于快照的更新时间,尤其是首页的更新时间,我一直建议不要参考,这个时间跟网站的价值没有任何的关系。
在百度眼中什么是高质量的站点?
关于这个问题,请大家换位思考一下,作用一个搜索引擎,所追求的最终目标是为用户提供最有价值的信息,我们希望大家有一个最低限度的判断,那就是将自己作为一个普通的用户,通过搜索引擎搜索到自己的网站时,自己相不相信自己网站上的信息,自己觉不觉得这是互联网上最好的信息。
我们通过反馈渠道收集到声称自己网站是原创、高质量网站的反馈,其中80%多都是无效的,甚至大量声称老中医3-5天治愈绝症的网站,通篇内容读不通,声称自己是高质量的网站。
如果互联网非常纯洁,那我们也不会花费大量人力去识别网站的质量,也就不会有误伤。
但互联网越来越不保险,我们的策略也越来越复杂,只要对技术有一定了解的人,都应该知道误伤是无法避免的,我们也尽最大的努力将误伤降到最低限度。
搜索引擎对网页价值的判断,不是从字数出发的,而是从其资源质量出发的,只要是对用户有价值的内容,不论长短,我们都会给一个合理的评价,如果这个网站上提供的内容或者服务非常有价值,无可替代,那对搜索引擎来讲,就是一个高质量的网站。
link标签 rel=canonical 属性百度支持吗? 这个问题很关键,我们有大量同质的内容。
canonical 目前不支持,不过已计划要支持了。(注:canonical 标签可以为搜索引擎指明当前页面权重的侧重点在于哪个链接,从而有助于 SEO。)
我有一个商城类网站,因为会经常产生大量下架商品,产生下架商品后,程序会返回一个只有模板的空页面,没有任何具体商品信息。以前我把这些下架商品所在的页面设置为404,在日志里看到大量的404状态码,请问这样会不会影响我网站的质量,长期下去造成收录和排名下降?
我们鼓励站长为死链返回规范的404代码,不欢迎给死链返回200代码。只要是正确的返回404,对网站没有任何影响,还可以减少baiduspider抓取给服务器造成的负担。如果死链数量较多,建议通过站长平台提交死链列表,更高效一些。
虽然百度的官方不承认有降权蜘蛛的说法,但是例如:123.125.*段的蜘蛛出现,网站在排名、收录上快照、都会存在异常,是否可以理解为这段IP的蜘蛛虽然不是降权蜘蛛,但可以认为是自身网站出现了问题,百度对于网站的考察和警示呢?是百度对网站所提出的警告呢?
Baiduspider只有一种,不存在什么降权蜘蛛。不过你所提到的对网站的警示,我们会在站长平台中考虑。(终于知道可能有降权蜘蛛的存在。)
一个专题专栏,里面大都是一些静态页面,但是百度一直不收录,是什么原因?
根据你提供的query,我找出这个栏目随便看了几个网页,都收录了,贵站犯了一个非常常见的错误,同一个网页,有两种以上的url形式,我们收录的,是不带index.aspx的那种。建议参考《百度搜索引擎优化指南》中关于url规范的部分。
为什么带www的网站不稳定,有时候被收录,有时候又找不到了。
百度对于一篇原创文章的判断到底是怎样的标准?现在凭借发布时间来判断两篇相同文章哪篇是原创还无法实现,这一点百度说明过,但是现在的情况是很多新站,权重低的网站站长自己辛辛苦苦一点点码字写出来 的原创文章,被高权重网站转载,虽然注明了出处,但是对于百度来说,如果仅仅因为转载网站权重高就判断为原创文章,那就意味着低权重网站被误判为抄袭或转 载,这样显然很不公平,请问对于判断文章原创问题,百度搜索团队是否有解决方案,或者直接回答我们“百度是否能判断出哪篇文章才是原创的”。
我们正在计划在原创方面做一些改进。原创识别是一个很有技术含量的话题,不是简单的几种规则就能做好的,互联网很复杂,人心更复杂,不过我们有信心逐步的去解决这个问题,其中也需要站长朋友多提供相关的问题和建议。
被误伤的网站有没有恢复的期限,是半年,还是一年?或者更长?
我们的策略都会定期的review/改进,不同的策略有不同的周期,天级到月级不等,我们会持续的改进策略,以减少误伤。
百度对于网站分隔符、网站结构是否有自己的标准?
网站的结构在保证用户体验的前提下,适当的做一些对spider的优化会有助于收录,我们推荐扁平的树型结构。《百度搜索引擎优化指南》中有详细的说明。
目前医疗网站内容同质化严重,请问百度是如何来判定。
关于同质内容,先透露一下,我们正在设计一套较完善的原创识别算法,不久之后也会邀请站长朋友给我们一些建议及抄袭的实例用做算法调整之用。
一个网页多大合适,有的页面大小过200k,我一般都注意在110k以内,这个有数字标准吗?
网页大小建议以用户能接受的程度为准,对百度来讲,我们能接受的网页大小肯定已经超出普通网页平均大小的数十倍,完全不用担心。
写在最后:
还是引用Lee的一句话作为结束语:“我每天为了迎合你不惜牺牲自己的休息时间手工外链到凌晨三点”,这不是百度倡导的运营行为,我们倡导优质内容,大量发外链很可能被判为超链作弊,请好好运营优质原创内容,谢谢!
版权所有@2004-2020 四川省巨高科技有限公司 备案号:蜀ICP备12009681号 网址:www.chinaspc.com
手机:13880394188 联系人:马先生 在线业务咨询:
业务洽谈地址:成都市高新区环球中心E2区5楼 地址:成都农高区创新中心(温江区科锦路355号)