百度动态
百度移动搜索建站优化白皮书

为了让百度搜索的重要合作伙伴——广大站长充分了解百度搜索引擎规则,并根据规则合理安全建设网站、优化网站,更好的获取搜索流量;百度搜索资源平台历时3个月,探访搜索内部各个技术部门,将百度搜索内部技术原理抽丝剥茧,化零为整,整理出《百度移动搜索建站优化白皮书》,希望与各位站长携手,为用户提供一个健康安全高效的搜索环境。

1  前言

手机百度是一款有6亿用户在使用的手机搜索客户端,在中文用户信息获取上发挥了不可替代的作用;移动搜索引擎每日分发上亿流量给到优质安全网站,来满足用户的搜索需求;而对于广大的站长来说,优质安全的网站有助于在搜索引擎中获得良好的排序和展现,从而吸引更多用户,获得更多流量。

移动搜索引擎优化,指从建站开始到吸引用户,贯穿所有流程,为了让百度搜索的重要合作伙伴——广大站长充分了解百度搜索引擎规则,并根据规则合理安全建设网站、优化网站,更好的获取搜索流量;百度搜索资源平台历时3个月,探访搜索内部各个技术部门,将百度搜索内部技术原理抽丝剥茧,化零为整,整理出《百度移动搜索建站优化白皮书》,希望与各位站长携手,为用户提供一个健康安全高效的搜索环境。

2  网站建设
2.1  域名选择

网站域名选择,不仅能快速直观让用户了解网站定位,域名设置,更会影响搜索对网站的抓取情况。因此,选择简单好记且安全的域名,是网站搭建前期最重要的一步。

2.2  内容发布系统

内容发布系统,无论是网站自建还是使用第三方建站系统,百度都是支持的;所有发布系统,除遵循有条理、逻辑清晰建站,还要注意网站搭建的安全问题,避免网站安全隐患,才能更好的提升网站价值。

2.3  网站结构

合理设置网站结构,是网站被快速抓取、获得搜索流量的基础;因网站结构设置不合理,导致网站无法被快速识别抓取的事例在百度日常反馈中经常见到,且网站换域名也会对网站造成一定损失,故希望各位站长从建站之初重视网站结构设置,避免不必要的损失。

2.4  服务商/自建服务器

选择服务商或者自建服务器,对网站搭建都是十分重要基础的一环;服务器安全和稳定将直接影响百度搜索引擎对网站的整体判断。


更多内容进入百度资源搜索查看:http://ziyuan.baidu.com/wiki/1702
随着pc端与移动端网站的融合,原有索引量数据的展现逻辑已经不足以满足用户的需求,3月中旬特别对移动端的site算法进行了升级,并已正式上线!

1、移动端增加site语法卡片,直观展示网站在移动端的索引量;

点击在新窗口中浏览此图片

2、移动端site语法与站长平台的索引量工具打平,保证统计方式和统计数量的一致性;

点击在新窗口中浏览此图片

3、移动端增加适配索引量,通过pc适配过来的移动url也可以通过site或者搜索url进行展现;
2017,百度搜索全新出发:搜索生态向内容生态转变。秉承用户至上的理念,公平开放的原则,一系列优质内容扶持计划紧密筹备:

•  新站收录提速:蝶变行动新、好站点扶持计划即将再次开启!

•   原创保护:保护站点原创内容,正在强势升级,敬请期待!

•   阿拉丁产品开放:原大站专享的阿拉丁产品有望为更多优质站点开放!

•  Feeds资讯流展现:手机百度首页主动推荐资讯流,助力网站品牌展现!

想加入以上所有计划的前提是:完善您的站点领域信息。

完善办法:工具-搜索展现-站点属性-站点领域

部分站点百度搜索已默认推荐相关领域,站长可根据实际情况修改,每个站点最多可选择3个领域。

请尽量完善每一个站点的领域信息,准确的信息有助于百度搜索识别数据,从而帮助网站享受相关垂类的资源及权限。


站点领域工具请点击:

http://zhanzhang.baidu.com/property/index
百度上线“蓝天算法”,严厉打击低质软文侵扰用户

       商业软文推广,对于这个词大家应该并不陌生,利用各大新闻源做推广,来影响搜索引擎的展现排序;利用新闻源软文做虚假营销,这些都是百度搜索的禁区,因为,这些内容不仅影响到用户体验,在信息的传播过程中还会错误的引导网民的消费决策。

  其实,近年来百度搜索一直在通过各种手段打击低质量商业内容破坏用户体验的行为,比如之前的“冰桶系列算法、石榴算法”,都是通过内容整治减少低质量页面,让用户可以通过搜索更快更精准的访问到自己想要的信息。

  近日,百度搜索正式上线“蓝天算法”,进一步打击部分新闻源站点通过出售目录的形式,收费发布低质软文,破坏用户体验的行为。

  注:百度新闻源是指符合百度等搜索引擎种子新闻站的标准,新闻源内的站点是经过百度甄选,拥有高质量的、与站点自身主题相匹配的原创资讯内容,在其目标领域内具有一定的用户认知度和一定规模的新闻站点。

  百度反作弊团队发现仍有部分新闻源站点通过出售软文、目录的形式,发布大量低质内容,用户在搜索时出现大量商业信息,不堪其扰。针对此情况,百度升级“蓝天算法”,旨在打击干扰用户搜索的新闻源商软现象,触发“蓝天算法”问题站点将被清理出新闻源,同时受到降低在百度搜索系统中的评价的惩罚。

  百度搜索在此建议所有新闻源站点尽早自查网站内容,有则改之无则加勉。为了方便站点自查,百度站长平台特制作新闻源专题,站点可通过教育文章进行网站检查整改:https://zhanzhang.baidu.com/act/baidunews,被惩罚的站点清理相关内容后还可以再次申请新闻源,我们会根据内容整改情况判定是否符合新闻源收录要求。

  “蓝天算法” 升级后将长期持续政治此类现象,并向大众开通举报通道,如有发现新闻源软文售卖行为,可通过站长平台新闻源反馈中心进行反馈情况,平台会根据内容真实性做出及时处理,还搜索用户一片健康搜索的蓝天!
  反馈地址:https://zhanzhang.baidu.com/feedback
百度MIP闪电计划已开启,赶快加入享受优待
点击在新窗口中浏览此图片

一、MIP是什么?

MIP 全称 Mobile Instant Pages,移动网页加速器,是百度提出的页面加速解决方案。
MIP从前端渲染和页面网络传输两方面进行优化,杜绝页面渲染中的堵塞问题,提升页面展现速度。
MIP 官网: www.mipengine.org

二、MIP能解决哪些问题?
网络连接优化
代码执行效率优化
资源元素生命周期
资源缓存
资源加载控制
以及更多...

三、MIP四大收益
MIP化成本:新网站按照MIP规范建立,无额外成本。已建立的千万级流量站点
1个全人力,完成MIP改造,耗时一周

1、瞬间加速:移动页面速度提升30-80%,
支持在搜索引擎中沉浸式浏览,
平均耗时最高降低80%

2、提升流量:搜索结果页专属icon,MIP页
在搜索引擎中的点击量提升可
高达13%,到达率提升5-40%

3、搜索优待:百度搜索会给予MIP结果页页
面级别优待,抓取、收录、排
序一脉相承

4、体验优化:MIP页面符合百度移动友好度
规范,页面内容将以更友好的
方式瞬时到达用户

加入计划,刻不容缓

截至目前超过10.2亿个页面完成MIP化改造

MIP闪电计划:即日起,愿意进行MIP改造的站点,请点击立即加入,

首批完成改造站点不仅可以获得MIP专属标识、搜索优待等,还可获得站长学院公开课线上听课权

点击进入:http://zhanzhang.baidu.com/act/Mipplan
Tags: ,

哪些网页无法建入索引库 不指定

元创 , 2014/12/19 09:57 , 百度动态 , 评论(1) , 阅读(5780) , Via 本站原创
哪些网页无法建入索引库
    上述优质网页进了索引库,那其实互联网上大部分网站根本没有被百度收录。并非是百度没有发现他们,而是在建库前的筛选环节被过滤掉了。那怎样的网页在最初环节就被过滤掉了呢:
        1, 重复内容的网页:互联网上已有的内容,百度必然没有必要再收录。
        2, 主体内容空短的网页
        1)有些内容使用了百度spider无法解析的技术,如JS、AJAX等,虽然用户访问能看到丰富的内容,依然会被搜索引擎抛弃
        2)加载速度过慢的网页,也有可能被当作空短页面处理,注意广告加载时间算在网页整体加载时间内。
        3)很多主体不突出的网页即使被抓取回来也会在这个环节被抛弃。
        3, 部分作弊网页

相关文章:
哪些网页无法建入索引库
百度优先建重要库的原则
新链接重要程度判断
造成Baiduspider抓取异常的原因
Baiduspider抓取频次原则及调整方法
Baiduspider抓取过程中涉及的网络协议
Baiduspider 主要抓取策略类型
Spider抓取系统的基本框架

百度优先建重要库的原则 不指定

元创 , 2014/12/19 09:57 , 百度动态 , 评论(0) , 阅读(2771) , Via 本站原创
百度优先建重要库的原则
    Baiduspider抓了多少页面并不是最重要的,重要的是有多少页面被建索引库,即我们常说的“建库”。众所周知,搜索引擎的索引库是分层级的,优质的网页会被分配到重要索引库,普通网页会待在普通库,再差一些的网页会被分配到低级库去当补充材料。目前60%的检索需求只调用重要索引库即可满足,这也就解释了为什么有些网站的收录量超高流量却一直不理想。

那么,哪些网页可以进入优质索引库呢。其实总的原则就是一个:对用户的价值。包括却不仅于:
        1,有时效性且有价值的页面:在这里,时效性和价值是并列关系,缺一不可。有些站点为了产生时效性内容页面做了大量采集工作,产生了一堆无价值面页,也是百度不愿看到的.
        2,内容优质的专题页面:专题页面的内容不一定完全是原创的,即可以很好地把各方内容整合在一起,或者增加一些新鲜的内容,比如观点和评论,给用户更丰富全面的内容。
        3,高价值原创内容页面:百度把原创定义为花费一定成本、大量经验积累提取后形成的文章。千万不要再问我们伪原创是不是原创。
        4,重要个人页面:这里仅举一个例子,科比在新浪微博开户了,需要他不经常更新,但对于百度来说,它仍然是一个极重要的页面。

相关文章:
哪些网页无法建入索引库
百度优先建重要库的原则
新链接重要程度判断
造成Baiduspider抓取异常的原因
Baiduspider抓取频次原则及调整方法
Baiduspider抓取过程中涉及的网络协议
Baiduspider 主要抓取策略类型
Spider抓取系统的基本框架

新链接重要程度判断 不指定

元创 , 2014/12/19 09:56 , 百度动态 , 评论(0) , 阅读(3184) , Via 本站原创
新链接重要程度判断

    好啦,上面我们说了影响Baiduspider正常抓取的原因,下面就要说说Baiduspider的一些判断原则了。在建库环节前,Baiduspide会对页面进行初步内容分析和链接分析,通过内容分析决定该网页是否需要建索引库,通过链接分析发现更多网页,再对更多网页进行抓取——分析——是否建库&发现新链接的流程。理论上,Baiduspider会将新页面上所有能“看到”的链接都抓取回来,那么面对众多新链接,Baiduspider根据什么判断哪个更重要呢?两方面:

第一,对用户的价值:
        1,内容独特,百度搜索引擎喜欢unique的内容
        2,主体突出,切不要出现网页主体内容不突出而被搜索引擎误判为空短页面不抓取
        3,内容丰富
        4,广告适当

第二,链接重要程度:
        1,目录层级——浅层优先
        2,链接在站内的受欢迎程度

相关文章:
哪些网页无法建入索引库
百度优先建重要库的原则
新链接重要程度判断
造成Baiduspider抓取异常的原因
Baiduspider抓取频次原则及调整方法
Baiduspider抓取过程中涉及的网络协议
Baiduspider 主要抓取策略类型
Spider抓取系统的基本框架
分页: 1/7 第一页 1 2 3 4 5 6 7 下页 最后页 [ 显示模式: 摘要 | 列表 ]