先谈谈什么是 HTTPS:

HTTPS(Secure Hypertext Transfer Protocol) 安全超文字传输协议 它是一个安全通讯通道,它基于 HTTP 开发,用于在客户计算机和服务器之间交换资讯。它使用安全套接字层 (SSL) 进行资讯交换,简单来说它是 HTTP 的安全版。 它是由 Netscape 开发并内建于其浏览器中,用于对资料进行压缩和解压操作,并返回网络上传送回的结果。

HTTPS 实际上应用了 Netscape 的安 全全套接字层 (SSL) 作为 HTTP 应用层的子层。 (HTTPS 使用埠 443,而不是象 HTTP 那样使用埠 80 来和 TCP/IP 进行通讯。)SSL 使 用 40 位关键字作为 RC4 流加密演算法,这对于商业资讯的加密是合适的。 HTTPS 和 SSL 支持使用 X 。 509 数字认证,如果需要的话多用户可以确认传送者是谁。

HTTPS 和 HTTP 的区别:

https 协议需要到 ca 申请证书,一般免费证书很少,需要交费。

http 是超文字传输协议,资讯是明文传输,https 则是具有安全性的 ssl 加密传输协议 http 和 https 使用的是完全不同的连线方式用的埠也不一样:前者是 80,后者是 443 。

http 的连线很简单,是无状态的 HTTPS 协议是由 SSL+HTTP 协议构建的可进行加密传输、身份认证的网络协议 要比 http 协议安全 HTTPS 解决的问题:

1 、信任主机的问题。 采用 https 的 server 必须从 CA 申请一个用于证明服务器用途型别的证书。

改证书只有用于对应的 server 的时候,客户度才信任次主机。所以目前所有的银行系统网站,关键部分应用都是 https 的。 客户通过信任该证书,从而信任了该主机。其实这样做效率很低,但是银行更侧重安全。 这一点对我们没有任何意义,我们的 server,采用的证书不管自己 issue 还是从公众的地方 issue, 客户端都是自己人,所以我们也就肯定信任该 server 。

2 、通讯过程中的资料的泄密和被窜改。

1)一般意义上的 https, 就是 server 有一个证书。

a) 主要目的是保证 server 就是他声称的 server 。这个跟点一样。

b) 服务端和客户端之间的所有通讯,都是加密的。

i 、具体讲,是客户端产生一个对称的金钥,通过 server 的证书来交换金钥。 一般意义上的握手过程。

ii 、加下来所有的资讯往来就都是加密的。 第三方即使截获,也没有任何意义。因为他没有金钥。 当然窜改也就没有什么意义了。

2)少许对客户端有要求的情况下,会要求客户端也必须有一个证书。

a) 这里客户端证书,其实就类似表示个人资讯的时候,除了多用户名称/密码, 还有一个 CA 认证过的身份。 应为个人证书一般来说上别人无法模拟的,所有这样能够更深的确认自己的身份。

b) 目前少数个人银行的版是这种做法,具体证书可能是拿 U 盘作为一个备份的载体。像我用的交通银行的网上银行就是采取的这种方式。 HTTPS 一定是繁琐的。

a) 本来简单的 http 协议,一个 get 一个 response 。由于 https 要还金钥和确认加密演算法的需要。单握手就需要 6/7 个往返。

i 、任何应用中,过多的 round trip 肯定影响效能。

b) 接下来才是具体的 http 协议,每一次响应或者请求, 都要求客户端和服务端对会话的内容做加密/解密。

i 、尽管对称加密/解密效率比较高,可是仍然要消耗过多的 CPU,为此有专门的 SSL 晶片。 如果 CPU 信能比较低的话,肯定会降低效能,从而不能 serve 更多的请求。

今年 5 月中旬,百度完成了全站 https 化。随后,以维基百科为的多家网站也表示将实现全面 HTTPS 化。 HTTPS 是以安全为目标的 HTTP 通道,简单讲是 HTTP 的安全版。百度曾在 5 月下旬的公告中明确表示 “百度视同一个域名的 http 版和 https 版为一个站点,优先收录 https 版。” 因而越来越多的站点也开始考虑 Https 化问题,但仍有不少站群站长担心 “网站 https 化对站点流量是否会产生负面影响、怎样才能避免这种影响?” 等问题。

对此,百度是如何回复的呢?

问:对于 http 和 https,Baiduspider 会不会区别对待?

答:不会区别对待。说得再全整一些:Baiduspider 在对于 http 和 https 站点的排程和解析方面没有任何区别。至于建索引库,年初的时候百度进行过升级,目前对 https 站点也是全力支持的。

问:Baiduspider 可以抓取 https 网站吗?站点 https 以后应该做些什么?

答:在抓取方面,Baiduspider 完全支持 https 连结的抓取。站群站长需要注意的一点是要保证 http 连结到 https 连结良好的重定向(使用 301 或 302),这样百度可以做到无缝切换。另外可以使用连结提交工具提交 https 连结,尽快通知百度。

问:站点切换 https 以后,新产生的 https 页面,百度会将其视为新页面重新收录?重新计算排名?

答:不是的,不涉及重新收录的问题。

问:https 以后可以使用改版工具向百度提交 http 与 https 的对应关系吗?

答:http 站和 https 站会被百度视为同一个站点,不属于改版,不适用改版工具。

问:https 以后,排序有可能发生什么变化?

答:在 rank 方面,现在对两种连结无区别对待,从安全性考虑,以后可能会优待 https 的连结。