先談談什麼是 HTTPS:
HTTPS(Secure Hypertext Transfer Protocol) 安全超文字傳輸協議 它是一個安全通訊通道,它基於 HTTP 開發,用於在客户計算機和服務器之間交換資訊。它使用安全套接字層 (SSL) 進行資訊交換,簡單來説它是 HTTP 的安全版。 它是由 Netscape 開發並內建於其瀏覽器中,用於對資料進行壓縮和解壓操作,並返回網絡上傳送回的結果。
HTTPS 實際上應用了 Netscape 的安 全全套接字層 (SSL) 作為 HTTP 應用層的子層。 (HTTPS 使用埠 443,而不是象 HTTP 那樣使用埠 80 來和 TCP/IP 進行通訊。)SSL 使 用 40 位關鍵字作為 RC4 流加密演算法,這對於商業資訊的加密是合適的。 HTTPS 和 SSL 支持使用 X 。 509 數字認證,如果需要的話多用户可以確認傳送者是誰。
HTTPS 和 HTTP 的區別:
https 協議需要到 ca 申請證書,一般免費證書很少,需要交費。
http 是超文字傳輸協議,資訊是明文傳輸,https 則是具有安全性的 ssl 加密傳輸協議 http 和 https 使用的是完全不同的連線方式用的埠也不一樣:前者是 80,後者是 443 。
http 的連線很簡單,是無狀態的 HTTPS 協議是由 SSL+HTTP 協議構建的可進行加密傳輸、身份認證的網絡協議 要比 http 協議安全 HTTPS 解決的問題:
1 、信任主機的問題。 採用 https 的 server 必須從 CA 申請一個用於證明服務器用途型別的證書。
改證書只有用於對應的 server 的時候,客户度才信任次主機。所以目前所有的銀行系統網站,關鍵部分應用都是 https 的。 客户通過信任該證書,從而信任了該主機。其實這樣做效率很低,但是銀行更側重安全。 這一點對我們沒有任何意義,我們的 server,採用的證書不管自己 issue 還是從公眾的地方 issue, 客户端都是自己人,所以我們也就肯定信任該 server 。
2 、通訊過程中的資料的泄密和被竄改。
1)一般意義上的 https, 就是 server 有一個證書。
a) 主要目的是保證 server 就是他聲稱的 server 。這個跟點一樣。
b) 服務端和客户端之間的所有通訊,都是加密的。
i 、具體講,是客户端產生一個對稱的金鑰,通過 server 的證書來交換金鑰。 一般意義上的握手過程。
ii 、加下來所有的資訊往來就都是加密的。 第三方即使截獲,也沒有任何意義。因為他沒有金鑰。 當然竄改也就沒有什麼意義了。
2)少許對客户端有要求的情況下,會要求客户端也必須有一個證書。
a) 這裏客户端證書,其實就類似表示個人資訊的時候,除了多用户名稱/密碼, 還有一個 CA 認證過的身份。 應為個人證書一般來説上別人無法模擬的,所有這樣能夠更深的確認自己的身份。
b) 目前少數個人銀行的版是這種做法,具體證書可能是拿 U 盤作為一個備份的載體。像我用的交通銀行的網上銀行就是採取的這種方式。 HTTPS 一定是繁瑣的。
a) 本來簡單的 http 協議,一個 get 一個 response 。由於 https 要還金鑰和確認加密演算法的需要。單握手就需要 6/7 個往返。
i 、任何應用中,過多的 round trip 肯定影響效能。
b) 接下來才是具體的 http 協議,每一次響應或者請求, 都要求客户端和服務端對會話的內容做加密/解密。
i 、儘管對稱加密/解密效率比較高,可是仍然要消耗過多的 CPU,為此有專門的 SSL 晶片。 如果 CPU 信能比較低的話,肯定會降低效能,從而不能 serve 更多的請求。
今年 5 月中旬,百度完成了全站 https 化。隨後,以維基百科為的多家網站也表示將實現全面 HTTPS 化。 HTTPS 是以安全為目標的 HTTP 通道,簡單講是 HTTP 的安全版。百度曾在 5 月下旬的公告中明確表示 “百度視同一個域名的 http 版和 https 版為一個站點,優先收錄 https 版。” 因而越來越多的站點也開始考慮 Https 化問題,但仍有不少站羣站長擔心 “網站 https 化對站點流量是否會產生負面影響、怎樣才能避免這種影響?” 等問題。
對此,百度是如何回覆的呢?
問:對於 http 和 https,Baiduspider 會不會區別對待?
答:不會區別對待。説得再全整一些:Baiduspider 在對於 http 和 https 站點的排程和解析方面沒有任何區別。至於建索引庫,年初的時候百度進行過升級,目前對 https 站點也是全力支持的。
問:Baiduspider 可以抓取 https 網站嗎?站點 https 以後應該做些什麼?
答:在抓取方面,Baiduspider 完全支持 https 連結的抓取。站羣站長需要注意的一點是要保證 http 連結到 https 連結良好的重定向(使用 301 或 302),這樣百度可以做到無縫切換。另外可以使用連結提交工具提交 https 連結,儘快通知百度。
問:站點切換 https 以後,新產生的 https 頁面,百度會將其視為新頁面重新收錄?重新計算排名?
答:不是的,不涉及重新收錄的問題。
問:https 以後可以使用改版工具向百度提交 http 與 https 的對應關係嗎?
答:http 站和 https 站會被百度視為同一個站點,不屬於改版,不適用改版工具。
問:https 以後,排序有可能發生什麼變化?
答:在 rank 方面,現在對兩種連結無區別對待,從安全性考慮,以後可能會優待 https 的連結。