《移動搜索建站優(yōu)化白皮書》百度發(fā)布--網(wǎng)站建設
2??網(wǎng)站建設
2.1??域名選擇
網(wǎng)站域名選擇,不僅能快速直觀讓用戶了解網(wǎng)站定位,域名設置,更會影響搜索對網(wǎng)站的抓取情況。因此,選擇簡單好記且安全的域名,是網(wǎng)站搭建前期最重要的一步。
2.1.1??域名選擇的注意事項
網(wǎng)站搭建之初,對網(wǎng)站域名選擇,建議域名獨立,簡單好記;獨立移動站域名選擇也遵循此規(guī)則。
移動站的域名需與PC站域名分開,移動站不建議與PC站公用一個域名;比如PC網(wǎng)站域名建議是www.test.com,對應移動站的域名是m.test.com,而不是www.test.com/m/的形式;如果是自適應網(wǎng)站可不考慮此情況。
網(wǎng)站域名選擇中,主要有以下兩點建議:
√?建議使用比較常見的域名后綴,如.com\.cn\.net等;
√?如果網(wǎng)站追求個性化使用罕見域名后綴,為了保證搜效果,請來百度搜索資源平臺(原百度站長平臺)進行站點驗證。
2.1.2??使用子域名或目錄
網(wǎng)站是否需要建立子域名,或是劃分多級目錄,可根據(jù)網(wǎng)站自身定位及網(wǎng)站內(nèi)容量級決定。通常來說,綜合類或內(nèi)容量較多的網(wǎng)站,可將內(nèi)容按照不同二級域明確劃分;而如果網(wǎng)站內(nèi)容較少,不建議網(wǎng)站開設過多的子域名。
舉例來說,blog形式站點,有的網(wǎng)站給到每個blog作者單獨的三級域,但如果作者發(fā)布頻率較低,整個三級域都是更新頻率很低的狀態(tài),過低的發(fā)布頻率對搜索引擎來說是不友好的。
2.2??內(nèi)容發(fā)布系統(tǒng)
內(nèi)容發(fā)布系統(tǒng),無論是網(wǎng)站自建還是使用第三方建站系統(tǒng),百度都是支持的;所有發(fā)布系統(tǒng),除遵循有條理、邏輯清晰建站,還要注意網(wǎng)站搭建的安全問題,避免網(wǎng)站安全隱患,才能更好的提升網(wǎng)站價值。
2.2.1??自建內(nèi)容發(fā)布系統(tǒng)
網(wǎng)站自建內(nèi)容發(fā)布系統(tǒng),注意事項包括:
√?主體內(nèi)容清晰且能夠很好的識別與分辨;
√?后臺發(fā)布時間切勿自行設置,遵循發(fā)布時間與展示時間一致;
√?內(nèi)容發(fā)布系統(tǒng)中各表單設置合理,如對tag標簽的設置不宜過多、不宜羅列關(guān)鍵詞;
√?分類劃分明確,分類主題的文章對應發(fā)布到相應分類下;
√?題文相符,切勿掛羊頭賣狗肉,欺騙搜索引擎流量,損傷用戶體驗;
√?段落清晰合理、字體大小適中、字體顏色切勿使用與背景色相近的顏色;
√?發(fā)布內(nèi)容目錄劃分清晰,具體參考2.3章節(jié)中網(wǎng)站結(jié)構(gòu)設置。
2.2.2??第三方發(fā)布系統(tǒng)
使用第三方發(fā)布系統(tǒng)建站,需要站長關(guān)注以下注意事項:
√?模板主題不建議頻繁更換;
√?類似wordpress等系統(tǒng),不建議使用過多插件,會影響網(wǎng)頁打開速度;
√?URL偽靜態(tài)的處理,命名規(guī)范、層級清晰;
√?開源建站系統(tǒng)存在較多安全隱患,使用過程中務必做一些安全上的設置和優(yōu)化。
2.2.3 ?頁面生成規(guī)范
無論網(wǎng)站自建發(fā)布系統(tǒng),還是網(wǎng)站使用第三方建站系統(tǒng),網(wǎng)站頁面的生成,都應注意以下幾點:?
√??網(wǎng)頁結(jié)構(gòu)清晰、各分類名稱設置醒目;
√?導航、面包屑導航設置合理,機器可讀、位置突出,用戶能很好得知所訪問頁面在網(wǎng)站中的位置;
√?不存在遮擋主體內(nèi)容的廣告元素;
√?無三俗圖文、音頻元素;
注意網(wǎng)站搭建系統(tǒng)安全問題,杜絕網(wǎng)站安全隱患。
訪問請求中的content-type需要根據(jù)對應的類型進行正確設置,圖示如下:
除此之外,關(guān)于頁面規(guī)范標準,建議參考搜索學院發(fā)布的《百度搜索Mobile Friendly(移動友好度)標準V1.0》
?
2.3??網(wǎng)站結(jié)構(gòu)
合理設置網(wǎng)站結(jié)構(gòu),是網(wǎng)站被快速抓取、獲得搜索流量的基礎(chǔ);因網(wǎng)站結(jié)構(gòu)設置不合理,導致網(wǎng)站無法被快速識別抓取的事例在百度日常反饋中經(jīng)常見到,且網(wǎng)站換域名也會對網(wǎng)站造成一定損失,故希望各位站長從建站之初重視網(wǎng)站結(jié)構(gòu)設置,避免不必要的損失。
2.3.1??URL結(jié)構(gòu)設置
URL搭建是否有嚴格要求,請看以下幾點注意事項:
√?在搭建網(wǎng)站結(jié)構(gòu)、制作URL時,盡量避開非主流設計,追求簡單美即可,越簡單越平常,越好,例如URL中出現(xiàn)生僻字符,如不常見的“II”,會引起搜索引擎識別錯誤;
√?URL長度要求去掉協(xié)議頭http(s)://之后的URL長度不要超過256個字節(jié);
?√?謹慎使用#參數(shù),有效的參數(shù)不能放在#后面;可能被截斷導致網(wǎng)頁抓取異常。
2.3.2??目錄結(jié)構(gòu)設置
網(wǎng)站目錄結(jié)構(gòu)搭建是否合理,影響搜索引擎對網(wǎng)站的抓取情況,這里需要提到的是,網(wǎng)站目錄結(jié)構(gòu)無論是扁平化還是樹形結(jié)構(gòu),一般都可以被搜索引擎發(fā)現(xiàn),但有以下幾點注意事項:
√?建議不同內(nèi)容放在不同目錄或子域下,域名劃分在2.1.2網(wǎng)站域名劃分章節(jié)中有詳細提到;
√?不要使用孤島鏈接,孤島鏈接很難被搜索引擎快速發(fā)現(xiàn);若網(wǎng)站已存在大量孤島鏈接,建議使用搜索資源平臺的鏈接提交工具向百度提交數(shù)據(jù);
√?重要內(nèi)容不建議放在深層目錄,若該內(nèi)容沒有大量內(nèi)鏈指向,搜索引擎很難判斷該頁面的重要程度。
以下是圖片示例:
2.4??服務商/自建服務器
選擇服務商或者自建服務器,對網(wǎng)站搭建都是十分重要基礎(chǔ)的一環(huán);服務器安全和穩(wěn)定將直接影響百度搜索引擎對網(wǎng)站的整體判斷。
2.4.1??域名服務
2.4.1.1??域名服務&域名部署
關(guān)于域名服務和域名部署,有以下注意事項:
√?站長在域名部署中請仔細各環(huán)節(jié)問題,不要出現(xiàn)域名部署錯誤情況;
√?不建議網(wǎng)站進行泛解析,若網(wǎng)站爆發(fā)大規(guī)模泛解析,且影響惡劣,則會受到搜索策略打壓;
√?盡量選擇優(yōu)質(zhì)域名服務商。
2.4.2??服務器
做網(wǎng)站還有非常重要的一環(huán),就是服務器的選擇,那服務器選擇中,無論是虛擬主機、云主機還是獨立的服務器,都應該注意以下四點:
√?中文網(wǎng)站不建議選擇國外服務器;
√?服務器的穩(wěn)定性非常重要,需要保持訪問流暢,服務器是否穩(wěn)定,可以使用百度搜索資源平臺(原百度站長平臺)抓取異常、抓取診斷工具進行檢測維護。(服務器經(jīng)常無法訪問或者死機,對爬蟲來講都是致命傷害);
√?服務器選擇除了自身的穩(wěn)定性外,實際上還要考慮網(wǎng)站的業(yè)務量,例如帶寬、內(nèi)存、CPU是否能夠承受訪問量,突發(fā)大流量情況下是否可以正常訪問;
√?服務器主機設置,需要注意是否有禁止爬蟲抓取的設置、或存在404錯誤信息設置,這些情況都會引起不必要的搜索引擎抓取判斷異常,為網(wǎng)站帶來不必要的損失。
2.4.2.1??虛擬主機
總的來說,建議虛擬主機選購時候需要特別注意:
√?主機商是否存在限制搜索引擎訪問的情況;
√?主機商的資質(zhì)是否符合要求;
√?主機商的技術(shù)沉淀是否足夠,建議選擇品牌較大的主機商;
√?主機商托管的機房的物理條件和網(wǎng)絡條件是否足夠優(yōu)秀;
√?主機商的技術(shù)和客服支持情況是否夠好;
√?主機商是否會存在超容量的情況;
√?主機商是否存在違規(guī)接入高風險站點的問題或同一IP下是否會存在高風險站點的情況;
√?國內(nèi)站點建議選購國內(nèi)云主機建站。
2.4.2.2??獨立主機
獨立主機為站點帶來更加寬松的使用環(huán)境和個性軟件的安裝,因此獨立主機需要站長擁有一定的技術(shù)力量來保證網(wǎng)站的正常運行和安全。
我們對于站長選購和托管獨立主機的建議是:
√?注意虛擬主機是否有將爬蟲IP拉入黑名單,關(guān)于百度UA,可以參考3.1.2.1百度蜘蛛章節(jié);
√?建議使用獨立IP地址的主機;
√?建議使用規(guī)模較大機構(gòu)的主機,在安全配置、穩(wěn)定性上相對更好;
√?對IDC服務商的建設標準需要一定的考慮,例如防火、防盜、是否有UPS保證、室內(nèi)溫控、消防等;
√?IDC服務商的服務質(zhì)量和技術(shù)是否達標,是否24h值班,是否能夠協(xié)助排查一些故障、免費重啟重裝系統(tǒng)等;
√?IDC機房的資質(zhì)是否齊全,存放站點是否有高風險站點或服務器存在。
2.4.3??安全服務
2.4.3.1??HTTPS
當前百度已實行全站化HTTPS安全加密服務,百度HTTPS安全加密已覆蓋主流瀏覽器,旨在用戶打造了一個更隱私化的互聯(lián)網(wǎng)空間、加速了國內(nèi)互聯(lián)網(wǎng)的HTTPS化。同時也希望更多網(wǎng)站加入到HTTPS的隊伍中來,為網(wǎng)絡安全貢獻一份力量。
HTTPS安全原理解析
HTTPS主要由有兩部分組成:HTTP + SSL / TLS,也就是在HTTP上又加了一層處理加密信息的模塊。服務端和客戶端的信息傳輸都會通過TLS進行加密,所以傳輸?shù)臄?shù)據(jù)都是加密后的數(shù)據(jù)。
HTTS復雜的加密機制有效的加大了網(wǎng)站的安全性,加密機制與認證機制可以減少網(wǎng)站被劫持和假冒的風險,建議站長們可以通過做HTTPS改造來強化網(wǎng)站安全。
百度搜索資源平臺為了更好的抓取識別HTTPS網(wǎng)站,2017年還推出了HTTPS認證工具,已經(jīng)完成HTTPS改造的網(wǎng)站,可以在搜索資源平臺-網(wǎng)站支持-HTTPS認證工具中提交網(wǎng)站的HTTPS數(shù)據(jù),便于百度更好抓取識別網(wǎng)站。關(guān)于HTTPS認證工具詳解,可以參考5.3.2HTTPS認證工具章節(jié)。
?
2.4.3.2??網(wǎng)站防止被黑對策
網(wǎng)站被黑,通常表現(xiàn)為網(wǎng)站中出現(xiàn)大量非本網(wǎng)站發(fā)布的類似博彩內(nèi)容,或網(wǎng)站頁面直接跳轉(zhuǎn)到博彩頁面;以下是網(wǎng)站被黑后發(fā)布的內(nèi)容:
內(nèi)容非網(wǎng)站發(fā)布,內(nèi)容中含大量博彩網(wǎng)站指向:
網(wǎng)站頁面直接跳轉(zhuǎn)到博彩網(wǎng)站:
網(wǎng)站被黑代表網(wǎng)站安全存在嚴重問題或漏洞,如何防范網(wǎng)站被黑,請參考以下:
首先,自查是否被黑
√ 被黑網(wǎng)站在數(shù)據(jù)上有一個特點,即索引量和從搜索引擎帶來的流量在短時間內(nèi)異常數(shù)據(jù)異常。所以,站長可以利用百度搜索資源平臺(原百度站長平臺)的索引量工具,觀察站點索引量是否有異常;如果發(fā)現(xiàn)數(shù)據(jù)異常,再通過流量與關(guān)鍵詞工具查看獲得流量的關(guān)鍵詞是否與網(wǎng)站有關(guān)、是否涉及博彩和色情;
√?通過Site語法查詢站點,結(jié)合一些常見的色情、博彩類關(guān)鍵詞效果更佳,有可能發(fā)現(xiàn)不屬于站點的非法頁面;
√?由于百度流量巨大,有些被黑行為僅針對百度帶來的流量予以跳轉(zhuǎn),站長很難發(fā)現(xiàn),所以在查看自己站點是否被黑時,一定要從百度搜索結(jié)果中點擊站點頁面,查看是否跳轉(zhuǎn)到了其他站點;
√?站點內(nèi)容在百度搜索結(jié)果中被提示存在風險;
√?后續(xù)可以請網(wǎng)站技術(shù)人員通過后臺數(shù)據(jù)和程序進一步確認網(wǎng)站是否被黑。
其次,被黑之后如何處理
√?確認網(wǎng)站被黑后,SEO人員除了要推動技術(shù)人員快速修正外,還需要做一些善后和預防的工作;
√?網(wǎng)站如有變更頁面,變更頁面建議使用鏈接提交工具向百度提交數(shù)據(jù);
√?立即停止網(wǎng)站服務,避免用戶繼續(xù)受影響,防止繼續(xù)影響其他站點;
√?如果同一主機提供商同期內(nèi)有多個站點被黑,可以聯(lián)系主機提供商,敦促對方做出應對;
√?清理已發(fā)現(xiàn)的被黑內(nèi)容,將被黑頁面設置為404死鏈,并通過百度搜索資源平臺(原百度站長平臺)死鏈提交工具進行提交。(我們發(fā)現(xiàn)有些站點采用了將被黑頁面跳轉(zhuǎn)至首頁的做法,非常不可取。);
√?排查出可能的被黑時間,和服務器上的文件修改時間相比對,處理掉黑客上傳、修改過的文件;檢查服務器中的用戶管理設置,確認是否存在異常的變化;更改服務器的用戶訪問密碼。注:可以從訪問日志中,確定可能的被黑時間。不過黑客可能也修改服務器的訪問日志;
√?做好安全工作,排查網(wǎng)站存在的漏洞,防止再次被黑。
網(wǎng)站自我防護的注意事項:
√?多種安全防護同步進行:適合中小型資訊網(wǎng)站;
●?網(wǎng)站程序勤打補?。含F(xiàn)在很多資訊類網(wǎng)站用的系統(tǒng)使用了內(nèi)容管理系統(tǒng)(CMS),作為新聞發(fā)布系統(tǒng),功能還算可以了,但是作為比較常見的內(nèi)容管理系統(tǒng)(CMS),也有另一個問題,那就是漏洞比較大眾化,因為源碼是公開的,所以很容易被研究出漏洞,需要對網(wǎng)站程序及時進行漏洞修復。
√?對服務器進行常規(guī)的安全防護;
●?在上班時間之外,對服務器上的網(wǎng)站權(quán)限做設置,禁止文件修改,后臺文件隱藏或遷移到根目錄之外。
●?參考一些網(wǎng)站的安全設置,非限定的IP不能寫入到數(shù)據(jù)庫。
√?不使用開源程序默認的robots文件;
●?下圖是一個地級市的資訊類站點的robots文件,從robots文件中可以看出,該網(wǎng)站用的是織夢后臺,那黑客就可以通過各種針對織夢攻擊的軟件進行操作了,也可以針對織夢網(wǎng)站的常見漏洞進行掃描和針對性攻擊了。
2.4.4??網(wǎng)絡服務
2.4.4.1??CDN
從搜索抓取機制上講:百度蜘蛛對站點的抓取方式和普通用戶訪問一樣,只要普通用戶能訪問到的內(nèi)容,百度蜘蛛就能抓取到。不管是用什么技術(shù),只要能保證用戶能流暢的訪問網(wǎng)站,對搜索引擎就沒有影響。但有站長反饋使用CDN后出現(xiàn)網(wǎng)站抓取異常、甚至流量異常等問題,主要是兩方面的因素:
一是部分CDN服務商硬件投入不夠,經(jīng)常出現(xiàn)不穩(wěn)定情況,會導致大量的蜘蛛抓取失敗,從而影響網(wǎng)站抓取效果,有的甚至影響了索引量數(shù)據(jù);所以選擇有實力的CDN服務商很重要;
二是緩存機制在網(wǎng)站出現(xiàn)死鏈、無法打開、被黑等情況的時候起到了推波助瀾的作用。短時間內(nèi)產(chǎn)生了一些不利快照,影響了排名。這種情況不用擔心,及時清理源文件和CDN緩存,并在百度搜索資源平臺(原百度站長平臺)提交相關(guān)死鏈數(shù)據(jù)等方法進行挽回,是可以恢復的。
相關(guān)內(nèi)容推薦
最新文章
更多>>0532-88983785 / 0532-68613670
我要優(yōu)化網(wǎng)站