所有人訪問網(wǎng)站的第一步都是一樣的,就是先獲取到網(wǎng)站網(wǎng)址,然后才能通過定向網(wǎng)址的方法進(jìn)入到自己想要去的網(wǎng)頁。因此網(wǎng)站網(wǎng)址可以說是所有網(wǎng)站的開端。網(wǎng)址雖然只有短短的一串字符,但其實(shí)字符中包含了大量豐富的信息。因此,很多人都希望了解如何為自己的網(wǎng)站設(shè)置一個(gè)簡(jiǎn)潔但內(nèi)容全面的網(wǎng)站網(wǎng)址。今天,就帶領(lǐng)大家來看看關(guān)于網(wǎng)站網(wǎng)址的具體介紹,以及應(yīng)當(dāng)如何規(guī)范化網(wǎng)站網(wǎng)址。
什么是網(wǎng)站網(wǎng)址
當(dāng)我們進(jìn)入一個(gè)網(wǎng)頁,地址欄中就會(huì)出現(xiàn)一串英文字母,你知道這一串英文代表著什么呢。很多人把這串英文字母叫網(wǎng)址,其實(shí)是不準(zhǔn)確的,它叫url,全稱是uniform resoure locator,翻譯過來就是“統(tǒng)一資源定位符”。
網(wǎng)址部分大家經(jīng)常用到。這是一個(gè)網(wǎng)站獨(dú)一無二的網(wǎng)絡(luò)名字。如果我們?nèi)サ魒ww的前綴,這個(gè)部分就叫域名,域名的最右邊就是頂級(jí)域名,常見的比如:.com 表示商業(yè)機(jī)構(gòu),.org表示非盈利性組織。.gov表示政府機(jī)構(gòu)。.edu表示教育及科研機(jī)構(gòu)。用來表示國家頂級(jí)域名的比如:.cn表示中國。.us表示美國。.jp表示日本。
有時(shí)候,總公司的下屬分公司、或者公司下設(shè)的其他產(chǎn)品網(wǎng)站,會(huì)使用一個(gè)與域名類似的二級(jí)域名。
從域名后第一個(gè)/到最后一個(gè)/為止,是虛擬目錄部分,從最后一個(gè)/開始到?為止,是文件名部。#號(hào)后面就是錨部分,虛擬目錄、文件名、錨都不是url必須的部分,雖然一個(gè)標(biāo)準(zhǔn)的url地址看起來很復(fù)雜,但其實(shí)我們?cè)谳斎雞rl的時(shí)候是只要輸入網(wǎng)址或域名就可以了。
完整的url網(wǎng)址組成部分
【傳輸協(xié)議】用來傳輸客戶端和服務(wù)器端交互信息的
http:超文本傳輸協(xié)議(除了傳遞普通文本,還可以傳遞文件流或者進(jìn)制編碼等信息),是目前最常用的web傳輸。
https:基于ssl(secure sockets layer 安全套接層)加密的http傳輸協(xié)議,比http更加的安全。。
ftp:文件傳輸協(xié)議,一般用來實(shí)現(xiàn)資源文件在服務(wù)器上的上傳下載。
【域名】domain name
.com 供商用的國際域名
.cn 供商用的中文域名
.net 用于網(wǎng)絡(luò)供應(yīng)服務(wù)商(系統(tǒng)類的經(jīng)常使用net域名)
.org 用于官方組織
.edu 用于教育院校
.gov 用于政府機(jī)構(gòu)
.io 是(british indian ocean territory)英屬印度洋領(lǐng)地的簡(jiǎn)寫
【端口號(hào)】
用來區(qū)分同一臺(tái)服務(wù)器上不同服務(wù)的標(biāo)識(shí),不同服務(wù)之間一般是不能使用相同的端口號(hào)的。
http => 默認(rèn)端口號(hào)80,https => 默認(rèn)端口號(hào)443,ftp => 默認(rèn)端口號(hào)21。
如果當(dāng)前網(wǎng)絡(luò)服務(wù),采用的是協(xié)議對(duì)應(yīng)的默認(rèn)端口管理,那么當(dāng)用戶輸入網(wǎng)址的時(shí)候可以不指定端口號(hào),瀏覽器會(huì)默認(rèn)幫用戶把默認(rèn)的端口傳遞給服務(wù)器。一臺(tái)服務(wù)器上的端口號(hào)范圍:0~65535之間。服務(wù)器上安裝一款應(yīng)用都可能會(huì)作為一個(gè)服務(wù),占用一個(gè)端口號(hào)。
【請(qǐng)求路徑名稱path或pathname】
例如:/study/index.html 一般都是請(qǐng)求當(dāng)前服務(wù)對(duì)應(yīng)的項(xiàng)目目錄中,study文件夾中的index.html頁面,但是也有特殊情況,就是當(dāng)前的url是被“偽url重寫”的,我們看到的url請(qǐng)求其實(shí)不是真實(shí)的請(qǐng)求。
再例如:/study/info 這種沒有任何后綴信息,一般都不是用來請(qǐng)求資源文件的,而是用于ajax數(shù)據(jù)請(qǐng)求的接口地址(如果后綴是 .json 類的,也是同理)。但是有一種除外 ,如 /study/info/ 這種的,很可能不是接口地址,而是沒有指定請(qǐng)求的資源名稱,服務(wù)器會(huì)請(qǐng)求默認(rèn)的資源文件,一般都是index.html或者default.html
dhtml:動(dòng)態(tài)頁面,泛指當(dāng)前頁面中的內(nèi)容不是寫死的,而是動(dòng)態(tài)綁定的,例如: .jsp / .php / .aspx ... 這些頁面中的數(shù)據(jù)都是基于ajax或者是后臺(tái)編程語言處理,由服務(wù)器端渲染,最后把渲染后的結(jié)果返回給客戶端呈現(xiàn)的。
【問號(hào)傳參及哈希值】 ?xx=xxx...#xxx
?xx=xxx這是問號(hào)傳參,在http事務(wù)中,問號(hào)傳參是客戶端把信息傳遞給服務(wù)器的一種方式(也有可能是跳轉(zhuǎn)到某一個(gè)頁面,把參數(shù)值傳遞給頁面用來標(biāo)識(shí)的)。#xxx這是哈希值,哈希值一般都是跟用戶端服務(wù)器交互沒啥關(guān)系,主要用于頁面中的錨點(diǎn)定位和hash路由切換。
url網(wǎng)址規(guī)范化
網(wǎng)址url規(guī)范化(url canonicalization)是近年來在google搜索結(jié)果中出現(xiàn)的一個(gè)很大的問題。它指的是搜索引擎挑選最好的url網(wǎng)址作為真正網(wǎng)址的過程。
1. url網(wǎng)址規(guī)范化的含義
當(dāng)搜索引擎要規(guī)范化網(wǎng)址時(shí),搜索引擎需要從這些選擇當(dāng)中挑一個(gè)最好的代表。一般來說,你的主頁應(yīng)該是固定的,只有一個(gè)。但是有的時(shí)候,在很多網(wǎng)站上站長(zhǎng)在鏈接回主頁時(shí),所使用的url并不是唯一的。
雖然這不會(huì)給訪客造成什么麻煩,因?yàn)檫@些網(wǎng)址都是同一個(gè)文件,但是對(duì)google來說卻是造成了困惑,哪一個(gè)網(wǎng)址是你真正的主頁呢?如果在你的網(wǎng)站上,不同的版本網(wǎng)址都大量出現(xiàn),那么這兩個(gè)url可能都會(huì)被google收錄進(jìn)數(shù)據(jù)庫,這時(shí)就會(huì)造成復(fù)制內(nèi)容網(wǎng)頁。
所謂復(fù)制內(nèi)容網(wǎng)頁,指的是兩個(gè)或多個(gè)網(wǎng)頁的內(nèi)容是相同或大部分相似的。很多時(shí)候,復(fù)制網(wǎng)頁有可能是作弊手段。就算不是作弊手段的時(shí)候,搜索引擎通常也只會(huì)挑出其中一個(gè)返回搜索結(jié)果,而把其他的復(fù)制網(wǎng)頁都排在最后面,以至于根本找不到。當(dāng)你的網(wǎng)站出現(xiàn)網(wǎng)址url規(guī)范化問題的時(shí)候,就有可能造成被懷疑為復(fù)制網(wǎng)頁,因而影響搜索引擎結(jié)果排名。
2. 站長(zhǎng)需要做的兩件事
1)你的網(wǎng)站內(nèi)部在鏈接到其他網(wǎng)頁,尤其是主頁時(shí),只使用一種url。不管是包含www或不包含www,你要由始至終只使用一個(gè)版本。這樣搜索引擎也就明白哪一個(gè)是規(guī)范化的主頁網(wǎng)址。
2)但是你沒辦法控制別的網(wǎng)站用哪一個(gè)網(wǎng)址連向你的主頁。所以你應(yīng)該在你的主機(jī)服務(wù)器上,把所有有可能成為主頁網(wǎng)址的url,做301重定向到你所選擇的主頁網(wǎng)址版本。