网站网址URL是什么如何规范化网站网址
所有人访问网站的第一步都是一样的,就是先获取到网站网址,然后才能通过定向网址的方法进入到自己想要去的网页。因此网站网址可以说是所有网站的开端。网址虽然只有短短的一串字符,但其实字符中包含了大量丰富的信息。因此,很多人都希望了解如何为自己的网站设置一个简洁但内容全面的网站网址。今天,成都网站建设就带领大家来看看关于网站网址的具体介绍,以及应当如何规范化网站网址。
什么是网站网址
当我们进入一个网页,地址栏中就会出现一串英文字母,你知道这一串英文代表着什么呢。很多人把这串英文字母叫网址,其实是不准确的,它叫URL,全称是Uniform Resoure Locator,翻译过来就是“统一资源定位符”。
网址部分大家经常用到。这是一个网站独一无二的网络名字。如果我们去掉www的前缀,这个部分就叫域名,域名的最右边就是顶级域名,常见的比如:.com 表示商业机构,.org表示非盈利性组织。.gov表示政府机构。.edu表示教育及科研机构。用来表示国家顶级域名的比如:.cn表示中国。.us表示美国。.jp表示日本。
有时候,总公司的下属分公司、或者公司下设的其他产品网站,会使用一个与域名类似的二级域名。
从域名后第一个/到最后一个/为止,是虚拟目录部分,从最后一个/开始到?为止,是文件名部。#号后面就是锚部分,虚拟目录、文件名、锚都不是URL必须的部分,虽然一个标准的URL地址看起来很复杂,但其实我们在输入URL的时候是只要输入网址或域名就可以了。
完整的URL网址组成部分
【传输协议】用来传输客户端和服务器端交互信息的
http:超文本传输协议(除了传递普通文本,还可以传递文件流或者进制编码等信息),是目前最常用的web传输。
https:基于SSL(Secure Sockets Layer 安全套接层)加密的HTTP传输协议,比HTTP更加的安全。。
FTP:文件传输协议,一般用来实现资源文件在服务器上的上传下载。
【域名】Domain Name
.com 供商用的国际域名
.cn 供商用的中文域名
.net 用于网络供应服务商(系统类的经常使用net域名)
.org 用于官方组织
.edu 用于教育院校
.gov 用于政府机构
.io 是(British Indian Ocean Territory)英属印度洋领地的简写
【端口号】
用来区分同一台服务器上不同服务的标识,不同服务之间一般是不能使用相同的端口号的。
HTTP =>默认端口号80,HTTPS =>默认端口号443,FTP =>默认端口号21。
如果当前网络服务,采用的是协议对应的默认端口管理,那么当用户输入网址的时候可以不指定端口号,浏览器会默认帮用户把默认的端口传递给服务器。一台服务器上的端口号范围:0~65535之间。服务器上安装一款应用都可能会作为一个服务,占用一个端口号。
【请求路径名称path或pathname】
例如:/study/index.html 一般都是请求当前服务对应的项目目录中,study文件夹中的index.html页面,但是也有特殊情况,就是当前的url是被“伪url重写”的,我们看到的url请求其实不是真实的请求。
再例如:/study/info 这种没有任何后缀信息,一般都不是用来请求资源文件的,而是用于ajax数据请求的接口地址(如果后缀是 .json 类的,也是同理)。但是有一种除外 ,如 /study/info/ 这种的,很可能不是接口地址,而是没有指定请求的资源名称,服务器会请求默认的资源文件,一般都是index.html或者default.html
DHTML:动态页面,泛指当前页面中的内容不是写死的,而是动态绑定的,例如: .jsp / .php / .aspx ... 这些页面中的数据都是基于ajax或者是后台编程语言处理,由服务器端渲染,最后把渲染后的结果返回给客户端呈现的。
【问号传参及哈希值】 ?xx=xxx...#xxx
?xx=xxx这是问号传参,在HTTP事务中,问号传参是客户端把信息传递给服务器的一种方式(也有可能是跳转到某一个页面,把参数值传递给页面用来标识的)。#xxx这是哈希值,哈希值一般都是跟用户端服务器交互没啥关系,主要用于页面中的锚点定位和HASH路由切换。
URL网址规范化
网址URL规范化(URL canonicalization)是近年来在Google搜索结果中出现的一个很大的问题。它指的是搜索引擎挑选好的URL网址作为真正网址的过程。
1. URL网址规范化的含义
当搜索引擎要规范化网址时,搜索引擎需要从这些选择当中挑一个好的代表。一般来说,你的主页应该是固定的,只有一个。但是有的时候,在很多网站上站长在链接回主页时,所使用的URL并不是唯一的。
虽然这不会给访客造成什么麻烦,因为这些网址都是同一个文件,但是对Google来说却是造成了困惑,哪一个网址是你真正的主页呢?如果在你的网站上,不同的版本网址都大量出现,那么这两个URL可能都会被Google收录进数据库,这时就会造成复制内容网页。
所谓复制内容网页,指的是两个或多个网页的内容是相同或大部分相似的。很多时候,复制网页有可能是作弊手段。就算不是作弊手段的时候,搜索引擎通常也只会挑出其中一个返回搜索结果,而把其他的复制网页都排在最后面,以至于根本找不到。当你的网站出现网址URL规范化问题的时候,就有可能造成被怀疑为复制网页,因而影响搜索引擎结果排名。
2. 站长需要做的两件事
1)你的网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含www,你要由始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。
2)但是你没办法控制别的网站用哪一个网址连向你的主页。所以你应该在你的主机服务器上,把所有有可能成为主页网址的URL,做301重定向到你所选择的主页网址版本。
以上就是创新互联介绍的关于网站网址URL的全部内容了。网站网址中包含着丰富的信息,从网址中就可以解析出很多你需要的内容,比如网站的所属机构、网站协议、端口号等等。但是站在建站的角度上,网站网址规范化十分重要,访客会更倾向于访问一致性高的网站,因此大家在建站的时候要格外注意这一点。
文章标题:网站网址URL是什么如何规范化网站网址
网站路径:http://hbruida.cn/article/scddpp.html
什么是网站网址
当我们进入一个网页,地址栏中就会出现一串英文字母,你知道这一串英文代表着什么呢。很多人把这串英文字母叫网址,其实是不准确的,它叫URL,全称是Uniform Resoure Locator,翻译过来就是“统一资源定位符”。
网址部分大家经常用到。这是一个网站独一无二的网络名字。如果我们去掉www的前缀,这个部分就叫域名,域名的最右边就是顶级域名,常见的比如:.com 表示商业机构,.org表示非盈利性组织。.gov表示政府机构。.edu表示教育及科研机构。用来表示国家顶级域名的比如:.cn表示中国。.us表示美国。.jp表示日本。
有时候,总公司的下属分公司、或者公司下设的其他产品网站,会使用一个与域名类似的二级域名。
从域名后第一个/到最后一个/为止,是虚拟目录部分,从最后一个/开始到?为止,是文件名部。#号后面就是锚部分,虚拟目录、文件名、锚都不是URL必须的部分,虽然一个标准的URL地址看起来很复杂,但其实我们在输入URL的时候是只要输入网址或域名就可以了。
完整的URL网址组成部分
【传输协议】用来传输客户端和服务器端交互信息的
http:超文本传输协议(除了传递普通文本,还可以传递文件流或者进制编码等信息),是目前最常用的web传输。
https:基于SSL(Secure Sockets Layer 安全套接层)加密的HTTP传输协议,比HTTP更加的安全。。
FTP:文件传输协议,一般用来实现资源文件在服务器上的上传下载。
【域名】Domain Name
.com 供商用的国际域名
.cn 供商用的中文域名
.net 用于网络供应服务商(系统类的经常使用net域名)
.org 用于官方组织
.edu 用于教育院校
.gov 用于政府机构
.io 是(British Indian Ocean Territory)英属印度洋领地的简写
【端口号】
用来区分同一台服务器上不同服务的标识,不同服务之间一般是不能使用相同的端口号的。
HTTP =>默认端口号80,HTTPS =>默认端口号443,FTP =>默认端口号21。
如果当前网络服务,采用的是协议对应的默认端口管理,那么当用户输入网址的时候可以不指定端口号,浏览器会默认帮用户把默认的端口传递给服务器。一台服务器上的端口号范围:0~65535之间。服务器上安装一款应用都可能会作为一个服务,占用一个端口号。
【请求路径名称path或pathname】
例如:/study/index.html 一般都是请求当前服务对应的项目目录中,study文件夹中的index.html页面,但是也有特殊情况,就是当前的url是被“伪url重写”的,我们看到的url请求其实不是真实的请求。
再例如:/study/info 这种没有任何后缀信息,一般都不是用来请求资源文件的,而是用于ajax数据请求的接口地址(如果后缀是 .json 类的,也是同理)。但是有一种除外 ,如 /study/info/ 这种的,很可能不是接口地址,而是没有指定请求的资源名称,服务器会请求默认的资源文件,一般都是index.html或者default.html
DHTML:动态页面,泛指当前页面中的内容不是写死的,而是动态绑定的,例如: .jsp / .php / .aspx ... 这些页面中的数据都是基于ajax或者是后台编程语言处理,由服务器端渲染,最后把渲染后的结果返回给客户端呈现的。
【问号传参及哈希值】 ?xx=xxx...#xxx
?xx=xxx这是问号传参,在HTTP事务中,问号传参是客户端把信息传递给服务器的一种方式(也有可能是跳转到某一个页面,把参数值传递给页面用来标识的)。#xxx这是哈希值,哈希值一般都是跟用户端服务器交互没啥关系,主要用于页面中的锚点定位和HASH路由切换。
URL网址规范化
网址URL规范化(URL canonicalization)是近年来在Google搜索结果中出现的一个很大的问题。它指的是搜索引擎挑选好的URL网址作为真正网址的过程。
1. URL网址规范化的含义
当搜索引擎要规范化网址时,搜索引擎需要从这些选择当中挑一个好的代表。一般来说,你的主页应该是固定的,只有一个。但是有的时候,在很多网站上站长在链接回主页时,所使用的URL并不是唯一的。
虽然这不会给访客造成什么麻烦,因为这些网址都是同一个文件,但是对Google来说却是造成了困惑,哪一个网址是你真正的主页呢?如果在你的网站上,不同的版本网址都大量出现,那么这两个URL可能都会被Google收录进数据库,这时就会造成复制内容网页。
所谓复制内容网页,指的是两个或多个网页的内容是相同或大部分相似的。很多时候,复制网页有可能是作弊手段。就算不是作弊手段的时候,搜索引擎通常也只会挑出其中一个返回搜索结果,而把其他的复制网页都排在最后面,以至于根本找不到。当你的网站出现网址URL规范化问题的时候,就有可能造成被怀疑为复制网页,因而影响搜索引擎结果排名。
2. 站长需要做的两件事
1)你的网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含www,你要由始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。
2)但是你没办法控制别的网站用哪一个网址连向你的主页。所以你应该在你的主机服务器上,把所有有可能成为主页网址的URL,做301重定向到你所选择的主页网址版本。
以上就是创新互联介绍的关于网站网址URL的全部内容了。网站网址中包含着丰富的信息,从网址中就可以解析出很多你需要的内容,比如网站的所属机构、网站协议、端口号等等。但是站在建站的角度上,网站网址规范化十分重要,访客会更倾向于访问一致性高的网站,因此大家在建站的时候要格外注意这一点。
文章标题:网站网址URL是什么如何规范化网站网址
网站路径:http://hbruida.cn/article/scddpp.html