打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
百度搜索结果网页参数01
阅读前的说明

为了避免被认为帮百度做外链而被删,所有链接做了转义处理。


百度网页搜索地址常见的开头是 http:\/\/www\.baidu\.com\/
另外有以下2种地址形式也被百度认可
http:\/\/www\.baidu\.com\/s
http:\/\/www\.baidu\.com\/index\.php
(百度也没有都做301转向,那些SEO专家号称301跳转可以集中权重的方法,怎么百度会没考虑到)

$baidu=$_POST['baidu'];if(preg_match("/http:\/\/www\.baidu\.com\/|http:\/\/www\.baidu\.com\/s|http:\/\/www\.baidu\.com\/index\.php/i",$baidu))
echo"百度网页搜索";

接下去是本文所要重点说明的对象——百度搜索结果网址参数(Baidu Search Engine Result PageUniform/Universal Resource Locator Parameters)

百度的域名后面第1个字符是 s? 或者 baidu? 含义是 搜索(search) 或者 百度搜索
问号表示后面跟的是参数
参数之间用 & 连字符连接,其中可以出现0-多个无效参数,并不影响搜索结果页面(SERP)
参数的形式通常为 参数名 = 参数值
参数有可见和隐藏参数之分
用的最多的隐藏参数或者默认参数有 ie=GB2312

百度搜索结果网址参数01

名称 ie
含义 输入编码(Input Encoding)
常见的值有以下3种
GB 2312 (中国国家标准简体中文字符集) 信息交换用汉字编码字符集·基本集
GBK (Chinese Internal CodeSpecification)汉字内码扩展规范
UTF-8 (8-bit Unicode Transformation Format)一种针对Unicode的可变长度字符编码(定长码)

百度网页搜索默认使用的 GB2312 是较为传统的编码,“罗马不是一天建成的”,百度成立至今也有13个年头,GB2312当年还算流行,再者 GB2312 存储字节要比 UTF-8 少许多,对于百度依赖于超大数据的网站来说,可以省不少钱。
但这对解码来说却多了一道麻烦,需要先判断是何种编码,否则容易出现乱码。

$baidudecode=urldecode($baidu);
$baidudecodegb=iconv("GB2312","UTF-8//IGNORE",urldecode($baidu));
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
FireFox在地址栏输入中文无法搜索
里里外外详解URL编码
python requests的安装与简单运用
百度、雅虎、谷歌搜索引擎接口调用注意事项
百度常用搜索技巧实用参数
网络搜索与信息收集路路通
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服