搜索引擎技巧整理(Google)(转载)
本文于2021年1月6日由AlvinCR更新
文章导引
1.一般搜索技术
默认模糊搜索、自动拆分短语
当直接在搜索框中输入搜索词时,google默认进行模糊搜索,并能对长短语或语句进行自动拆分成小的词进行搜索;
短语精确搜索
给关键词加上半角引号(【“”】)实现精确搜索;
通配符
谷歌的通配符是星号“*”,必须在精确搜索符双引号内部使用。用通配符代替关键词或短语中无法确定的字词;
点号匹配任意字符
与通配符星号“*”不一样的是,点号“.”匹配的是字符,不是字、短语等内容。保留的字符有[、(、-等;
布尔逻辑
布尔逻辑是许多检索系统的基本检索技术,在搜索引擎中也一样适用,在谷歌网页搜索中需要注意的是:谷歌和许多搜索引擎一样,多个词见的逻辑关系默认的是逻辑与(空格)
当用逻辑算符的时候,词与逻辑算符之间用需要空格分隔,包括后面讲的各种语法,均要有空格。逻辑非是特例,即减号必须与对应的词连在一起。对于复杂的逻辑关系,可用括号分组。
逻辑与:【电子行业 AND 研究报告】,用空格和AND 以及小写搜索结果差别不大。此例是搜索电子行业的研究报告。
逻辑或:【电子行业 AND 研究报告 AND (人才 | 风险)】此例是搜索电子行业的人才或风险方面的研究报告。
逻辑非:【电子行业 AND 研究报告 AND (人才 | 风险) -2007】此例是搜索电子行业的人才或风险方面的研究报告,但不要2007年的。
约束条件
加号“+”用于强制搜索,即必须包含加号后的内容。一般与精确搜索符一起应用;
同义词
仅限于英文搜索。一般来说,加~符号会比不加搜索出来的多一些。总体来说效果不是很明显。
数字范围
用两个点号“..”表示一个数字范围。一般应用于日期、货币、尺寸、重量、高度等范围的搜索。用作范围时最好给一定的含义。
【奥运会 1980..2004】当我们搜索奥运会的时候,特别是在2008年的时候搜索这个词,出现在搜索结果前几页的几乎全是2008年北京奥运会的相关信息,但是有人想了解进几届在其它地方主办的奥运会的情况。实例中就是搜索1980年到2004年间的奥运会信息。
【格力空调 2000..2800 元】搜索价格区间。本例仅仅搜索格力空调的价格在2000元到2800元之间的信息。
【格力空调 ..2800 元】2800元以下的。
【格力空调 2800.. 元】2800元以上的。
括号分组
逻辑组配时分组,避免逻辑混乱。括号“()”是分组符号。
【(格力空调 | 海尔空调 )元 2800..】2800元以上的格力空调或者海尔空调。
2.高级搜索语法
标题中搜索
通常标题是内容的高度概括,在标题中搜索的结果准确率会更高。谷歌搜索中限定搜索网页或文档标题的语法是:intitle
正文中搜索
仅仅在网页或文档的正文部分搜索。搜索中限定搜索网页或文档正文的语法是:intext
网址中搜索
搜索中限定搜索网址的语法是:inurl。
它是In-系指令中最强大的一个,换句话说,这个高级指令能够直接从网站的URL入手挖掘信息,只要略微了解普通网站的URL格式,就可以极具针对性地找到你所需要的资源--甚至隐藏内容。
网站构建者通常将某一类信息集中在一个网站的目录中,所以搜索URL中的词本身就是对某一方面内容的一个限定。如果在加上一定的词进行组配,搜索结果将更贴近需求。
搜索图片--【inurl:photo】搜索所有网络地址中包含“photo”的关键词的页面结果。如果说Google图象搜索侧重于展示图片,inurl搜索则让你在看到图片之前了解到页面大致的文字内容,更方便判断。
利用这一指令,你往往能够找到关键词的组图内容(指令中的photo也可以替代为picture、image等) 。
搜索音乐--【inurl:mp3 毕业生】,在所有网络地址中包含“mp3”的页面中搜索“毕业生”。这个时候返回的“毕业生”肯定是音乐,而不是关于“毕业生”的其它话题。
Google中搜索音乐的另一有效方式是MP3可以替换为wma/rm等。
搜索软件--【inurl:download qq】,直接查找QQ软件的下载页面。
搜索电子论文--【inurl:eprint “Information Retrieval”】 搜索有关Information Retrieval的电子论文(通常这类搜索结果能直接下载全文)。
搜索特定网站中的内容【inurl:lib.nit.net.cn 讲座】搜索http://lib.nit.net.cn 网站中有“讲座”的内容,其中网络地址可以有目录,如lib.nit.net.cn/dlib 。
锚链链接搜索
在做网站中有时候用锚点来链接一个页面中的其它部分内容,这样方便浏览和定位。
如本页面上方的目录导航,就是通过锚点链接来实现的,也就是说锚点链接的内容通常是网页内容中重要的章节或内容的开始部分,因而对它们的搜索也更能反映网页的主题内容,提高搜索结果的准确度。
对于熟悉网页制作的人来说,可以从网页源代码中查看有锚点的HTML代码,如这就是一个锚链的链接: 网页第一部分谷歌网页搜索在锚链链接中语法是:inanchor或allinanchor。搜索范围限制在页面的链接锚点描述文本进行搜索。
文档类型限定
google网页搜索不仅仅能搜索网页,还能搜索各种文档,通过文档类型限定只对文档进行搜索,从而不显示页面的内容,语法是:filetype。
这个语法非常有用,我们在网上常常要找一些范文或参考资料的时候常用这个语法。filetype是根据文件后缀搜索特定文件类型,比如支持的文档有:pdf、ppt、doc、xls等;网页文件:htm、asp、php等。
定义搜索
google网页搜索中搜索定义的语法是:define。用于搜索定义或解释。
在阅读、学习、研究或撰写论文中,遇到陌生的词或缩写,可以用该语法得到确切的定义或解释。而且可以了解多种语言的定义情况。
3.网页相关信息搜索
google提供的网页相关信息搜索的语法是:info。
通过这个语法能将网页的 快照信息、网页链接情况、被链接情况和类似网页的信息供选择浏览。
cache:搜索谷歌缓存的页面(快照信息)
【cache:lib.nit.net.cn】当前cache语法不支持谷歌中文,本处给的链接实例是在谷歌英文中搜索的结果。
用cache语法的一般情况是:**当一个链接无法访问时(或信息被屏蔽时);当信息已经被修改,想看以前的信息时。 **
related:搜索与特定网页相关的网站
【related:google.cn】搜索的结果就是更多的搜索引擎。related语法对于发现某一类信息非常有用:
当你用related搜索一个图书馆网址的时候会出来大量图书馆的网站,如【related:lib.nit.net.cn】;
当搜索某期刊网址的时候,能搜索出大量给学科领域的相关期刊,如【related:www.lis.ac.cn】
link:搜索所有链接到某个特定URL上的页面
【link:lib.nit.net.cn】搜索链接到宁波理工学院图书馆的页面。做网站的人往往想知道是哪些网页链接了该网站。也可用于发现某一个页面(新闻、信息等)被什么网页引用(如博客中)或收藏。其实,最好的搜索策略应该是这样:【link:lib.nit.net.cn -site:lib.nit.net.cn】,删除自己链接自己的页面。
site:搜索范围限制在某网站或顶级域名中。
【医药 site:edu.cn】搜索我国教育科研网中关于“医药”的信息,比如医药院校或专业的信息等。这样能排除很多医药领域的公司信息。
【site:lib.nit.net.cn】查看宁波理工学院图书馆的网页被谷歌收录(索引)的数量。比较不同图书馆(网站)在网络上的“大小”。
【服务 site:lib.nit.net.cn】搜索宁波理工学院图书馆网站上的所有关于“服务”的页面。URL可以带路径,现在搜索该URL下的所有页面。
参考网站:
https://www.jianshu.com/p/2b81cffd20e5