什么是隐形网?
您是否知道,如果没有特定搜索,搜索引擎将无法显示大量数据? “隐形网络”一词主要指搜索引擎和目录无法直接访问的庞大信息库,如数据库。
与可见Web上的页面(即可以从搜索引擎和目录访问的Web)不同,数据库中的信息通常是创建搜索引擎索引的软件蜘蛛和爬虫无法访问的。用户可以访问大部分此类信息,但只能通过特定搜索来解锁此信息所在的位置。
隐形网络有多大?
无形网络估计是字面上的数千倍大 比通用搜索引擎查询中找到的Web内容。据专注于隐形Web内容提取的搜索组织Bright Planet称,Invisible Web包含近5500亿个单独的文档,而表面Web则为10亿个。
主要的搜索引擎 - 谷歌,雅虎,必应 - 并没有带回典型搜索中的所有“隐藏”内容,仅仅因为他们在没有专门的搜索参数和/或搜索专业知识的情况下无法看到该内容。但是,一旦搜索者知道如何访问这些数据,就会有大量可用的信息。
为什么称它为“隐形网”?
蜘蛛,基本上是小型软件程序,在整个Web上蜿蜒,索引他们发现的页面的地址。当这些软件程序从Invisible Web运行到一个页面时,他们不知道如何处理它。这些蜘蛛可以记录地址,但无法访问有关页面包含的信息的任何信息。
为什么?有很多因素,但主要是归结为网站所有者的技术障碍和/或故意决定,以排除搜索引擎蜘蛛的页面。例如,需要密码才能访问其信息的大学图书馆网站将不会包含在搜索引擎结果中,也不会包含搜索引擎蜘蛛无法轻松阅读的基于脚本的页面。
为什么隐形网很重要?
许多用户认为,坚持使用谷歌或雅虎可以找到的东西可能更容易。但是,用搜索引擎找到你想要的东西并不总是那么容易,特别是如果你正在寻找一些有点复杂或模糊的东西。
将Web视为一个庞大的图书馆。大多数人不希望只是走在前门,立即找到有关前台纸夹历史的信息;他们希望能够挖掘它。这是搜索引擎不一定会帮助你但是Invisible Web会帮助你的地方。
搜索引擎只搜索网络的很小一部分这一事实使得Invisible Web成为一种非常诱人的资源。那里有比我们想象的更多的信息。
我如何使用Invisible Web?
还有很多其他人问自己完全相同的问题,并将伟大的网站放在一起作为Invisible Web的起点。以下是一些针对不同主题的网关:
人文
- 航天飞机之声:VoS始于1994年,是网络上最古老,规模最大的人文数据库之一,提供从人类学到写作技术等主题的独家内容索引。
具体到美国政府
- 密歇根大学政府文件中心:您可以在这里找到美国各级政府的报告,统计数据和其他文件。提供的数据库包括艺术,健康科学,社会科学和国际研究。
- USA.gov:进入美国政府许多实体深处的红地毯门户网站。包括政府工作,A到Z政府机构名单,以及寻找补助金,贷款和经济援助的信息。
健康与科学
- PsycNET:使用美国心理学协会的这个数据库查找各种心理学主题的摘要和整个期刊(费用适用于完成日记条目,摘要通常是免费的)。
- Healthfinder:专业审查来自Web上超过一千个不同健康数据库的信息。这里提供了各种令人眼花缭乱的健康主题的广泛资源。
- RXList:如果您正在寻找可靠的药物信息,那么您可以使用这个处方药,药物和药物鉴定数据库。提供A到Z索引,图像集合和术语字典。
巨型门户
- 虚拟库简单易用,带有带注释的主题链接。我特别欣赏这些注释,因为它有助于排除无关的搜索时间。
其他无形网络资源怎么样?
有很多很多站点可以用来深入了解Invisible Web。无形网络上的大多数信息都是由学术机构维护的,其质量高于搜索引擎结果。有“学术门户”可以帮助您找到这些信息。要在Web上查找几乎任何教育资源,只需在此搜索字符串中输入您喜欢的搜索引擎:
网站:.edu“我正在寻找的主题”
您的搜索将仅返回与.edu相关的网站。如果您有特定的学校想要搜索,请在搜索中使用该学校的URL:
网站:www.school.edu“我正在寻找的主题”
如果主题超过两个单词,则在引文中构建主题;这让你正在使用的搜索引擎知道你想要找到彼此相邻的那两个单词。详细了解搜索技巧,以便更加熟练地进行网络搜索。
关于隐形网络的底线
Invisible Web为您可能想到的任何事物提供了大量资源。本文中突出显示的链接几乎没有触及Invisible Web上可用的大量资源。随着时间的推移,隐形网络只会变得更大,这就是为什么现在学习如何探索它的好主意。