完美搜索引擎之旅|信息图

披露: 您的支持有助于保持网站的正常运行!我们会为此页面上推荐的某些服务收取推荐费.


完美搜索引擎之旅

这真有趣。曾经有一段时间(大约是二十年前),那时我们大多数人都不了解互联网.

当然,我们中的某些人已经接触过Lycos和AltaVista,但是互联网,尤其是现在的搜索引擎?没门。如果我们想联系某人,我们会在电话簿中查找他们。如果我们想研究拜占庭帝国的历史,我们去了图书馆。没有立即满足于去Google搜索任何东西的满足感.

如今,搜索引擎已经扎根于我们的日常生活中,以至于我们甚至不再真正考虑过。我们只需打开浏览器窗口(或移动设备),输入所需内容,然后再找到答案或解决方案.

只有当Google发布新的算法更新时,人们才真正关注这种“搜索引擎”的想法。这些更新通常向企业和营销人员发出信号,表明该是该更新网站的时候了,以便保留在Google的良好信誉中,以进行排名。因此,企业通过遵守搜索引擎的法律,也在寻找访问者的最大利益.

归根结底,这就是搜索引擎最终关心的:互联网用户。帮助他们将其连接到所需的信息,并确保他们在执行过程中的安全.

但这并不是互联网或搜索引擎最初的样子-或旨在做到的-
一切始于1960年代。如果您不熟悉搜索引擎的历史,请系好安全带。我们将带您走过漫长而曲折的道路,通过所有通往Google的搜索引擎.

不像Google的SMART:完美搜索引擎之旅

不像Google的SMART:完美搜索引擎之旅

几乎每个具有Internet连接的人都曾经使用过搜索引擎,但是您是否想知道搜索引擎是如何产生的?谁发明的?第一个是什么?然后继续,因为我们有整个故事.

前身

  • 名称:
    • SMART信息检索系统
      • SMART是Salton的魔法自动文本检索器的首字母缩写
  • 发布:
    • 1960年代
  • 采用:
    • 互动信息数据库
  • 由开发:
    • 杰拉德·索尔顿
    • 克里斯·巴克利
    • 康奈尔大学其他
  • 创新之处:
    • 向量空间模型:
      • 一种自动加权搜索结果以显示与用户最相关的结果的方法
    • 相关性反馈:
      • 用户对搜索结果的相关性进行排名的一种方法
    • Rocchio分类:
      • 一种提高搜索精度的分类方法

在一开始的时候

  • 在万维网和搜索引擎出现之前,互联网是:
    • 用户可以在其中导航以查找特定共享文件的文件传输协议(FTP)网站的集合
    • 人们进行互动并分发常见问题解答等信息的新闻组.
  • 第一个
    • 名称:
      • 阿奇
    • 发布:
      • 1990
    • 采用:
      • FTP档案索引
    • 由开发:
      • 艾伦·埃姆塔格(Alan Emtage)
      • 彼得·德意志
      • 比尔·海兰
    • 创新之处:
      • 允许远程用户浏览包含以下内容的匿名FTP站点列表:
        • 软件
        • 常见问题
        • 新闻档案
      • 定期自动更新可用服务器列表
    • 其他资讯:
      • 1990年9月,Archie编制了一个包含210个站点的数据库
      • 1992年,Archie包含260万个文件(大约150 GB的数据)
  • 阿奇的朋友
    • 名称:
      • 维罗妮卡
      • 朱格海德
    • 发布:
      • 1993年
    • 采用:
      • 地鼠指数
    • 由开发:
      • 弗雷德·巴里和史蒂文·福斯特
      • 瑞德·琼斯(Rhett Jones)
    • 创新之处:
      • 开发这两种引擎是为了使搜索Gopher服务器更加容易
      • Veronica创建了Gopher纯文本文件的索引
      • Jughead可以使用布尔搜索词查看单个Gopher服务器
    • 其他资讯:
      • 即使Archie并非指漫画人物,后来写Veronica和Jughead的人也认为继续进行主题创作会很有趣
      • 为这两个都创建了反义词:
        • Veronica:“非常容易以啮齿动物为导向的全网索引到计算机档案”
        • Jughead:“ Jonzy的通用Gopher层次结构挖掘和显示”
      • Veronica搜索了5,500台Gopher服务器,并索引了超过1000万个项目/文档
  • 网络的发明
    • 1989年,蒂姆·伯纳斯·李(Tim Berners-Lee)和他在欧洲核子研究中心(CERN)的团队开始进行HTTP工作:
      • 一种用于发送和接收超文本文档的系统,该系统将以一种Web形式相互链接.
      • 它很快得到了增强,可以提供:
        • 更好的客户端-服务器协商
        • 元数据
        • 安全
    • 早期的浏览器包括:
      • 中提琴
      • 错了
      • MidasWWW
      • 镶嵌
    • 随着Web服务器数量的增加,Web成为访问Internet的界面:
      • 新服务器在NCSA网站的“新功能”下宣布
        • 许多网站提供了自己的“有趣的网站”列表。
      • 这个中心列表无法跟上增长的步伐,因此需要在网络上查找和整理所有信息

无需机器人

  • 名称:
    • ALIWEB,代表WEB的类似Archie的索引
  • 发布:
    • 1993年10月
  • 格式:
    • 自助登录网站索引
  • 由开发:
    • 马丁·科斯特(Martijn Koster)
  • 创新之处:
    • HTTP等效于Archie
    • 没有使用网络搜索机器人
      • 参与站点的网站管理员必须为要列出的每个页面发布自己的索引信息
        • 优点:
          • 用户可以描述自己的网站
          • 机器人没有跑来跑去消耗网络带宽
        • 缺点:
          • 索引文件对大多数人来说很复杂
          • 使用困难意味着数据库相对较小
  • 其他资讯:
    • 他们试图通过将其他数据库添加到ALIWEB搜索中来弥补这种复杂性,但它无法与较新的基于bot的搜索引擎竞争

索引器

  • 名称:
    • 网络爬虫
  • 发布:
    • 1994年
  • 采用:
    • 搜寻网站索引
  • 由开发:
    • 布莱恩·平克顿
  • 创新之处:
    • 第一个搜寻器,用于索引整个网页,而不只是文件或网站名称
  • 其他资讯:
    • 首次发布时,WebCrawler拥有来自6,000多个服务器的文档
    • 发布后五个月,平均每天收到15,000个查询
    • WebCrawler迅速变得如此流行,以至于白天几乎无法使用

图书馆蜘蛛

  • 名称:
    • 莱科斯
  • 发布:
    • 1994年
  • 采用:
    • 网站索引
  • 由开发:
    • 迈克尔·莫尔丁
  • 创新之处:
    • 当时最大的索引网站库
  • 其他资讯
    • Lycos以狼蛛Lycosidae Lycosa的名字命名,因为蜘蛛捕食猎物而不是将其捕获在网中
    • Lycos公开发行时有54,000个文档
    • 它在一个月内识别了近40万份文档
    • Lycos在五个月内识别了110万份文档
    • 到1996年11月,其目录已包含6000万份文档

史密斯一词

  • 名称:
    • 激发,原名Architext
  • 发布:
    • 1995年
  • 采用:
    • 网站字词索引
  • 由六名斯坦福大学学生开发:
    • 乔·克劳斯
    • 本·拉奇(Ben Lutch)
    • 瑞安·麦金太尔
    • 马丁·雷弗里德
    • 格雷厄姆·斯宾塞
    • 马克·范·哈伦
  • 创新之处:
    • 通过统计分析来查看词的关系,这使搜索更加相关,这是当时的开创性方法
    • 推出后,Excite.com已索引了150万页,当时该数量很大
  • 其他资讯:
    • Excite已与Netscape和Microsoft签署了重大协议
    • 截至1998年,Excite的收入超过1.5亿美元,并继续增长
    • 斯坦福大学的两个同学拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)由Google创立,并于1999年提出以一百万美元的价格将其公司出售给Excite。
      • 他们只愿意以$ 750,000的价格和解
      • Excite拒绝成为历史上最大的搜索引擎-一家市值1800亿美元的公司
    • 雅虎想购买Excite,但遭到拒绝
    • Excite于1999年与@Home Network合并,并于2001年破产

原始Google

  • 名称:
    • 阿尔塔维斯塔
  • 发布:
    • 1995年
  • 采用:
    • 全文网站索引
  • 由开发:
    • 路易·莫尼尔
    • 迈克尔·伯罗斯
  • 创新之处:
    • SEO历史将其视为“具有简单界面的万维网上第一个可搜索的全文数据库”
    • 要搜索的第一个搜索引擎:
      • 图片
      • 音讯
      • 视频
    • 创建了Babel Fish,这是第一种多语言搜索,可以翻译为:
      • 英语
      • 法文
      • 德语
      • 义大利文
      • 葡萄牙语
      • 西班牙文
      • 俄语
  • 其他资讯:
    • AltaVista的意思是“从上方看”
    • 1996年,AltaVista是最大的网络索引
      • 容量33GB
      • 来自225,000台服务器的3000万页
      • 每天平均访问​​1200万次
        • 大约每秒140次

网络管家

  • 名称:
    • 问吉夫斯
  • 发布:
    • 1997年
  • 采用:
    • 自然语言网站索引
  • 由开发:
    • 加勒特·格鲁纳
    • 戴维·沃森
  • 创新之处:
    • 成为自然语言搜索引擎
    • 人工编辑协助一些常见的搜索查询
  • 其他资讯:
    • 管家是指P.G.的代客Jeeves。沃德豪斯的Jeeves-Wooster小说
    • 2010年,Ask Jeeves更名为社区问题品牌 & 接听服务

冠军

  • 名称:
    • 谷歌
  • 已发行
    • 1998年
  • 采用:
    • 递归网站索引
  • 由开发:
    • 拉里·佩奇(Larry Page)
    • 谢尔盖·布林
  • 创新之处:
    • PageRank创建了一个引文加权系统,该系统:
      • 根据与之链接的其他网站的实力,评估哪些网站更值得信赖
      • 如今,这是几乎所有搜索引擎的基础
  • 其他资讯:
    • PageRank中的“页面”是指Larry Page,而不是网页.
    • 由于专注于反向链接,Google原名“ BackRub”
    • Google搜寻器搜索的第一个网站是斯坦福大学的主页
    • Google的索引大小超过1亿GB
    • 人们每月使用Google进行超过一千亿次搜索
      • 每秒超过40,000次搜索
    • Google即时:
      • 使用自然语言用户界面执行以下操作:
        • 回答提问
        • 提出建议
        • 通过将请求委托给一组Web服务来执行操作
      • 是一个智能的个人助手,可访问:
        • 在Google移动搜索应用中
        • 在Google Chrome网络浏览器上
      • 可以根据用户的搜索习惯主动提供其预测的信息
      • 允许人们使用即时贴在正确的时间获取正确的信息,而无需进行搜索
        • 它将信息自动组织成简单的卡片,仅在用户需要时出现
        • 用户上班前会上下班,找到附近的热门地点,并获得他们最喜欢的球队的当前分数

可能的小引擎

Google如今没有很多竞争对手,但是尽管赔率很高,但有两个正在尽力而为:

  • 鸭鸭去
    • 声称删除了Google在其结果中发送的所有垃圾邮件
    • 界面干净
    • 不跟踪用户
    • 广告远远少于Google
  • ing
    • 微软的搜索引擎
    • 提供与Google类似的结果
    • 具有较小的网页数据库
    • 雅虎!使用Bing作为其搜索引擎

虽然大多数人在听到“搜索引擎”时都会想到“ Google”,但在Page和Brin的网络抓取工具问世之前,有几种不同的引擎。虽然如今使用Veronica或Lycos的人并不多,但没有他们,互联网就不会成为现实.

资料来源: searchenginehistory.com,sigir.org,css.monash.edu.au,nlp.stanford.edu,seobythesea.com,groups.google.com,savetz.com,dummies.com,searchenginearchive.com,netlingo.com,searchnetworking。 techtarget.com,whatis.techtarget.com,salientmarketing.com,learnthenet.com,ryanmacintyre.com,searchenginepeople.com,todayifoundout.com,thehistoryofseo.com,wiley.com,dictionary.reference.com,mashable.com,存档。 wired.com,google.com

资料来源

  • 搜索引擎的历史:从1945年到今天的Google
  • SMART系统-检索结果和未来计划(PDF)
  • 检索系统评估的智能环境(PDF)
  • 计分,加权加权和向量空间模型
  • 相关性反馈和伪相关性反馈
  • 罗契奥分类
  • Internet存档服务器
  • 凯文·萨维兹(Kevin Savetz)的文章
  • 什么是FTP?
  • 网页前搜索引擎
  • 关于Archie,Gopher,Veronica和Jughead的评论
  • 什么是维罗妮卡?
  • 什么是Jughead?
  • Veronica,搜索引擎的祖母-1993年
  • 阿奇的朋友,朱格黑德(1993)
  • 搜索数据库
  • 激励简史
  • 7个被Google淘汰的搜索引擎
  • Excite有机会以75万美元的价格收购Google,但拒绝了
  • 早期搜索引擎的简要历史
  • 搜索引擎的历史
  • 早期搜索引擎的简要历史
  • Lycos-1994年
  • Alta Vista技术
  • Ask.com以社区Q为中心重塑自我&一个
  • Google的诞生
  • 搜索的工作方式
Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map