Putovanje savršenom pretraživaču | grafički prikaz

Objava: Vaša podrška pomaže održavanju web mjesta! Naplaćujemo naknadu za preporuku za neke usluge koje preporučamo na ovoj stranici.


Putovanje do savršene tražilice

Zanimljivo je. Postojalo je vrijeme – prije otprilike dva desetljeća – kada većina nas nije znala za Internet.

Sigurno je da su neki od nas bili izloženi Lycosu i AltaVisti, ali Internet i, konkretno, tražilice, kakvi sada stoje? Nema šanse. Ako smo htjeli kontaktirati nekoga, pogledali smo ih u imeniku. Ako smo željeli istražiti povijest bizantskog carstva, otišli smo u knjižnicu. Nije bilo neposrednog zadovoljstva odlaskom na Google i traženju svega i svačega.

Ovih dana tražilice su toliko ukorijenjene u svakodnevnom životu da više nije nešto o čemu uopće razmišljamo. Jednostavno otvorimo prozor preglednika (ili mobilni uređaj), unesemo ono što tražimo, a sekundu kasnije imamo odgovor ili rješenje.

Jedini put kada ljudi stvarno obraćaju pažnju na tu ideju “tražilice” je kada Google objavi novo ažuriranje algoritama. Ta ažuriranja obično su tvrtkama i trgovcima znak da je vrijeme da ažuriraju svoju web stranicu kako bi Google ostali dobri milosti za svrstavanje. Slijedom toga, poštujući zakone pretraživača, tvrtke također vode računa o najboljim interesima svojih posjetitelja.

Na kraju dana, to je ono što prvenstveno zanima tražilice: korisnici interneta. Pomaganje u povezivanju s potrebnim informacijama i očuvanje sigurnosti dok to čine.

Ali to nije ono što su Internet ili tražilice u početku izgledali – ili namjeravali učiniti –
još u 1960-ima kada je sve to počelo. Ako niste upoznati s povijesti tražilica, kopčajte. Vodit ćemo vas dugim i vjetrovitim putem kroz sve tražilice koje su utrle put Googleu.

Nije tako SMART kao Google: Putovanje do savršene tražilice

Nije tako SMART kao Google: Putovanje do savršene tražilice

Gotovo svi s internetskom vezom prije su koristili tražilicu, ali jeste li se ikad zapitali kako je tražilica nastala? Tko ga je izmislio? Što je bilo prvo? Zatim slijedite, jer imamo cijelu priču.

Predsljednik

  • Ime:
    • SMART sustav dohvaćanja informacija
      • SMART je akronim za Saltonov čarobni automatski automatski retriver
  • objavljen:
    • 1960
  • Koristiti:
    • Interaktivna baza podataka
  • Razvijen od:
    • Gerard Salton
    • Chris Buckley
    • Ostali na Sveučilištu Cornell
  • Inovacije:
    • Model vektorskog prostora:
      • Način automatskog ponderiranja rezultata pretraživanja za prikaz onih koji su najrelevantniji za korisnika
    • Povratne informacije o relevantnosti:
      • Način na koji korisnici mogu ocijeniti relevantnost rezultata pretraživanja
    • Rocchio klasifikacija:
      • Vrsta klasifikacijske metode koja povećava preciznost pretraživanja

U početku

  • Prije pojave svjetskog weba i tražilicama Internet je bio:
    • Zbirka web-mjesta datoteka za protokol datoteka (FTP) na kojima bi korisnici mogli navigirati kako bi pronašli određene zajedničke datoteke
    • Grupe vijesti u kojima su ljudi komunicirali i distribuirali informacije poput FAQ-a.
  • Prvi
    • Ime:
      • Archie
    • objavljen:
      • 1990
    • Koristiti:
      • FTP arhivski indeks
    • Razvijen od:
      • Alan Emtage
      • Peter Deutsch
      • Bill Heelan
    • Inovacije:
      • Dopušteno udaljenim korisnicima da pregledaju popise anonimnih FTP web mjesta koja sadrže:
        • Softver
        • Pitanja i odgovori
        • Arhiva vijesti
      • Popis i automatski ažurira popis dostupnih poslužitelja
    • Ostale informacije:
      • U rujnu 1990. Archie je sastavio bazu podataka sa 210 mjesta
      • Archie je 1992. sadržavao 2,6 milijuna datoteka (otprilike 150 GB podataka)
  • Archiejevi prijatelji
    • Ime:
      • veronika
      • Jughead
    • objavljen:
      • 1993
    • Koristiti:
      • Gopher indeks
    • Razvijen od:
      • Fred Barrie i Steven Foster
      • Rhett Jones
    • Inovacije:
      • Oba motora su razvijena kako bi pretraživanje kroz Gopher servere bilo lakše
      • Veronica je kreirala indekse datoteka Gopher običnih teksta
      • Jughead bi mogao upotrebljavati boolove pojmove za pretraživanje da bi pregledao jedan Gopher server
    • Ostale informacije:
      • Iako se Archie nije trebao odnositi na lik stripa, ljudi koji su napisali Veronicu i Jughead smatrali su da će biti zanimljivo nastaviti temu
      • Pozadi su stvoreni za oba:
        • Veronica: “Vrlo lagan mrežni indeks orijentiran na glodavce do računalnih arhiva”
        • Jughead: “Iskopiranje i prikazivanje univerzalne hijerarhije gofora Jonzyja”
      • Veronica je pretražila 5.500 Gopher servera i indeksirala preko 10 milijuna predmeta / dokumenata
  • Izum weba
    • Tim Berners-Lee i njegov tim iz CERN-a započeli su 1989. godine započeti rad na HTTP-u:
      • Sustav za slanje i primanje hipertekstualnih dokumenata koji bi se međusobno povezali u svojevrsnu mrežu.
      • To je brzo nadopunjeno za pružanje:
        • Veći pregovori klijent-poslužitelj
        • Metapodaci
        • sigurnosti
    • Rani preglednici uključuju:
      • ViolaWWW
      • sprečava se
      • MidasWWW
      • Mozaik
    • Kako je broj web poslužitelja rastao, web je postao sučelje za pristup internetu:
      • Na web stranici NCSA objavljeni su novi poslužitelji pod stavkom “Što je novo”
        • Mnoge su web stranice dale svoj popis “zanimljivih web mjesta”.
      • Ovaj središnji popis nije mogao pratiti rast koji je stvorio potrebu za pronalaženjem i organiziranjem svih podataka na webu

Nije potreban robot

  • Ime:
    • ALIWEB, što znači Archie-Like indeksiranje za WEB
  • objavljen:
    • Listopada 1993. godine
  • Format:
    • Indeks web mjesta sa samonalazom
  • Razvijen od:
    • Martijn Koster
  • Inovacije:
    • HTTP ekvivalent Archieja
    • Nisu koristili robota koji pretražuje web
      • Webmasteri web lokacija koji sudjeluju morali su objaviti svoje podatke o indeksima za svaku stranicu koju žele na popisu
        • prednosti:
          • Korisnici bi mogli opisati svoje stranice
          • Robot se nije pokretao oko toga da pojede neto širinu pojasa
        • Nedostaci:
          • Indeksiranje datoteka bilo je komplicirano za većinu ljudi
          • Poteškoća korištenja značila je relativno malu bazu podataka
  • Ostale informacije:
    • Pokušali su nadoknaditi složenost dodavanjem drugih baza podataka u ALIWEB pretraživanja, ali nisu se mogli natjecati s novijim pretraživačima na bazi bot

Indeks

  • Ime:
    • WebCrawler
  • objavljen:
    • 1994
  • Koristiti:
    • Indeksiranje web mjesta indeksa
  • Razvijen od:
    • Brian Pinkerton
  • Inovacije:
    • Prvo alat za indeksiranje indeksira cijele web stranice, a ne samo imena datoteka ili web stranica
  • Ostale informacije:
    • Kada je prvi put objavljen, WebCrawler je imao dokumente s preko 6 000 poslužitelja
    • Pet mjeseci nakon objavljivanja, dobivao je u prosjeku 15.000 upita dnevno
    • WebCrawler je brzo postao toliko popularan da je tijekom dana bio gotovo neupotrebljiv

Biblioteka Pauk

  • Ime:
    • Lycos
  • objavljen:
    • 1994
  • Koristiti:
    • Indeks web stranica
  • Razvijen od:
    • Michael Mauldin
  • Inovacije:
    • Najveća biblioteka indeksiranih web mjesta u to vrijeme
  • Ostale informacije
    • Lycos je ime dobio po pauku vuku, Lycosidae Lycosa, jer pauk lovi svoj plijen, a ne ulovi ga u mrežu
    • U javnosti je Lycos imao na raspolaganju 54 000 dokumenata
    • Identificiralo je gotovo 400 000 dokumenata u jednom mjesecu
    • Za pet mjeseci Lycos je identificirao 1,1 milijun dokumenata
    • Do studenog 1996. njezin je katalog sadržavao 60 milijuna dokumenata

Riječ Smiths

  • Ime:
    • Uzbuđujte, izvorno nazvan Architext
  • objavljen:
    • 1995
  • Koristiti:
    • Indeks riječi web mjesta
  • Razvio šest učenika Stanforda:
    • Joe Kraus
    • Ben Lutch
    • Ryan McIntyre
    • Martin Reinfried
    • Graham Spencer
    • Mark Van Haren
  • Inovacije:
    • Pretraživanje je učinilo relevantnijim korištenjem ideje da se pogled na odnose riječi vrši statističkom analizom, tada revolucionarnim pristupom
    • Nakon pokretanja Excite.com je indeksirao 1,5 milijuna stranica, što je veliki broj za to vrijeme
  • Ostale informacije:
    • Exite je potpisao velike ponude s Netscapeom i Microsoftom
    • Excite je nastavio rasti s prihodima većim od 150 milijuna USD od 1998
    • Dvoje kolega sa Stanforda, Larry Page i Sergey Brin, osnovani od Googlea, ponudili su prodati svoju tvrtku Exciteu za milion dolara u 1999. godini
      • Oni su bili voljni podmiriti se za samo 750.000 dolara
      • Excite je odbio ono što će postati najveća tražilica u povijesti – tvrtka vrijedna 180 milijardi dolara
    • Yahoo je želio kupiti Excite, ali je odbijen
    • Excite su se spojili s @Home Network 1999. godine, a bankrotirali su 2001. godine

Proto-Google

  • Ime:
    • AltaVista
  • objavljen:
    • 1995
  • Koristiti:
    • Indeks web stranica u cijelom tekstu
  • Razvijen od:
    • Louis Monier
    • Michael Burrows
  • Inovacije:
    • Povijest SEO smatra “prvom pretraživačkom bazom podataka s puno teksta u svijetu s jednostavnim sučeljem”
    • Prva tražilica koja će tražiti:
      • slike
      • zvučni
      • Video
    • Stvorila Babel Fish, prvu višejezičnu pretragu, koja bi mogla prevesti:
      • Engleski
      • francuski
      • njemački
      • talijanski
      • Portugalski
      • španjolski
      • ruski
  • Ostale informacije:
    • AltaVista znači “pogled odozgo”
    • Godine 1996. AltaVista je bio najveći web indeks
      • 33 GB veličine
      • 30 milijuna stranica s 225.000 poslužitelja
      • Pristupilo se u prosjeku 12 milijuna puta dnevno
        • To je otprilike 140 puta u sekundi

Web Butler

  • Ime:
    • Pitajte Jeevesa
  • objavljen:
    • 1997
  • Koristiti:
    • Indeks web stranica na prirodnom jeziku
  • Razvijen od:
    • Garrett Gruener
    • David Warthen
  • Inovacije:
    • Razvijeno za pretraživač prirodnih jezika
    • Ljudski urednici pomogli su s nekim uobičajenim upitima pretraživanja
  • Ostale informacije:
    • Batler je referenca na Jeevesa, službenica iz P.G. Wodehouseovi Jeeves-Wooster romani
    • U 2010. godini, Ask Jeeves je označio kao pitanje zajednice & Služba odgovaranja

Šampion

  • Ime:
    • Google
  • oslobođen
    • 1998
  • Koristiti:
    • Rekurzivni indeks web stranica
  • Razvijen od:
    • Larry Page
    • Sergej Brin
  • Inovacije:
    • PageRank je kreirao sustav ponderiranja citata koji:
      • Procijenila su koja su web mjesta pouzdanija na temelju snage drugih web lokacija koje su povezane s njima
      • Danas je to osnova za gotovo sve tražilice
  • Ostale informacije:
    • “Stranica” u PageRank-u odnosi se na Larryja, a ne na web stranice.
    • Zbog svoje fokusiranosti na povratne veze, Google je izvorno nazvan “BackRub”
    • Prva web stranica koju je Google pretraživač pretraživao bila je početna stranica Sveučilišta Stanford
    • Googleov indeks veličine je više od 100 milijuna GB
    • Ljudi koriste Google za obavljanje više od sto milijardi pretraga svakog mjeseca
      • To je više od 40.000 pretraživanja u sekundi
    • Google Now:
      • Koristi korisničko sučelje na prirodnom jeziku za:
        • Odgovori na pitanje
        • Dajte preporuke
        • Izvršite radnje delegirajući zahtjeve skupu web usluga
      • Inteligentni je osobni asistent, dostupan:
        • U aplikaciji za pretraživanje Google za mobilne uređaje
        • Na web pregledniku Google Chrome
      • Može proaktivno davati informacije koje predviđa na temelju korisničkih navika pretraživanja
      • Omogućuje ljudima da koriste kartice Nowa da bi dobili prave informacije u pravom trenutku bez potrebe za traženjem
        • Informacije automatski organizira u jednostavne kartice koje se pojavljuju samo onda kada ih korisnici trebaju
        • Korisnici dobivaju promet na posao prije posla, pronalaze popularna mjesta u blizini, dobivaju trenutni rezultat svog omiljenog tima

Mali motori koji bi to mogli

Google danas nema mnogo konkurenata, ali evo dva koji se trude, unatoč velikim kvotama:

  • Duck Duck Go
    • Tvrdi da uklanja svu neželjenu poštu u rezultatima Googlea
    • Ima čisto sučelje
    • Ne prati korisnike
    • Ima puno manje oglasa od Googlea
  • Bing
    • Microsoftova tražilica
    • Daje slične rezultate Googleu
    • Ima mnogo manju bazu web stranica
    • Yahoo! koristi Bing za svoju tražilicu

Dok većina ljudi misli na “Google” kad čuju “tražilicu”, postojalo je nekoliko različitih motora prije nego što su Page i Brin web-indeks pretraživača poletjeli. Iako danas mnogi ljudi ne koriste Veroniku ili Lycos, Internet ne bi bio ono što nije bez njih.

izvori: searchchenginehistory.com, sigir.org, csse.monash.edu.au, nlp.stanford.edu, seobythesea.com, groups.google.com, savetz.com, dummies.com, searchchenginearchive.com, netlingo.com, searchnetworking. techtarget.com, whatis.techtarget.com, salientmarketing.com, learnnthenet.com, ryanmacintyre.com, searchchenginepeople.com, todayifoundout.com, thehistoryofseo.com, wiley.com, dictionary.reference.com, mashable.com, arhiva. wired.com, google.com

izvori

  • Povijest tražilica: od 1945. do Google danas
  • Sustav SMART – Rezultati pretraživanja i planovi za budućnost (PDF)
  • Pametno okruženje za ocjenu sustava za preuzimanje (PDF)
  • Bodovanje, ponderiranje i model vektorskog prostora
  • Povratne informacije o relevantnosti i povratne informacije o pseudo relevantnosti
  • Rocchio klasifikacija
  • Poslužitelj internetske arhive
  • Članak Kevin Savetz
  • Što je FTP?
  • Tražilice prije web pretraživanja
  • Slabosti na Archieju, Gopheru, Veronici i Jugheadu
  • Što je Veronica?
  • Što je Jughead?
  • Veronica, baka tražilica – 1993
  • Archie’s Pal, Jughead – 1993
  • Pretraživanje baza podataka
  • Kratka povijest uzbudljivosti
  • 7 tražilice Google obrisano
  • Uzbudite se, imali priliku kupiti Google za 750 tisuća dolara, ali odustali su
  • Kratka povijest ranih pretraživača
  • Povijest tražilica
  • Kratka povijest ranih pretraživača
  • Lycos – 1994
  • Alta Vista u tehnologiji
  • Pitajte.com ponovo se iznova fokusira na P Q zajednice&
  • Rođenje Googlea
  • Kako pretraga funkcionira
Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me