自動外鏈工具 在線排版工具 搜索引擎提交入口 wordpress主題推薦 批量打開網址工具 【老域名購買】 思享SEO導航 【網站合作】

搜索引擎的前世今生

774
文章目錄
  1. 組成
  2. 起源
  3. 前世
  4. 發展
  5. 今生

搜索引擎(Search Engine):是指根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎與免費鏈接列表等。

排名優化

組成

一個搜索引擎由搜索器 、索引器 、檢索器 和用戶接口 四個部分組成。搜索器的功能是在互聯網中漫游,發現和搜集信息。索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用于表示文檔以及生成文檔庫的索引表。檢索器的功能是根據用戶的查詢在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,并實現某種用戶相關性反饋機制。用戶接口的作用是輸入用戶查詢、顯示查詢結果、提供用戶相關性反饋機制。

起源

所有搜索引擎的祖先,是1990年由Montreal的McGill University三名學生(Alan Emtage、Peter Deutsch、Bill Wheelan)發明的Archie(Archie FAQ)。Alan Emtage等想到了開發一個可以用文件名查找文件的系統,于是便有了Archie。Archie是第一個自動索引互聯網上匿名FTP網站文件的程序,但它還不是真正的搜索引擎。Archie是一個可搜索的FTP文件名列表,用戶必須輸入精確的文件名搜索,然后Archie會告訴用戶哪一個FTP地址可以下載該文件 ;由于Archie深受歡迎,受其啟發,Nevada System Computing Services大學于1993年開發了一個Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后來另一個Gopher搜索工具。

前世

互聯網發展早期,以雅虎為代表的網站分類目錄查詢非常流行。網站分類目錄由人工整理維護,精選互聯網上的優秀網站,并簡要描述,分類放置到不同目錄下。用戶查詢時,通過一層層的點擊來查找自己想找的網站。也有人把這種基于目錄的檢索服務網站稱為搜索引擎,但從嚴格意義上講,它并不是搜索引擎。

1990年,加拿大麥吉爾大學(University of McGill)計算機學院的師生開發出Archie。當時,萬維網(World Wide Web)還沒有出現,人們通過FTP來共享交流資源。Archie能定期搜集并分析FTP服務器上的文件名信息,提供查找分別在各個FTP主機中的文件。用戶必須輸入精確的文件名進行搜索,Archie告訴用戶哪個FTP服務器能下載該文件。雖然Archie搜集的信息資源不是網頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務。所以,Archie被公認為現代搜索引擎的鼻祖。

編程

發展

【Excite】

1、Excite的歷史可以上溯到1993年2月,6個Stanford University(斯坦福大學)大學生的想法是分析字詞關系,以對互聯網上的大量信息作更有效的檢索。到1993年中,這已是一個完全投資項目,他們還發布了一個供webmasters在自己網站上使用的搜索軟件版本,后來被叫做Excite for Web Servers。

注:Excite后來曾以概念搜索聞名,2002年5月,被Infospace收購的Excite停止自己的搜索引擎,改用元搜索引擎 Dogpile

2、1994年4月,斯坦福大學的兩名博士生,美籍華人楊致遠和David Filo共同創辦了Yahoo!隨著訪問量和收錄鏈接數的增長,Yahoo目錄開始支持簡單的數據庫搜索。因為Yahoo!的數據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。Yahoo!中收錄的網站,因為都附有簡介信息,所以搜索效率明顯提高。

注:Yahoo!以后陸續有 Altavista、Inktomi、Google提供搜索引擎服務。

Yahoo!——幾乎成為20世紀90年代的因特網的代名詞。

3、1995年,一種新的搜索引擎形式出現了——元搜索引擎(Meta Search Engine)。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理后提交給多個預先選定的獨立搜索引擎,并從各獨立搜索引擎返回的所有查詢結果,集中起來處理后再返回給用戶。

第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上非常好聽,但搜索效果始終不理想,所以沒有哪個元搜索引擎有過強勢地位。

4、智能檢索的產生:它利用分詞詞典、同義詞典,同音詞典改善檢索效果,進一步還可在知識層面或者說概念層面上輔助查詢,通過主題詞典、上下位詞典、相關同級詞典檢索處理形成一個知識體系或概念網絡,給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果。

例:

⑴查詢“計算機”,與“電腦”相關的信息也能檢索出來;

⑵可以進一步縮小查詢范圍至“微機”、“服務器”或擴大查詢至“信息技術”或查詢相關的“電子技術”、“軟件”、“計算機應用”等范疇;

⑶還包括歧義信息和檢索處理,如“蘋果”,究竟是指水果還是電腦品牌,“華人”與“中華人民共和國”的區分,將通過歧義知識描述庫、全文索引、用戶檢索上下文分析以及用戶相關性反饋等技術結合處理,高效、準確地反饋給用戶最需要的信息。

5、個性化趨勢是搜索引擎的一個未來發展的重要特征和必然趨勢之一。一種方式通過搜索引擎的社區化產品(即對注冊用戶提供服務)的方式來組織個人信息,然后在搜索引擎基礎信息庫的檢索中引入個人因素進行分析,獲得針對個人不同的搜索結果。自2004年10月yahoo推出myweb測試版,到11月a9推出個性化功能,到2005年Googlesearchhistory基本上都沿著一條路子走,分析特定用戶的搜索需求限定的范圍,然后按照用戶需求范圍擴展到互聯網上其他的同類網站給出最相關的結果。另外一種是針對大眾化的,Google個性化搜索引擎,或者yahooMindSet,或者我們都知道的前臺聚類的vivisimo。但是無論其中的哪一種實現方式,即Google的主動選擇搜索范圍,還是yahoo,vivisimo的在結果中重新組織自己需要的信息,都是一種實驗或者創想,短期內無法成為主流的搜索引擎應用產品。

6、網格技術(great global grid):由于沒有統一的信息組織標準對網絡信息資源進行加工處理,難以對無序的網絡信息資源進行檢索、交接和共享乃至深層次的開發利用,形成信息孤島。網格技術就是要消除信息孤島實現互聯網上所有資源的全面連通。

全球信息網格(Global Information Grid)

Robot(機器人)一詞對編程者有特殊的意義。Computer Robot是指某個能以人類無法達到的速度不斷重復執行某項任務的自動程序。由于專門用于檢索信息的Robot程序像蜘蛛(spider)一樣在網絡間爬來爬去,因此,搜索引擎的Robot程序被稱為spider程序。

1993年Matthew Gray開發了 World Wide Web Wanderer,這是第一個利用HTML網頁之間的鏈接關系來檢測萬維網規模的“機器人(Robot)”程序。開始,它僅僅用來統計互聯網上的服務器數量,后來也能夠捕獲網址(URL)。

1994年4月,斯坦福大學(Stanford University)的兩名博士生,美籍華人Jerry Yang(楊致遠)和David Filo共同創辦了Yahoo。隨著訪問量和收錄鏈接數的增長,Yahoo目錄開始支持簡單的數據庫搜索。因為Yahoo!的數據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。雅虎于2002年12月23日收購inktomi,2003年7月14日收購包括Fast和Altavista在內的Overture,2003年11月,Yahoo全資收購3721公司。

1994年初,華盛頓大學(University of Washington )的學生Brian Pinkerton開始了他的小項目WebCrawler。

1994年4月20日,WebCrawler正式亮相時僅包含來自6000個服務器的內容。WebCrawler是互聯網上第一個支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動取正文的前100個字。

1994年7月,卡內基·梅隆大學(Carnegie Mellon University)的Michael Mauldin將John Leavitt的spider程序接入到其索引程序中,創建了Lycos。除了相關性排序外,Lycos還提供了前綴匹配和字符相近限制,Lycos第一個在搜索結果中使用了網頁自動摘要,而最大的優勢還是它遠勝過其它搜索引擎的數據量。

1994年底,Infoseek正式亮相。其友善的界面,大量的附加功能,使之和Lycos一樣成為搜索引擎的重要代表。

1995年,一種新的搜索引擎形式出現了——元搜索引擎(A Meta Search Engine Roundup)。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理,提交給多個預先選定的獨立搜索引擎,并將從各獨立搜索引擎返回的所有查詢結果,集中起來處理后再返回給用戶。第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。

1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier創立了Inktomi,1996年5月20日,Inktomi公司成立,強大的HotBot出現在世人面前。聲稱每天能抓取索引1千萬頁以上,所以有遠超過其它搜索引擎的新內容。HotBot也大量運用cookie儲存用戶的個人搜索喜好設置。

1995年12月,DEC的正式發布AltaVista。AltaVista是第一個支持自然語言搜索的搜索引擎,第一個實現高級搜索語法的搜索引擎(如AND、 OR、 NOT等)。用戶可以用AltaVista搜索新聞組(Newsgroups)的內容并從互聯網上獲得文章,還可以搜索圖片名稱中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也聲稱是第一個支持用戶自己向網頁索引庫提交或刪除URL的搜索引擎,并能在24小時內上線。AltaVista最有趣的新功能之一,是搜索有鏈接指向某個URL的所有網站。在面向用戶的界面上,AltaVista也作了大量革新。它在搜索框區域下放了“tips”以幫助用戶更好的表達搜索式,這些小tip經常更新,這樣,在搜索過幾次以后,用戶會看到很多他們可能從來不知道的的有趣功能。這系列功能,逐漸被其它搜索引擎廣泛采用。1997年,AltaVista發布了一個圖形演示系統LiveTopics,幫助用戶從成千上萬的搜索結果中找到想要的。

1997年8月,Northernlight搜索引擎正式現身。它曾是擁有最大數據庫的搜索引擎之一,它沒有Stop Words,它有出色的Current News、7100多出版物組成的Special Collection、良好的高級搜索語法,第一個支持對搜索結果進行簡單的自動分類。

1998年10月之前,Google只是斯坦福大學(Stanford University)的一個小項目BackRub。1995年博士生Larry Page開始學習搜索引擎設計,于1997年9月15日注冊了域名,

1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同參與下,BachRub開始提供Demo。

1999年2月,Google完成了從Alpha版到Beta版的蛻變。Google公司則把1998年9月27日認作自己的生日。Google以網頁級別(Pagerank)為基礎,判斷網頁的重要性,使得搜索結果的相關性大大增強。Google公司的奇客(Geek)文化氛圍、不作惡(Don’t be evil)的理念,為Google贏得了極高的口碑和品牌美譽。

2006年4月,Google宣布其中文名稱“谷歌”,這是Google第一個在非英語國家起的名字。

Fast(Alltheweb)公司創立于1997年,是挪威科技大學(NTNU)學術研究的副產品。1999年5月,發布了自己的搜索引擎AllTheWeb。Fast創立的目標是做世界上最大和最快的搜索引擎,幾年來庶幾近之。Fast(Alltheweb)的網頁搜索可利用ODP自動分類,支持Flash和pdf搜索,支持多語言搜索,還提供新聞搜索、圖像搜索、視頻、MP3、和FTP搜索,擁有極其強大的高級搜索功能。(2003年2月25日,Fast的互聯網搜索部門被Overture收購)。

seo

今生

【Openfind】

Openfind :創立于1998年1月,其技術源自臺灣中正大學吳升教授所領導的GAIS實驗室。Openfind起先只做中文搜索引擎,鼎盛時期同時為三大著名門戶新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市場逐漸被Baidu和Google瓜分。2002年6月,Openfind重新發布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累計抓取網頁35億,開始進入英文搜索領域。

2000年1月,兩位北大校友,超鏈分析專利發明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士后)在北京中關村創立了百度(Baidu)公司。2001年8月發布百度搜索引擎Beta版(此前Baidu只為其它門戶網站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式發布Baidu搜索引擎,專注于中文搜索。

Baidu搜索引擎的其它特色包括:百度快照、網頁預覽/預覽全部網頁、相關搜索詞、錯別字糾正提示、mp3搜索、Flash搜索。

2002年3月閃電計劃(Blitzen Project)開始后,技術升級明顯加快。后推出貼吧、知道、地圖、國學、百科、文檔、視頻、博客等一系列產品,深受網民歡迎。2005年8月5日在納斯達克上市,發行價為USD 27.00,代號為BIDU。開盤價USD 66.00,以USD 122.54收盤,漲幅353.85%,創下了5年以來美國股市上市新股當日漲幅最高紀錄。

2003年12月23日,原慧聰搜索正式獨立運作,成立了中國搜索。2004年2月,中國搜索發布桌面搜索引擎網絡豬1.0,2006年3月中搜將網絡豬更名為IG(Internet Gateway) 。

2005年6月,新浪正式推出自主研發的搜索引擎“愛問”。2007年起,新浪愛問使用google搜索引擎。

搜搜作為騰訊旗下的搜索引擎網站于2006年3月正式發布并開始運營,搜搜目前已成為中國網民首選的三大搜索引擎之一,主要為網民提供實用便捷的搜索服務,同時承擔騰訊全部搜索業務,是騰訊整體在線生活戰略中重要的組成部分之一。

2006年底有道搜索推出測試版,并于2007年12月11日推出正式版。目前有道搜索已推出的產品包括網頁搜索、圖片搜索、購物搜索、音樂搜索、視頻搜索、博客搜索、地圖搜索、海量詞典、桌面詞典、工具欄和有道閱讀、有道熱聞等。

2007年7月1日 ;全面采用網易自主研發的有道搜索技術,并且合并了原來的綜合搜索和網頁搜索。有道網頁搜索、圖片搜索和博客搜索為網易搜索提供服務。其中網頁搜索使用了其自主研發的自然語言處理、分布式存儲及計算技術;圖片搜索首創根據拍攝相機品牌、型號,甚至季節等高級搜索功能;博客搜索相比同類產品具有抓取全面、更新及時的優勢,提供“文章預覽”,“博客檔案”等創新功能。

2009年4月,中搜與方正阿帕比合資成立公司,共同拓展圖書搜索領域業務;

Bing是一款微軟公司推出的用以取代Live Search的搜索引擎。微軟CEO史蒂夫?鮑爾默(Steve Ballmer)于2009年5月28日在《華爾街日報》于圣迭戈(San Diego)舉辦的“All Things D”公布,簡體中文版bing已于2009年6月1日正式對外開放訪問。

2010年4月由中國人民日報社推出即刻搜索,即刻搜索打出不做競價排名的口號,同時杜絕垃圾廣告信息,簡潔清晰的畫面讓用戶體驗度做到極致,搜到的都是有用的東西,而且其發展兩年便有如此勢頭,即刻搜索以后的發展也是不可限量的。

2012年8月16日,奇虎360推出綜合搜索,360擁有強大的用戶群和流量入口資源,這對其他搜索引擎將極具競爭力,該服務初期采用二級域名,整合了百度搜索、谷歌搜索內容,可實現平臺間的快速切換。

2014年搜搜合并到搜狗旗下。

2015年1月6日消息,360總裁齊向東向全體員工發送郵件,宣布360搜索將正式推出獨立品牌“好搜”,原域名可直接跳轉至新域名。

現在的國內搜索營銷幾乎為三分天下:第一是百度。第二是好搜(360搜索),第三為搜狗。

搜狗搜索

總結

如今搜索引擎應該是基于物聯網的搜索,物聯網搜索擁有更廣闊的搜索空間,現在能預測到物聯網一個最典型的應用就是:找東西!比如遠程看管小孩、老人,或搜索走失小孩,包括精確到厘米的GPS定位,比如你去一個陌生的地方,找廁所,找窗口,甚至找警察。同時,不僅僅是你找東西,甚至還有可能東西找你,比如泊車后超過某個時間點,讓車主動呼叫你,飯煮好了,電飯堡呼叫你,提前打開的空調使用室溫保持到預定溫度后,空調呼叫你等等。

原文:《搜索引擎的前世今生

來源:本文由思享SEO博客原創撰寫,歡迎分享本文,轉載請保留出處和鏈接!
seo培訓評論廣告

搶沙發

昵稱*

郵箱*

網址

七乐彩选号技巧