1. 中文搜索引擎的搜索引擎發展史
90年初當時萬維網(World Wide Web)還未出現,為了查詢散布在各個分散的主機中的文件,曾有過Archie, Gopher等搜索工具,隨著互聯網的迅速發展,基於HTTP訪問的web技術的迅速普及,他們就不再能適應用戶的需要。在1994年1月,第一個既可搜索又可瀏覽的分類目錄EINet Galaxy(Tradewave Galaxy)上線,它還支持Gopher和Telnet搜索。同年4月,Yahoo目錄誕生,隨著訪問量和收錄鏈接數的增長,開始支持簡單的資料庫查詢。這就是我們說的早期的,目錄導航系統,他們的缺點網站收錄/更新都是要考人工維護,所以在信息量劇增的條件下,就不是非常受用了。
1994年7月,Lycos推出了基於robot的數據發現技術,並支持搜索結果相關性排序,並且他第一個開始在搜索結果中使用了網頁自動摘要。Infoseek也是同時期的一個重要代表,他們是搜索引擎史上一個重要的進步。
1995年,一種新的搜索引擎工具出現了——元搜索引擎,第一個元搜索引擎是華盛頓大學的學生開發的Metacrawler。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理後提交給多個預先選定的獨立搜索引擎,並將從各獨立搜索引擎返回的所有查詢結果,集中起來處理後再返回給用戶。
1995年12月才登場亮相的AltaVista推出了大量的創新功能使它迅速到達當時搜索引擎的頂峰,它第一個支持自然語言搜索的搜索引擎,具備了基於網頁內容分析,智能處理的能力,第一個實現高級搜索語法的搜索引擎(如AND, OR, NOT等), 同時AltaVista還支持搜索新聞群組(Newsgroups),搜索圖片等具有劃時代意義的功能。 同時期還有inktomi,HotBot等搜索引擎。
1997年8月Northernlight 公司正式推出搜索引擎,它第一個支持對搜索結果進行簡單的自動分類,也是當時擁有最大資料庫的搜索引擎之一。
1998年10月,Google誕生。它是目前最流行的搜索引擎之一,具備很多獨特而且優秀的功能,並且在界面等實現了革命性創新。
1999年5月,Fast(Alltheweb)公司發布了自己的搜索引擎AllTheWeb,它的網頁搜索可利用ODP自動分類,支持Flash和pdf搜索,支持多語言搜索,還提供新聞搜索、圖像搜索、視頻、MP3、和FTP搜索,擁有極其強大的高級搜索功能。它曾經是最流行的搜索引擎之一,後在2003年2月被Overture收購。
在中文搜索引擎領域,1996年8月成立的搜狐公司是最早參與作網路信息分類導航的網站,曾一度有「出門找地圖,上網找搜狐的」美譽。由於其人工分類提交的局限性,隨著網路信息的暴增,逐漸被基於robot自動抓取智能分類的新一代信息技術取代。
台灣中正大學吳升教授所領導的GAIS實驗室1998年1月創立了Openfind中文搜索引擎,是最早開發的中文智能搜索引擎,採用GAIS實驗室推出多元排序(PolyRankTM)核心技術,截止2002年6月,宣布累計抓取網頁35億,開始進入英文搜索領域。
北大天網是教育網最流行的搜索引擎,它由北大計算機系網路與分布式系統研究室開發,於1997年10月29日正式在CERNET上提供服務, 2000年初成立天網搜索引擎新課題組,由國家973重點基礎研究發展規劃項目基金資助開發,收錄網頁約6000萬,利用教育網優勢,有強大的ftp搜索功能。
中文搜索由超鏈分析專利發明人、前Infoseek資深工程師李彥宏和好友徐勇2000年1月創建,目前支持網頁信息檢索,圖片,Flash,音樂等多媒體信息的檢索。並且在中文領域第一個開始使用ppc經營模式。
2002年開始進入搜索引擎市場的中搜是由慧聰國際主持開發的,是搜索領域的後起之秀。目前處於起步階段,技術沒有特別見長的優勢。
2. 誰知道互聯網搜索引擎的發展歷史
在互聯網發展初期,網站相對較少,信息查找比較容易。然而伴隨互聯網爆炸性的發展,普通網路用戶想找到所需的資料簡直如同大海撈針,這時為滿足大眾信息檢索需求的專業搜索網站便應運而生了。
現代意義上的搜索引擎的祖先,是1990年由蒙特利爾大學學生Alan Emtage發明的Archie。雖然當時World Wide Web還未出現,但網路中文件傳輸還是相當頻繁的,而且由於大量的文件散布在各個分散的FTP主機中,查詢起來非常不便,因此Alan Archie工作原理與現在的搜索引擎已經很接近,它依靠腳本程序自動搜索網上的文件,然後對有關信息進行索引,供使用者以一定的表達式查詢。由於Archie深受用戶歡迎,受其啟發,美國內華達System Computing Services大學於1993年開發了另一個與之非常相似的搜索工具,不過此時的搜索工具除了索引文件外,已能檢索網頁。
當時,「機器人」一詞在編程者中十分流行。電腦「機器人」(Computer Robot)是指某個能以人類無法達到的速度不間斷地執行某項任務的軟體程序。由於專門用於檢索信息的「機器人」程序象蜘蛛一樣在網路間爬來爬去,因此,搜索引擎的「機器人」程序就被稱為「蜘蛛」程序。世界上第一個用於監測互聯網發展規模的「機器人」程序是Matthew Gray開發的World wide Web Wanderer。剛開始它只用來統計互聯網上的伺服器數量,後來則發展為能夠檢索網站域名。與Wanderer相對應,Martin Koster於1993年10月創建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用「機器人」程序,而是靠網站主動提交信息來建立自己的鏈接索引,類似於現在我們熟知的Yahoo。
隨著互聯網的迅速發展,使得檢索所有新出現的網頁變得越來越困難,因此,在Matthew Gray的Wanderer基礎上,一些編程者將傳統的「蜘蛛」程序工作原理作了些改進。其設想是,既然所有網頁都可能有連向其他網站的鏈接,那麼從跟蹤一個網站的鏈接開始,就有可能檢索整個互聯網。到1993年底,一些基於此原理的搜索引擎開始紛紛涌現,其中以JumpStation、The World Wide Web Worm(Goto的前身,也就是今天Overture),和Repository-Based Software Engineering (RBSE) spider最負盛名。然而JumpStation和WWW Worm只是以搜索工具在資料庫中找到匹配信息的先後次序排列搜索結果,因此毫無信息關聯度可言。而RBSE是第一個在搜索結果排列中引入關鍵字串匹配程度概念的引擎 最早現代意義上的搜索引擎出現於1994年7月。當時Michael Mauldin將John Leavitt的蜘蛛程序接入到其索引程序中,創建了大家現在熟知的Lycos。同年4月,斯坦福(Stanford)大學的兩名博士生,David Filo和美籍華人楊致遠(Gerry Yang)共同創辦了超級目錄索引Yahoo,並成功地使搜索引擎的概念深入人心。從此搜索引擎進入了高速發展時期。目前,互聯網上有名有姓的搜索引擎已達數百家,其檢索的信息量也與從前不可同日而語。比如最近風頭正勁的Google,其資料庫中存放的網頁已達30億之巨!
隨著互聯網規模的急劇膨脹,一家搜索引擎光靠自己單打獨斗已無法適應目前的市場狀況,因此現在搜索引擎之間開始出現了分工協作,並有了專業的搜索引擎技術和搜索資料庫服務提供商。象國外的Inktomi,它本身並不是直接面向用戶的搜索引擎,但向包括Overture(原GoTo)、LookSmart、MSN、HotBot等在內的其他搜索引擎提供全文網頁搜索服務。國內的網路也屬於這一類(注),搜狐和新浪用的就是它的技術。因此從這個意義上說,它們是搜索引擎的搜索引擎。
3. 搜索引擎的發展史
【第一代:分類目錄時代(人工時代)】
在自己的搜索引擎首頁設置導航網站作為自己的首頁,這個網址就是搜索引擎第一代的代表。可以從這個導航網站裡面看到,裡面幾乎都是一些分類網址,幾乎是所有在互聯網上的,這個網站裡面都一應俱全,從這里可以看出,這個網站是一個導航網站,也可以說分類目錄網站,用戶可以從這個分類目錄里找到自己想要的東西,這就是搜索引擎第一代。
【第二代:文本檢索時代(海量自動獲取與排序清單)】
到了這一代,搜索引擎查詢信息的方法則是通過用戶所輸入的查詢信息提交給伺服器,伺服器通過查閱,返回給用戶一些相關程度高的信息。這代的搜索引擎的信息檢索模型主要包括例如布爾模型、概率模型或者向量空間模型。通過這些模型來計算用戶輸入的查詢信息是否與網頁內容相關程度高低,將相關度高的則返回給用戶。採取這種模式的搜索引擎主要是一些早期的搜索引擎,例如像Alta Vista、Excite等等。這就是搜索引擎第二代。
【第三代:整合分析時代(立體搜索與結果整合)】
這一代的搜索引擎所使用的方法大概是和今天的網站的外部鏈接形式基本相同,在當時,外部鏈接代表的是一種推薦的含義,通過每個網站的推薦鏈接的數量來判斷一個網站的流行性和重要性。然後搜索引擎再結合網頁內容的重要性來和相似程度來改善用戶搜索的信息質量。這種模式的首先使用者是google,google不僅為首次使用並且大獲成功,這一成就在當時引起了學術界和其他商業搜索引擎的極度關注。後來,學術界以此成就為基礎,提出了更多的改進的鏈接分析演算法。大多數的主流搜索引擎都在使用分析鏈接技術演算法。這就是第三代搜索引擎
將用戶輸入關鍵字,反饋回來的海量信息,智能整合成一個門戶網站式的界面,讓用戶感覺每個關鍵字,都是一個完整的信息世界。而不是第二代一樣返回一個清單,整個清單夾雜著大量用戶不關心、且沒有分類的鏈接。
第三代搜索引擎的典型特徵就是:智慧整合第二代返回的信息為立體的界面。讓用戶能輕易地一眼進入到最相關的分類區域去獲取信息。
【第四代:用戶中心時代(以移動互聯網為標志的個人需求精準搜索)】
第四代,也就是大家所用的搜索引擎技術也是互聯網上面用的最普遍的,主要是以用戶為中心。當客戶輸入查詢的請求時候,同一個查詢的請求關鍵詞在用戶的背後可能是不同查詢要求。例如用戶輸入的是「蘋果」,那麼作為一個想要購買iPhone的用戶和一個果農來說,那麼要求就是大大的不一樣。甚至是同一個用戶,所查詢的關鍵詞一樣,也會因為所在的時間和所在的場合不同而返回的結果不同的所有主流搜索引擎,都在致力於解決同一個問題:怎樣才能從用戶所輸入的一個簡短的關鍵詞來判斷用戶的真正查詢請求。這一代搜索引擎主要是以用戶為中心。這就是第四代搜索引擎。
移動設備的使用者,即使不向移動搜索互聯網授權任何特徵信息,移動搜索互聯網仍然可以通過移動設備使用者在的搜索時的大量特徵,比如上網的時間習慣,操作習慣,內容歸類去逐漸勾勒出這人使用者的特徵信息,這種「推測式」演算法的可能性也是由於移動設備具有唯一性、隨身性而產生的。這好比是警察可能通過「嫌疑人」的行為習慣,去推測出他的「作案動機」與「體貌特徵」一樣。那麼,這些使用者的蛛絲馬跡,都是未來移動互聯網搜索引擎進行「商業數據挖掘」的巨大寶藏。
移動互聯網搜索的必然使命就是:提供精準到個人的搜索。可以說前三代搜索引擎,都是基於PC互聯網的搜索,而精準到個人需求的移動互聯網搜索,為「第四代搜索引擎」,那麼,最有可能實現這個第四代搜索引擎的人才,可能不來自於網路,甚至不來自於GOOGLE,而很有可能來自於亞馬遜、淘寶這些掌握了大量個人信息的商業巨頭,或者來自於跨界研究行為心理學、消費心理學、社會心理學等背景的IT研究機構或IT創業團隊,因為這些公司或機構,對人們的行為習慣背後的「動機」與「特徵」更加了如指掌。
【第五代:生活生態圈搜索時代(以物聯網為標志的實體搜索)】
第五代搜索引擎應該是基於物聯網的搜索,物聯網搜索擁有更廣闊的搜索空間,現在能預測到物聯網一個最典型的應用就是:找東西。比如遠程看管小孩、老人,或搜索走失小孩,包括精確到厘米的GPS定位,比如要去一個陌生的地方,找廁所,找窗口,甚至找警察。同時,不僅僅是找東西,甚至還有可能被找,比如泊車後超過某個時間點,讓車主動呼叫,飯煮好了,電飯堡呼叫,提前打開的空調使用室溫保持到預定溫度後,空調呼叫等等。
4. 搜索引擎發展歷程誰知道具體的
1990年:第一個互聯網上的搜索引擎Archie出現,用於搜索FTP伺服器上的文件。
1993年:6月,第一個Web搜索引擎World Wide Web Wandere出現,它只用來收集網址。10月,第二個Web搜索引擎ALIWEB出現。開始索引標題標簽等信息。
1994年:1月,早起最重要的搜索引擎之一Infoseek創立。(網路創始人李彥宏就是其核心工程師之一)
4月,雅虎Yahoo!創立。同月,第一個全文搜索引擎(索引文件全部內容)WebCrawler推出。
6月,Lycos創立。迅速成為最受歡迎的搜索引擎之一。
1995年:4月,雅虎Yahoo!正式成立。
12月,Infoseek成為網景瀏覽器的默認搜索引擎。同月,Alta Vista創立,迅速成為搜索引擎發展中最受歡迎的,堪稱當時的谷歌Glloge。
1996年:4月,雅虎Yahoo!上市。
1997年:4月,Ask Jeeves上線,唯一一個至今仍真實存在並有一定市場份額的早起搜索引擎。
1998年:9月,谷歌Google正式成立。
1999年:6月,曾經流行一時的搜索引擎Infoseek消失。
2000年:1月18日:網路成立。
7月,雅虎Yahoo!使用谷歌Google搜索數據。
2001年:10月,網路作為搜索引擎正式上線。
2002年:3月,谷歌Google Adwords 推出PPC形式,也就是按點擊付費。
2003年:7月,雅虎Yahoo!將除了谷歌Google之外的幾乎所有主流搜索技術收歸旗下。2004年:8月,谷歌Google上市。
2005年:8月,網路上市。
2006年:9月,MSN網路品牌全部改為Live、並做了大量推廣,Google仍然占最大地位。
2007年:3月,谷歌Google開始提供類似網站聯盟的按轉化付費的廣告形式。
2009年:6月,微軟Live Search 改名為必應(Bing)
7月29,雅虎Yahoo!被自己親手培養的Google谷歌徹底打敗在搜索引擎戰場。
2010年:8月,Yahoo!雅虎開始使用必應Bing搜索數據。
2011年:2月,Google谷歌推出Panda更新,旨在減少搜索結果中低質量頁面。對seo優化業績影響深遠。
2010年8月,NetMarketShare 統計數據,全球搜索引擎市場份額中谷歌Google占據�.73,佔世界絕對領先地位,網路由於中國搜索用戶數量龐大,搜索量排在第三位。但是國外使用網路者很少。
5. 請講一下搜索引擎的歷史
搜索引擎的發展歷史
1990年,加拿大麥吉爾大學(University of McGill)計算機學院的師生開發出Archie。當時,萬維網(World Wide Web)還沒有出現,人們通過FTP來共享交流資源。Archie能定期搜集並分析FTP伺服器上的文件名信息,提供查找分別在各個FTP主機中的文件。用戶必須輸入精確的文件名進行搜索,Archie告訴用戶哪個FTP伺服器能下載該文件。雖然Archie搜集的信息資源不是網頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務。所以,Archie被公認為現代搜索引擎的鼻祖。
Robot(機器人)一詞對編程者有特殊的意義。Computer Robot是指某個能以人類無法達到的速度不斷重復執行某項任務的自動程序。由於專門用於檢索信息的Robot程序象蜘蛛(spider)一樣在網路間爬來爬去,因此,搜索引擎的Robot程序被稱為spider程序。
1993年Matthew Gray開發了 World Wide Web Wanderer,這是第一個利用HTML網頁之間的鏈接關系來檢測萬維網規模的「機器人(Robot)」程序。開始,它僅僅用來統計互聯網上的伺服器數量,後來也能夠捕獲網址(URL)。
1994年4月,斯坦福大學(Stanford University)的兩名博士生,美籍華人Jerry Yang(楊致遠)和David Filo共同創辦了Yahoo。隨著訪問量和收錄鏈接數的增長,Yahoo目錄開始支持簡單的資料庫搜索。因為Yahoo!的數據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。雅虎於2002年12月23日收購inktomi,2003年7月14日收購包括Fast和Altavista在內的Overture,2003年11月,Yahoo全資收購3721公司。
1994年初,華盛頓大學(University of Washington )的學生Brian Pinkerton開始了他的小項目WebCrawler。1994年4月20日,WebCrawler正式亮相時僅包含來自6000個伺服器的內容。WebCrawler是互聯網上第一個支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動取正文的前100個字。
1994年7月,卡內基·梅隆大學(Carnegie Mellon University) 的Michael Mauldin將John Leavitt的spider程序接入到其索引程序中,創建了Lycos。除了相關性排序外,Lycos還提供了前綴匹配和字元相近限制,Lycos第一個在搜索結果中使用了網頁自動摘要,而最大的優勢還是它遠勝過其它搜索引擎的數據量。
1994年底,Infoseek正式亮相。其友善的界面,大量的附加功能,使之和Lycos一樣成為搜索引擎的重要代表。
1995年,一種新的搜索引擎形式出現了——元搜索引擎(A Meta Search Engine Rounp)。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理,提交給多個預先選定的獨立搜索引擎,並將從各獨立搜索引擎返回的所有查詢結果,集中起來處理後再返回給用戶。第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。
1995年12月,DEC的正式發布AltaVista。AltaVista是第一個支持自然語言搜索的搜索引擎,第一個實現高級搜索語法的搜索引擎(如AND, OR, NOT等)。用戶可以用AltaVista搜索新聞組(Newsgroups)的內容並從互聯網上獲得文章,還可以搜索圖片名稱中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也聲稱是第一個支持用戶自己向網頁索引庫提交或刪除URL的搜索引擎,並能在24小時內上線。AltaVista最有趣的新功能之一,是搜索有鏈接指向某個URL的所有網站。在面向用戶的界面上,AltaVista也作了大量革新。它在搜索框區域下放了「tips」以幫助用戶更好的表達搜索式,這些小tip經常更新,這樣,在搜索過幾次以後,用戶會看到很多他們可能從來不知道的的有趣功能。這系列功能,逐漸被其它搜索引擎廣泛採用。1997年,AltaVista發布了一個圖形演示系統LiveTopics,幫助用戶從成千上萬的搜索結果中找到想要的。
1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier創立了Inktomi,1996年5月20日,Inktomi公司成立,強大的HotBot出現在世人面前。聲稱每天能抓取索引1千萬頁以上,所以有遠超過其它搜索引擎的新內容。HotBot也大量運用cookie儲存用戶的個人搜索喜好設置。
1997年8月,Northernlight搜索引擎正式現身。它曾是擁有最大資料庫的搜索引擎之一,它沒有Stop Words,它有出色的Current News、7,100多出版物組成的Special Collection、良好的高級搜索語法,第一個支持對搜索結果進行簡單的自動分類。
1998年10月之前,Google只是斯坦福大學(Stanford University)的一個小項目BackRub。1995年博士生Larry Page開始學習搜索引擎設計,於1997年9月15日注冊了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同參與下,BachRub開始提供Demo。1999年2月,Google完成了從Alpha版到Beta版的蛻變。Google公司則把1998年9月27日認作自己的生日。Google以網頁級別(Pagerank)為基礎,判斷網頁的重要性,使得搜索結果的相關性大大增強。Google公司的奇客(Geek)文化氛圍、不作惡(Don』t be evil)的理念,為Google贏得了極高的口碑和品牌美譽。2006年4月,Google宣布其中文名稱「谷歌」,這是Google第一個在非英語國家起的名字。
Fast(Alltheweb)公司創立於1997年,是挪威科技大學(NTNU)學術研究的副產品。1999年5月,發布了自己的搜索引擎AllTheWeb。Fast創立的目標是做世界上最大和最快的搜索引擎,幾年來庶幾近之。Fast(Alltheweb)的網頁搜索可利用ODP自動分類,支持Flash和pdf搜索,支持多語言搜索,還提供新聞搜索、圖像搜索、視頻、MP3、和FTP搜索,擁有極其強大的高級搜索功能。(2003年2月25日,Fast的互聯網搜索部門被Overture收購)。
1996年8月,sohu公司成立,製作中文網站分類目錄,曾有「出門找地圖,上網找搜狐」的美譽。隨著互聯網網站的急劇增加,這種人工編輯的分類目錄已經不適應。sohu於2004年8月獨立域名的搜索網站「搜狗」,自稱「第三代搜索引擎」。
Openfind 創立於1998年1月,其技術源自台灣中正大學吳升教授所領導的GAIS實驗室。Openfind起先只做中文搜索引擎,鼎盛時期同時為三大著名門戶新浪、奇摩、雅虎提供中文搜索引擎,但2000年後市場逐漸被Bai和Google瓜分。2002年6月,Openfind重新發布基於GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累計抓取網頁35億,開始進入英文搜索領域。
2000年1月,兩位北大校友,超鏈分析專利發明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士後)在北京中關村創立了網路(Bai)公司。2001年8月發布Bai.com搜索引擎Beta版(此前Bai只為其它門戶網站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式發布Bai搜索引擎,專注於中文搜索。Bai搜索引擎的其它特色包括:網路快照、網頁預覽/預覽全部網頁、相關搜索詞、錯別字糾正提示、mp3搜索、Flash搜索。2002年3月閃電計劃(Blitzen Project)開始後,技術升級明顯加快。後推出貼吧、知道、地圖、國學、網路等一系列產品,深受網民歡迎。2005年8月5日在納斯達克上市,發行價為USD 27.00,代號為BIDU。開盤價USD 66.00,以USD 122.54收盤,漲幅353.85%,創下了5年以來美國股市上市新股當日漲幅最高紀錄。
2003年12月23日,原慧聰搜索正式獨立運做,成立了中國搜索。2004年2月,中國搜索發布桌面搜索引擎網路豬1.0,2006年3月中搜將網路豬更名為IG(Internet Gateway) 。
2005年6月,新浪正式推出自主研發的搜索引擎「愛問」。
6. 搜索引擎優化的發展歷史
搜索引擎優化()不是突然出現的一個技術,而是和搜索引擎同步發展起來的,兩者的關系雖然不能說是「矛和盾」的關系,但是可以肯定的是,因為有SEO才使得搜索引擎技術能夠變得更完善。
一、1994-1997年:雅虎誕生與SEO誕生
1993年8月,Lycos推出了基於搜索機器人的數據發現技術,並支持搜索結果相關性排序額,它還第一次讓搜索引擎能夠使用網頁自動摘要。
1995年底,Alta Vista推出,由於它具備大量的新的搜索功能,深受大眾好評,Alta Vista是第一個支持自然語言搜索,具備了基於網頁內容分析、智能處理的能力,第一個實現高級搜索語法的搜索引擎(如AND,OR,NOR等),同時還能搜索新聞群組中的內容,還能搜索圖片。
這一階段也是yahoo發展的初期階段,大多數人在這個時候對搜索並不熟悉,也不太知道有搜索引擎這回事,但是對於yahoo,大多數人則有所了解,尋找網站就上Yahoo。所以,將你的網站送到Yahoo是很必要的,在此階段,只要你的網站基本有個模樣,有一定的可看性,一般只要向Yahoo提交地址,72小時內就能出現在Yahoo目錄上。Yahoo對所有的網站進行人工歸類,一般是按照字母順序排列網站,自然開頭為「A」的網站排到開頭為「B」的前面,而有兩個A的網站,排在有A和B的網站前面,比如,American Airlines的網站不僅排在Bank of America的前面,而且也排在American Basketball Association前面。所以,大批網站就以追求A字來命名。這是搜索引擎優化的雛形。這個邏輯和黃頁電話號碼的排名邏輯一樣。
在這一階段,Yahoo的欄目編輯們也在網上積極搜索新的網站,豐富他們的資料庫,而他們的搜索都是人工的,最典型的方法就是從一個網站的鏈接去訪問另外一個網站。遇到一個好的網站,他們就給站主發電子郵件,歡迎站主登錄,而且都是免費的。
這些Yahoo編輯訪問網站的行為和我們今天看到的搜索引擎蜘蛛和機器人的形式是一樣的孜孜不倦。有個Yahoo編輯這么關心你的網站,比你還著急登錄你的網站,而且一文不收,這個在今天是無法想像的。你的網站登錄後,你還可以隨時更改登錄的信息,一般72小時就得到了更新。
值得一提的是,雖然在這個時期中文網站很少,而且大多數是美國的中文網和在台灣的網站,但是Yahoo顯然注意到中文網站的未來,而且迅速有個中文譯名「雅虎」,而這個不僅僅是因為它的創始人是楊致遠。
這一階段也是SEO的雛形時期。網上網下出現了一些論文,討論文字對應、數據挖掘和對搜索引擎程序員的訪談。人們初步有了讓網頁內容符合搜索引擎資料庫原理的模糊意識。同樣,將網站收錄到搜索引擎也是很容易的,你的網頁只要關鍵詞的使用達到一定密度就輕而易舉地排列在搜索引擎上了。
值得一提的是,搜索引擎InfoSeek首次做到每日更新。早晨八點你提交網站,下午就被收錄,第二天就能出現在搜索之中。正是因為這么快的更新和這么容易的提交收錄,大量的站主開始變著法子頻繁登錄不同的網址,英文出現Spam這個詞來形容站主不負責地製造泛濫的垃圾,很快使這些搜索引擎吃不消。
所以,SEO從一開始就是黑白兩道開始的。白的,英文里是white-hat,就是按照能夠悟出的搜索引擎原理來合理地調整自己的網站,使搜索引擎能收錄並得到好的曝光。黑道,英文叫black-hat,這類優化者彷彿是黑客,尋找搜索引擎的弱點,力圖將混淆的信息強塞給搜索引擎,從而為真實的網站提高曝光機會。
這個時期,因為強大的利潤誘惑,成人網站可以說是帶頭去「黑」搜索引擎。所以SEO和搜索引擎從一開始就是愛和恨的關系,這個時期,收費的網站優化服務也開始在美國出現。
在中文搜索引擎領域,中國的起步其實並不晚。1996年8月成立的搜狐公司是最早參與做類似Yahoo的管理信息分類導航的網站,曾一度有「出門找地圖,上網找搜狐」的美譽。
這個時候,沒有人注意在斯坦福大學的一個宿舍里,兩個聰明的學生正在慢慢孕育一個令世界矚目的新型搜索引擎。他們發明了一個新的叫PageRank的理論,來重新塑造搜索引擎。這個新型搜索引擎就是現在的Google。
二、1998-1999年:Google和SEO理論浮現
這一階段,美國的互聯網大會開始有一些關於網站優化的文章發表。這些文章開始關注到鏈接流行度(Link Popularity)、名錄網站鏈接(Directory Listing)的意義。這段時間,搜索引擎也知道了需要限制人們的網站提交來防止垃圾網站的泛濫,於是開始組織反擊。
Alta Vista開始大規模剔除含有「我們來優化」或者「我們來推廣」這類文字的網頁。SEO的實踐者開始意識到,要破解搜索引擎的原理越來越難。在1999年將一個網站提升到前十名要比在1998年難上十倍。搜索引擎開始更多關注鏈接流行度的意義。
Google也在1998年收到了第一張十萬美元的風險投資,搬出了斯坦福校園,正式命名為Google公司,域名也從google.stanford. e變成google. com。這個新的搜索引擎衡量網站的重要性首次將鏈接流行度作為排名的標准之一。
1999年5月,英國的FAST公司推出ALLTheWeb搜索引擎。它的網頁搜索可利用ODP自動分類,支持Flash和PDF文件搜索,支持多語言搜索,還提供新聞搜索、圖像搜索、視頻、MP3和FTP搜索,擁有極其強大的高級搜索功能。這么強大的功能使它成為最流行的搜索引擎之一。
這一階段的初期,搜索引擎也開始了多元化的進程,開始設立多語種的網站,比如AltaVista就率先開始了拉丁語的版本。台灣中正大學吳升教授所領導的GAIS實驗室於1998年1月創立了OpenFind中文搜索引擎。它是最早開發的中文智能搜索引擎,號稱能抓取全球最多的網頁並開始進入英文搜索引擎。
1999年Google獲得了兩千五百萬的資金,開始全力發展,並且已經在每天處理50萬次搜索,這個投資也使Google再次搬家到舊金山——矽谷地區叫Palo Alto的城市。Google也開始結識合作夥伴,從AOL到Netscape不久,Google再次搬家到的全球總部依然是舊金山——矽谷叫Mountain View的城市。這時候的搜索引擎開始設法控制市場,廣告廣泛地出現在搜索引擎上。這引起了許多搜索者的反感,因為大家還是在用56KB modem上網,大量的廣告使網站頁面出現的太慢。
Google發現了這個影響搜索步伐的致命的問題。簡潔的網頁設計使眾人耳目一新,飛快地搜索速度更使得各個站主奔走相告,每個站主論壇都充滿了對Google的極好評價,雜志的采訪也是接連不斷地對Google進行推薦,Google的全面演出就正式登台了。
三、網路和搜索引擎的革新
從2000年開始,登錄一個網站到搜索引擎花的時間是越來越長。搜索引擎熱衷於收費服務,從一個新的搜索引擎Inktomi到Alta Vista都染上了金錢。與此同時,搜索者希望有一個搜索引擎能真正地給他們帶來有用的信息。Google沒有辜負人民的期望,它的精確搜索開始鞏固它在搜索引擎中的地位。
首先出局的是InfoSeek,這個InfoSeek在1998被迪士尼公司買下,變成Go. com。從那以後,InfoSeek被拋棄,而Go. com也使用Yahoo搜索來代替。在1999年,InfoSeek的一位華人工程師離開了這個搜索引擎而駛向北京,他力圖要創立一個「中國人自己」的搜索引擎,並且受一句中國古詞「眾里尋他千網路,驀然回首,那人卻在燈火闌珊處」的啟發,將中國人的搜索引擎起名叫「網路」。這個工程師就是網路的創始人之一—李彥宏。
李彥宏自己就是新一代的搜索技術專家,他早在1996年就解決了如何將基於網頁質量的排序與基於相關性排序完美結合的問題,並獲得美國專利。網路公司結合矽谷搜索引擎人才精英,依託北京最優秀的軟體人才,開發了大型商業化的中文搜索引擎,中文搜索從此與英文搜索站在了同一起跑線上,同時,網路搜索巧妙地解決了數據更新的瓶頸,整個中文網頁的資料庫可以最快每天更新一次。
2000年也是Flash動畫、JavaScript特技Rollover和動態圖片的流行之年。這些動態的形式讓人喜愛,但是很少有人知道,搜索引擎不能認識這些,搜索引擎只能閱讀文字,而非這些感官的創意,因為它們一直是在模擬人的閱讀方式,但是卻無法模擬人的感知,直到今天,搜索引擎也沒有解決這個問題。
從這一年開始,實際上,向搜索引擎呈交新的網站不需要按照以前那樣在搜索引擎的頁面上填寫「ADD URL」,搜索引擎已經能從一個存在的網站上發現新網站的鏈接來訪問並收錄。在這個時候,SEO實踐者也開始知道,如果網站能被目錄導航站(Directory),特別是開放目錄ODP(Open Directory Project)收錄,將非常有助於搜索排名的提升。最知名的ODP是DMOZ(www. dmoz. org),由尼克·斯冠塔河鮑勃·圖爾兩位Sun公司的工程師在1998年創辦,它是一個人工來收錄網站進行分類的目錄網站。在這點上,它的組成和Yahoo是一樣的。
不同的是,它是由全球的站主自己做編輯來維護的,而Yahoo是由專業編輯來維護的。關於DMOZ,搜索引擎青睞DMOZ,是因為經過人工分析的網站的可信度自然要高於搜索引擎蜘蛛和機器人來獲取的網站信息可靠。
2001年的收費登錄大為紅火。搜索引擎市場經歷大清洗,人們開始拋棄搜索引擎Hotbot,Alta Vista和Excite。Alta Vista試圖仿效Google方式來重新回到縮小版的搜索引擎,但是這個垂死掙扎非常痛苦地失敗了,並在2003年被Yahoo收購。Inktomi也失去了好幾個應用夥伴,急劇走下坡路,2004年同樣被Yahoo收購,而且成為了今天Yahoo搜索的主要核心技術。
四、2002-2007年:Google Dance和SEO的不眠之夜
其實在2001年,敏感的站主和SEO實踐者感覺到了一個從未有過的現象。有些人對網站在Google上的排名一夜之間消失,而有的網站則名列首位。這個現象幾乎是每月一次。後來,人們知道,這就是Google定期地更新它的索引(Index)的距離活動,給人的感覺就像跳舞一樣,因此被SEO實踐者稱為Google Dance。
正是因為有Google Dance,每個SEO實踐者都在Google更新的那個晚上熬夜地看自己的SEO成果能否在Google上實現。每次更新有贏家和輸家,網上SEO論壇總有成千上萬的討論,期望知道下次更新能有什麼可以預料的,或者猜測更新的具體日期。
搜索引擎在這個階段中遇到更嚴重的泛濫問題。SEO實踐者大量採用門戶網頁(Doorway Page)、重復網站(Duplicate Website)、偽裝網頁(Cloaked Page)、隱藏鏈接(Hidden Links)等來試圖欺騙Google。另外,DMOZ被Google作為一個重要的收錄新網站的渠道,DMOZ也被注入許多垃圾網站。
2002年是大量SEO被濫用的一年。但是,搜索引擎從這些與SEO非法實踐的斗爭中不斷豐富自己的辨別技術,對抓住的網站拒絕收錄,已經收錄的則給予剔除。但是這個封鎖也冤枉了不少誠實的SEO網站。
在中國,網路於2001年9月開始提供公共搜索服務,並成功地使搜狐和新浪開始使用它的搜索技術。同時,它還提供新聞搜索服務,迅速擴大用戶群。
2003年,越來越多的網站設計對Flash的應用有了謹慎的態度。這一年也是搜索引擎繼續反擊垃圾泛濫的一年。許多SEO實踐者明白黑帽技術(black-hat)已經行不通,而是要扎扎實實地真正提高網站的素質。
Google在2003年更是擠掉了AltaVista和Inktomi,成為獨大。Google誕生於一個搜索引擎紛雜的時代,在那個時代,像Alta Vista等搜索引擎對自己的市場份額太具信心而懶得變化。Google由各個站主和SEO實踐者宣揚,從而一舉後來居上。Google開始反擊垃圾泛濫,矛頭直接對向曾經支持它的這些站主和SEO實踐者。這些人成了Google成功的犧牲品。
2003年的Google的「佛羅里達更新」(Florida Update)真是讓全世界的站主領教了Google的厲害。倘若強烈颶風一般,Florida Update一夜之間讓千萬個網站從搜索中消失或者從前十名刮到100頁以後。這個發生在11月16日的更新,尤其對寄希望在即將來臨的聖誕節狠賺一筆的電子商務網站損失慘重。Google的這個更新是反擊垃圾網站和不法SEO行為的一次重要戰役。
然而,由於使用的過濾器(filter)不完美,沖擊了很多無辜網站。之所以叫「佛羅里達更新」,是因為這個更新由Google在佛羅里達的數據中心開始的。
之後,2004年1月叫做「Austin Update」的餘波同樣也對相當多的網站造成沖擊。霎時間,所以SEO實踐者都突然搖身變成了Google Adwords的專家,大家不能不依靠Google廣告來維持這段節日期間的銷售。
關於這兩個歷史性的Google更新,給了許多SEO實踐者相當大的教訓。規規矩矩地從改善網站本身的素質而不是投機取巧,成為了SEO唯一可行的方法。PPC也穩定的成為營銷策略中的重要手段,而SEO也成為搜索引擎營銷(SEM)的一部分。
Yahoo在這個時候決定與Google正式分道揚鑣。長久以來,為了彌補自己靠人工收錄網站的不足,Yahoo一直採用Google的技術來提供網路搜索。Yahoo顯示陸續購入Alta Vista,AllTheWeb和Inktomi公司,讓人覺察到Yahoo的心情——它是否間接養大了Google?它的手上還有20%Google的股份!終於,在2004年2月16日,Yahoo出售了Google股份,正式告別Google,走上自己開發搜索引擎的道路。
同年,2004年9月12日,Google推出簡體及繁體兩種中文版本的搜索引擎。
進入2005年,最大的變化是Google Update不再是定期的活動,而是逐漸地成為每天的遞進更新。劇烈的變化不再看見。SEO實踐者能夠很快看到自己的努力是否出現了效果。遵循搜索引擎的紀律,以合理的方法來調整、提高網站的結構和內容,成為唯一能夠保證網站穩定的方法。更重要的是,遵循這些規范操作而優化的網站,不僅在Google上排名良好,還會在Yahoo和MSN上也具有不錯的結果。中文網站,如果扎實地做好網站的素質,也會在網路的排名上獲益。
7. 搜索引擎發展的歷史包括哪幾個時期,分別有什麼不同特點
第一代
分類目錄時代
不知道大家時候在自己的搜索引擎首頁是否有設置過導航網站這個網址作為自己的首頁呢?其實這個網址就是搜索引擎第一代的代表。我們可以從這個導航網站這個網站裡面看到,裡面幾乎都是一些分類網址,幾乎在互聯網上的,這個網站裡面都一應俱全,從這里我們可以看出,這個網站是一個導航網站,也可以說分類目錄網站,用戶可以從這個分類目錄里找到自己想要的東西,這就是搜索引擎第一代。
第二代
文本檢索時代
到了這一代,搜索引擎查詢信息的方法則是通過用戶所輸入的查詢信息提交給伺服器,伺服器通過查閱,返回給用戶一些相關程度高的信息。這代的搜索引擎的信息檢索模型主要包括例如布爾模型、概率模型或者向量空間模型。通過這些模型來計算用戶輸入的查詢信息是否與網頁內容相關程度高低,將相關度高的則返回給用戶。採取這種模式的搜索引擎主要是一些早期的搜索引擎,例如像Alta Vista、Excite等等。這就是搜索引擎第二代。
第三代
整合分析時代
這一代的搜索引擎所使用的方法大概是和我們今天的網站的外部鏈接形式基本相同,在當時,外部鏈接代表的是一種推薦的含義,通過每個網站的推薦鏈接的數量來判斷一個網站的流行性和重要性。然後搜索引擎再結合網頁內容的重要性來和相似程度來改善用戶搜索的信息質量。這種模式的首先使用者是google,google不僅為首次使用並且大獲成功,這一成就在當時引起了學術界和其他商業搜索引擎的極度關注。後來,學術界以此成就為基礎,提出了更多的改進的鏈接分析演算法。大多數的主流搜索引擎都在使用分析鏈接技術演算法。這就是第三代搜索引擎
將用戶輸入關鍵字,反饋回來的海量信息,智能整合成一個門戶網站式的界面,讓用戶感覺每個關鍵字,都是一個完整的信息世界。而不是第二代一樣返回一個清單,整個清單夾雜著大量用戶不關心、且沒有分類的鏈接。第三代搜索引擎的典型特徵就是:智慧整合第二代返回的信息為立體的界面。讓用戶能輕易地一眼進入到最相關的分類區域去獲取信息。
第四代
編輯
用戶中心時代
第四代,也就是我們所用的搜索引擎技術也是互聯網上面用的最普遍的。主要是以用戶為中心。當客戶輸入查詢的請求時候,同一個查詢的請求關鍵詞在用戶的背後可能是不同查詢要求。例如用戶輸入的是「蘋果」,那麼作為一個想要購買iPhone的用戶和一個果農來說,那麼要求就是大大的不一樣。甚至是同一個用戶,所查詢的關鍵詞一樣,也會因為所在的時間和所在的場合不同而返回的結果不同的所有主流搜索引擎,都在致力於解決同一個問題:怎樣才能從用戶所輸入的一個簡短的關鍵詞來判斷用戶的真正查詢請求。這一代搜索引擎主要是以用戶為中心。這就是第四代搜索引擎。
移動設備的使用者,即使不向移動搜索互聯網授權任何特徵信息,移動搜索互聯網仍然可以通過移動設備使用者在的搜索時的大量特徵,比如上網的時間習慣,操作習慣,內容歸類去逐漸勾勒出這人使用者的特徵信息,這種「推測式」演算法的可能性也是由於移動設備具有唯一性、隨身性而產生的。這好比是警察可能通過「嫌疑人」的行為習慣,去推測出他的「作案動機」與「體貌特徵」一樣。那麼,這些使用者的蛛絲馬跡,都是未來移動互聯網搜索引擎進行「商業數據挖掘」的巨大寶藏。
移動互聯網搜索的必然使命,就是:提供精準到個人的搜索。可以說前三代搜索引擎,都是基於PC互聯網的搜索,而精準到個人需求的移動互聯網搜索,為「第四代搜索引擎」,那麼,最有可能實現這個第四代搜索引擎的人才,可能不來自於網路,甚至不來自於GOOGLE,而很有可能來自於亞馬遜、淘寶這些掌握了大量個人信息的商業巨頭,或者來自於跨界研究行為心理學、消費心理學、社會心理學等背景的IT研究機構或IT創業團隊,因為這些公司或機構,對人們的行為習慣背後的「動機」與「特徵」更加了如指掌。
第五代
生活生態圈
第五代搜索引擎應該是基於物聯網的搜索,物聯網搜索擁有更廣闊的搜索空間,能預測到物聯網一個最典型的應用就是:找東西!比如遠程看管小孩、老人,或搜索走失小孩,包括精確到厘米的GPS定位,比如你去一個陌生的地方,找廁所,找窗口,甚至找警察。同時,不僅僅是你找東西,甚至還有可能東西找你,比如泊車後超過某個時間點,讓車主動呼叫你,飯煮好了,電飯堡呼叫你,提前打開的空調使用室溫保持到預定溫度後,空調呼叫你等等。
總結
基於第四代搜索引擎未能解決的問題,很多主流的搜索引擎都做了許多的技術嘗試,比如像根據用戶所輸入的查詢請求和用戶所處在的地理位置來判斷用戶的真正查詢請求,又或者根據用戶輸入的查詢信息和用戶之前訪問的歷史記錄相結合來判斷用戶的真正查詢請求,但是在效果上卻是微乎其微。這個問題何時才能突破,讓我們拭目以待吧。
8. 搜索引擎的歷史與發展
發 展(1):世界上第一個Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用於追蹤互聯網發展規模版。
發 展(權2):Excite for Web Servers.
發 展(3):Yahoo!。
發 展(4):元搜索引擎(Meta Search Engine)。
發 展(5):智能檢索的產生
發 展(6):個性化定製
發 展(7):網格技術
9. 簡述:"搜索引擎發展歷史"
1990年以前,沒有任何人能搜索互聯網。所有搜索引擎的祖先,是1990年由Montreal的McGill University學生Alan Emtage、Peter Deutsch、Bill Wheelan發明的Archie(Archie FAQ)。
雖然當時World Wide Web還未出現,但網路中文件傳輸還是相當頻繁的,由於大量的文件散布在各個分散的FTP主機中,查詢起來非常不便,因此Alan Emtage等想到了開發一個可以用文件名查找文件的系統,於是便有了Archie。
Archie是第一個自動索引互聯網上匿名FTP網站文件的程序,但它還不是真正的搜索引擎。Archie是一個可搜索的FTP文件名列表,用戶必須輸入精確的文件名搜索,然後Archie會告訴用戶哪一個FTP地址可以下載該文件。
由於Archie深受歡迎,受其啟發,Nevada System Computing Services大學於1993年開發了一個Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是後來另一個Gopher搜索工具。
(9)搜索引擎的發展歷史擴展閱讀
搜索引擎的作用
搜索引擎是網站建設中針對「用戶使用網站的便利性」所提供的必要功能,同時也是「研究網站用戶行為的一個有效工具」。
高效的站內檢索可以讓用戶快速准確地找到目標信息,從而更有效地促進產品/服務的銷售,而且通過對網站訪問者搜索行為的深度分析,對於進一步制定更為有效的網路營銷策略具有重要價值。
1、從網路營銷的環境看,搜索引擎營銷的環境發展為網路營銷的推動起到舉足輕重的作用;
2、從效果營銷看,很多公司之所以可以應用網路營銷是利用了搜索引擎營銷;
3、就完整型電子商務概念組成部分來看,網路營銷是其中最重要的組成部分,是向終端客戶傳遞信息的重要環節。
10. 搜索引擎技術發展史
搜索引擎的發展歷史
1990年,加拿大麥吉爾大學(University of McGill)計算機學院的師生開發出Archie。當時,萬維網(World Wide Web)還沒有出現,人們通過FTP來共享交流資源。Archie能定期搜集並分析FTP伺服器上的文件名信息,提供查找分別在各個FTP主機中的文件。用戶必須輸入精確的文件名進行搜索,Archie告訴用戶哪個FTP伺服器能下載該文件。雖然Archie搜集的信息資源不是網頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務。所以,Archie被公認為現代搜索引擎的鼻祖。
Robot(機器人)一詞對編程者有特殊的意義。Computer Robot是指某個能以人類無法達到的速度不斷重復執行某項任務的自動程序。由於專門用於檢索信息的Robot程序象蜘蛛(spider)一樣在網路間爬來爬去,因此,搜索引擎的Robot程序被稱為spider程序。
1993年Matthew Gray開發了 World Wide Web Wanderer,這是第一個利用HTML網頁之間的鏈接關系來檢測萬維網規模的「機器人(Robot)」程序。開始,它僅僅用來統計互聯網上的伺服器數量,後來也能夠捕獲網址(URL)。
1994年4月,斯坦福大學(Stanford University)的兩名博士生,美籍華人Jerry Yang(楊致遠)和David Filo共同創辦了Yahoo。隨著訪問量和收錄鏈接數的增長,Yahoo目錄開始支持簡單的資料庫搜索。因為Yahoo!的數據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。雅虎於2002年12月23日收購inktomi,2003年7月14日收購包括Fast和Altavista在內的Overture,2003年11月,Yahoo全資收購3721公司。
1994年初,華盛頓大學(University of Washington )的學生Brian Pinkerton開始了他的小項目WebCrawler。1994年4月20日,WebCrawler正式亮相時僅包含來自6000個伺服器的內容。WebCrawler是互聯網上第一個支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動取正文的前100個字。
1994年7月,卡內基•梅隆大學(Carnegie Mellon University) 的Michael Mauldin將John Leavitt的spider程序接入到其索引程序中,創建了Lycos。除了相關性排序外,Lycos還提供了前綴匹配和字元相近限制,Lycos第一個在搜索結果中使用了網頁自動摘要,而最大的優勢還是它遠勝過其它搜索引擎的數據量。
1994年底,Infoseek正式亮相。其友善的界面,大量的附加功能,使之和Lycos一樣成為搜索引擎的重要代表。
1995年,一種新的搜索引擎形式出現了——元搜索引擎(A Meta Search Engine Rounp)。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理,提交給多個預先選定的獨立搜索引擎,並將從各獨立搜索引擎返回的所有查詢結果,集中起來處理後再返回給用戶。第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。
1995年12月,DEC的正式發布AltaVista。AltaVista是第一個支持自然語言搜索的搜索引擎,第一個實現高級搜索語法的搜索引擎(如AND, OR, NOT等)。用戶可以用AltaVista搜索新聞組(Newsgroups)的內容並從互聯網上獲得文章,還可以搜索圖片名稱中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也聲稱是第一個支持用戶自己向網頁索引庫提交或刪除URL的搜索引擎,並能在24小時內上線。AltaVista最有趣的新功能之一,是搜索有鏈接指向某個URL的所有網站。在面向用戶的界面上,AltaVista也作了大量革新。它在搜索框區域下放了「tips」以幫助用戶更好的表達搜索式,這些小tip經常更新,這樣,在搜索過幾次以後,用戶會看到很多他們可能從來不知道的的有趣功能。這系列功能,逐漸被其它搜索引擎廣泛採用。1997年,AltaVista發布了一個圖形演示系統LiveTopics,幫助用戶從成千上萬的搜索結果中找到想要的。
1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier創立了Inktomi,1996年5月20日,Inktomi公司成立,強大的HotBot出現在世人面前。聲稱每天能抓取索引1千萬頁以上,所以有遠超過其它搜索引擎的新內容。HotBot也大量運用cookie儲存用戶的個人搜索喜好設置。
1997年8月,Northernlight搜索引擎正式現身。它曾是擁有最大資料庫的搜索引擎之一,它沒有Stop Words,它有出色的Current News、7,100多出版物組成的Special Collection、良好的高級搜索語法,第一個支持對搜索結果進行簡單的自動分類。
1998年10月之前,Google只是斯坦福大學(Stanford University)的一個小項目BackRub。1995年博士生Larry Page開始學習搜索引擎設計,於1997年9月15日注冊了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同參與下,BachRub開始提供Demo。1999年2月,Google完成了從Alpha版到Beta版的蛻變。Google公司則把1998年9月27日認作自己的生日。Google以網頁級別(Pagerank)為基礎,判斷網頁的重要性,使得搜索結果的相關性大大增強。Google公司的奇客(Geek)文化氛圍、不作惡(Don』t be evil)的理念,為Google贏得了極高的口碑和品牌美譽。2006年4月,Google宣布其中文名稱「谷歌」,這是Google第一個在非英語國家起的名字。
Fast(Alltheweb)公司創立於1997年,是挪威科技大學(NTNU)學術研究的副產品。1999年5月,發布了自己的搜索引擎AllTheWeb。Fast創立的目標是做世界上最大和最快的搜索引擎,幾年來庶幾近之。Fast(Alltheweb)的網頁搜索可利用ODP自動分類,支持Flash和pdf搜索,支持多語言搜索,還提供新聞搜索、圖像搜索、視頻、MP3、和FTP搜索,擁有極其強大的高級搜索功能。(2003年2月25日,Fast的互聯網搜索部門被Overture收購)。
1996年8月,sohu公司成立,製作中文網站分類目錄,曾有「出門找地圖,上網找搜狐」的美譽。隨著互聯網網站的急劇增加,這種人工編輯的分類目錄已經不適應。sohu於2004年8月獨立域名的搜索網站「搜狗」,自稱「第三代搜索引擎」。
Openfind 創立於1998年1月,其技術源自台灣中正大學吳升教授所領導的GAIS實驗室。Openfind起先只做中文搜索引擎,鼎盛時期同時為三大著名門戶新浪、奇摩、雅虎提供中文搜索引擎,但2000年後市場逐漸被Bai和Google瓜分。2002年6月,Openfind重新發布基於GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累計抓取網頁35億,開始進入英文搜索領域。
2000年1月,兩位北大校友,超鏈分析專利發明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士後)在北京中關村創立了網路(Bai)公司。2001年8月發布Bai.com搜索引擎Beta版(此前Bai只為其它門戶網站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式發布Bai搜索引擎,專注於中文搜索。Bai搜索引擎的其它特色包括:網路快照、網頁預覽/預覽全部網頁、相關搜索詞、錯別字糾正提示、mp3搜索、Flash搜索。2002年3月閃電計劃(Blitzen Project)開始後,技術升級明顯加快。後推出貼吧、知道、地圖、國學、網路等一系列產品,深受網民歡迎。2005年8月5日在納斯達克上市,發行價為USD 27.00,代號為BIDU。開盤價USD 66.00,以USD 122.54收盤,漲幅353.85%,創下了5年以來美國股市上市新股當日漲幅最高紀錄。