目前分類:搜尋引擎 (11)

瀏覽方式: 標題列表 簡短摘要

 

何謂雲端運算?
        即是Server大量的貯存裝置,並且擁有強烈的運算能力,而雲端運算並不是由Google提出,此概念原本就有,只是現在被Google大量使用,以前有個概念類似,那就是「Network Computer",但是以前的軟硬體條件不佳所以失敗!

guidenet 發表在 痞客邦 留言(0) 人氣()

 

Google的說明中心是這樣形容「索引」的個名詞:「Google 索引是我們資料庫中網站的集合,這些網站會經由搜尋傳回。我們一直以來不斷的在 Google中加入更多的內容,我們的漫遊器會定期檢索網頁以重新建立索引。」沒錯,一套搜尋引擎的運作核心,便是 Index 索引。它可針對指定的資料來源(並且不限定於網站,像是文件、DB資料庫皆可)抽取必要資訊,然後把資料跟搜尋引擎建立起關連性,所以Index索引就像一本書的目錄,或是想像成一家圖書館用於查書的索引查詢區,讓需要查閱資料的人就可以經由目錄索引快速翻閱到所需資訊。由於資料通常很龐大,所以我們稱為「Index索引庫」。  

        資料來源資料結構的差異性(例如DB資料庫是結構性文件是半結構性圖片是非結構性),將會造成搜尋引擎抓取資料會有不同的處理方式,所以一般搜尋引擎會以資料結構區分為不同模組,基本是Web網站模組、Doc文件模組與DB資料庫模組(有些廠商對於資料庫採用XML的方式處理)。透過這三個模組來抓取資料後,搜尋引擎核心便會進行製作Index索引庫的作業 ,並會依照管理者的設定進行權限控管、即時索引等相關處理後,便可提供使用者查詢了。

guidenet 發表在 痞客邦 留言(0) 人氣()

 一般來說,網站關鍵字排名因素大致上包括「網頁標題」(Meta Title)、「網頁本文中的關鍵詞密度」「連結文字PageRank。但請您記住一件事:單靠PageRank是無法使您的網站獲得比較理想的網站關鍵字排名。PageRank只是網站排名演算法中的一個乘積因子,倘若您網站的其它排名因子的得分是零,就算您網站的PageRank10,最後的得分還是零。但這並不是說PageRank就毫無價值,而是在什麼情況下PageRank才能完全發揮其功力。

        如果在Google上進行廣泛搜尋,看起來好像有幾千個結果,但實際顯示最多前1,000項結果。例如,對「Jordon」,顯示搜尋結果為5,110,000,但實際顯示結果只有826個。而且用時只有0.84秒。試想一下,0.84秒的時間就可以計算這五百萬搜尋結果的每個排名因子得分,然後給出最終我們所看到的網站排名結果嗎?

guidenet 發表在 痞客邦 留言(0) 人氣()

每個搜尋引擎「網站關鍵字排名」演算法當中各排名因子的重要性取決於它們所提供訊息的品質好壞來決定,但倘若網站關鍵字排名因子具有易操縱性,則往往會被一些網站管理員用來實現不良的網站關鍵字排名競爭(請參照SEO黑帽手法之文章)。例如,初引入的網站關鍵字排名因子之一的「關鍵字標籤(Meta Keywords),是由於理論上它可以很好地概括反映一個網頁的內容,但後來卻由於一些網站管理員的惡意操縱下不得不黯然退出。所以「加權值」,即我們對該網站關鍵字排名因子提供訊息的信任程度,是由網站關鍵字排名因子的「易操縱程度」所決定的。

       PageRank值」(簡稱PR)無疑是頗難被操縱的一個網站關鍵字排名因子之一,但在它最初推出時針對的只是「連結的數量」,所以被一些網站管理員利用「連結工廠」等大量劣質的外部連結來輕而易舉地提升了網站關鍵字排名。然而,Google意識到這個問題之後,便在將連結的品質一併納入評比,並對發現有作弊行為的網站進行「封殺」和「除名」的動作,從此之後不但有效地打擊了這種卑劣的操作手法,進而保證了搜尋結果的「相關性」和「準確率」。

guidenet 發表在 痞客邦 留言(0) 人氣()

 

一、什麼是PageRank(網頁級別)

PageRank(網頁級別)Google用於「評等網頁重要性」的一種方式。在結合了諸如Title標籤和Keywords標籤等其它因素之後,Google透過PageRank來調整網站關鍵字排名的結果,使的那些真正「重要」的網頁在搜尋結果中的關鍵字排名獲得提升,從而提高搜尋結果的「相關性」和「品質」。簡單說來,Google透過下列幾個步驟來實現網頁在其搜尋結果頁面中的關鍵字排名:

guidenet 發表在 痞客邦 留言(0) 人氣()

Google是由兩名在史丹福大學的博士生佩吉(Larry Page)布林(Sergey Brin)所創立的,他們帶來了一個給網頁評分和排名的新概念,這個概念稱之為「網頁級別」(PageRank),而這是Google 演算法重要的開端。網頁級別十分倚賴「導入連結」(In-Link),並運用每個「導入連結」相當於給該網頁投一票的理論建立起邏輯系統。越多「導入連結」意味著該網頁越有「價值」。而每個「導入連結」本身的價值取決於該連結從哪個網頁而來,與該網頁的「導出連結」(Out-Link)

在網頁級別的幫助下,Google在排序網頁的結果上相當地優異,因此,Google成為了最普遍和最成功的搜尋引擎。由於網頁級別度量了網站外的因子,是故Google覺得它會比網頁內的因子難以動手腳。

guidenet 發表在 痞客邦 留言(0) 人氣()

 

PR(A) = (1-d) + d(PR (T1)/C(T1) + ... + PR (Tn)/C(Tn))

PR (A)表示給定網頁APR

guidenet 發表在 痞客邦 留言(0) 人氣()

北京市消協副秘書長屈建輝在"2009營造客觀公正的互聯網搜尋引擎信息環境高繩研討會"上表示,搜尋引擎已經成文網民使用互聯網最重要的基礎工具之一,不僅對於網民進行信息檢索有著强烈的引導功能,更成為推動經濟發展的核心動力之一"搜尋引擎不是企業的,而是我們大家的。"他說,"加强對搜尋引擎的行業監管,有助於搜尋引擎更好地發揮它的重要作用。"

搜尋引擎被寄予厚望

guidenet 發表在 痞客邦 留言(0) 人氣()

一個新生網站不需要事先「提交」到搜尋引擎才能登錄到網際網路上。一個來自於已建立好、其他網站的簡單連結就會讓搜尋引擎拜訪和索引到這個新生網站,並且進一步開始用蜘蛛機器人「爬行」該網站的「網頁內容()」、「連結結構()」、「網站架構()」,而目前若是透過「Flash」或「JavaScript」才能拜訪的連結則不會被蜘蛛機器人探索到。

        當搜尋引擎的蜘蛛機器人在爬行和索引一個網站時會依據一些要素,並且該網站的許多網頁可能不會被索引到除非它們的「網頁等級(PR)」、「連結」、以及「網站流量」提升到一定的程度。舉例來說,從網站的根目錄到該網頁的距離,就是決定該網頁是否會被搜尋引擎檢索的要素之一。

guidenet 發表在 痞客邦 留言(0) 人氣()

 

Alexa世界網站排名」的計算,是以網站每天平均使用人數人均訪問頁面數(與人數和人均頁數之乘積成正比)為基礎,以這二者的幾何平均數來排名。而正式名次,基於最近三個月之內資料的平均值。除全世界網站排名之外,Alexa網站亦提供各種語言、地區、主題的分類排名。

世界網站排名來自於Internet ExplorerAlexa Toolbar,但並非所有的網路用戶都會採用,因此使用它的人數是否能代表一般網路用戶具有爭議性。而Alexa承認排名中幾項不準確資訊的可能性,包括使用量較小的網站很難精確估計,由於Alexa的取樣數量相當大且資料易取得,一般仍被廣泛用於評估網站的受歡迎度

guidenet 發表在 痞客邦 留言(0) 人氣()

經過了十年,現在的使用者變得更加複雜,也更有經驗、掛在網路上的時間更久,懂得使用各種網路應用程式,並知道可以從這些程式獲得什麼。另外,也有更多的使用者,擁有智慧型手機與電腦,無論家裡或工作時都使用電腦,使得在不同裝置上同步傳輸資料,成為很大的挑戰,而這也是雲端運算可以讓事情變得更方便的原因之一。雖然這些應用是緩慢的趨勢變化,但如果你拿現在跟兩年前比,就會覺得有很大的改變,這世界連結的速度也變得更好。我們真的認為Google將從網路日臻完善的過程中獲益。當更好的線上應用問世,或是改進使用網路的媒介,例如手機出現時,網路就更有效用,連帶使人們使用網路的機會增加。而當人們使用更多網路時,他們也就有更多搜尋需求;相對的,他們使用Google的機會也就變得更多,而這也是Google的邏輯。

看著Google從當初數十名員工,到成為今日的搜尋龍頭,梅爾除了見證Google的崛起,更從她的手上開創了無數個Google服務,除了Google廣為人知的簡潔介面,還包括GmailOrkut等。

guidenet 發表在 痞客邦 留言(0) 人氣()