在過去的數十年中,我們產生和收集資料的能力已經快速地提高。引起這些作用的貢獻因素包括條碼在大部分商業產品中的廣泛使用,許多商務、科學和行政事務的電腦化,以及由文本和影像掃描平台到衛星遙感系統的資料收集工具的進步。此外,作為全球資訊系統的全球資訊網的流行,已經將我們淹沒在資料和資訊的汪洋大海中。儲存資料的爆炸性增長已經激起對於新技術和自動化工具的需求,以便幫助我們將巨量資料轉換成有用的資訊和知識。

        本書探索資料探勘的技術和概念。資料探勘是資料庫系統和新的資料庫應用的一個有希望的、欣欣向榮的學科前沿。資料探勘通常又稱資料庫中知識發現(KDD),是自動的或方便的模式提取,這些模式代表隱藏在大型資料庫、資料庫或其他大量資訊存儲中的識。

        資料探勘是一個多學科領域,從多個學科汲取營養。這些學科包括資料庫技術、人工智慧、機器學習、神經網絡、統計學、模式識別、知識庫系統、知識獲取、資訊檢索、高性能計算和資料視覺化。我們從資料庫角度提供本書中的材料。即是,我們集中討論關於隱藏在大型資料庫中的模式發現技術的可行性、有用性、有效性首與可伸縮性等。這樣,本書不打算作為資料庫系統、機器學習、統計學或其他某些領域的導論,儘管我們確實提供了這些領域必要的背景材料,以便讀者理解它們各自在資料探勘中的作用。本書是資料探勘的全面介紹,與資料庫主要問題一起討論。對於計算科學的學生、應用開發者、商務人員以及涉及以上列舉的學科的研究者,本書應當是有用的。

        資料探勘出現於20世紀80年代後期,90年代有了突飛猛進的發展,並可望在新千禧年繼續繁榮。本書從資料庫研究者的角度提供該領域的全面情況,介紹有趣的資料探勘技術和系統,並討論應用和研究方向。寫作本書的重要動機是需要建立一個學習資料探勘的有組織的框架-由於這個快速發展領域的跨學門特點,這是一個真有挑戰性的任務。我們希望本書有助於真有不同背景和經驗的人交換關於資料探勘的見解,為進一步促進這個令人激動的、不斷發展的領域的成長做出貢獻。

出版社 : 維京出版社

arrow
arrow
    全站熱搜

    guidenet 發表在 痞客邦 留言(0) 人氣()