㈠ Java開發網路爬蟲 看什麼書
1,網路機器人Java編程指南,淺顯易懂,有點過時,但適合新手
2,自己動手寫網路爬蟲,有點基礎還可以看看,寫的有點亂,很多內容交代不清楚,並且大篇幅代碼抄襲。。。
3,搜索引擎 ——原理、技術與系統,北大天網為案例,很好很強大,有點學術味道
4,Web數據挖掘 Bing Liu,劉兵的書,強烈推薦
5,搜索引擎:信息檢索實踐,很好的書,強烈推薦
還有一些論文,自己去找吧
案例的話,可以研究下Nutch爬蟲部分代碼,寫的很清晰
有了以上這些,應該算是入門了
㈡ 前輩你好!我現在想學習數據挖掘這門技術,我現在什麼也不會,還有不到兩年就畢業了,想開始真正學點東西.
小隱,
你好:說前輩,未免太過了!其實我學習數據挖掘也就是一年前的事兒了,開始一般都是很迷茫的。最主要的要有個人給你指條明路,比如參考書之類的,其他的說了太多也沒有什麼用處。畢竟以你說的「我現在什麼也不會」,若果真如此,那麼我建議,首先你要挑一本基礎的書堅持看下去,並選擇其中特別感興趣的部分進行深入(一般都有參考目錄),閱讀一些比較經典的文獻對於個人提高絕對是特別有效的。
這里我只給你推薦入門的兩本書:
1 劉兵,Web數據挖掘
2 Soman,數據挖掘基礎教程
PS:一定要堅持看完,看完以後絕對有個全新的感受,劉兵的第二章可以跳過去,太過復雜,等回頭再看不遲,依賴性不是很強;Soman書確實很基礎,如果能夠買到原版,那是再好不過。關於代碼部分,如果有一些編程的功底,對各個演算法能夠逐個實現,那就是相當了不起啦!
希望對你有用,祝你成功!
㈢ 我想學有關數據挖掘的知識,但不知道從什麼開始學起,急求高人指點要如何學習。
huangluomo,
你好:
看到你的問題,感覺似曾相識,實際上這個問題也是一年前我經常提出的,但無奈沒有相對比較了解的朋友幫忙,於是就看了很多相關的書籍,在曲折中了解了數據挖掘,雖苦猶樂。這里我根據自己的經歷給你提供幾本不錯的數據挖掘入門的書籍,僅此而已,不敢自詡高人!
(1)劉兵的Web Data Mining:這本一定要根據你的愛好有選擇的看,比如我當時覺得第二章有些繁雜,就直接跳過,選擇感興趣的分類聚類等知識開始。
(2)K.P.Soman的數據挖掘基礎教程,其中還帶有光碟。這本書對很多概念的介紹都是很詳細的,而且還有實例,我覺得很難得。當然有一個小小的缺陷,紙質太差,感覺好像盜版的!
以上推薦的兩本書可以讓你了解數據挖掘的基礎和主要話題,如果能夠堅持將其讀完,我相信你一定能夠對DM擁有一個全新的認識。
另,強烈建議你同時學習一門語言,並能夠實現數據挖掘用到的諸多經典演算法,加深對其的理解,這樣將使你的學習事半功倍!
希望拙建議對你有幫助,祝你好運!!