本文由“張凱個人博客”站長自淘寶購買,適用于服務器搭建的小說網站使用“關關采集器”1.7版本,轉載請注明出處!

    首先,我們看到的是關關軟件的所有文檔,現在我講解下一些文檔需要注意的東西。(如您還未建站,請查看:新手如何建立杰奇小說站?

關關采集器主要注意的是兩個文件夾
    rules文件夾、log文件夾:
    Rules是我們放關關采集規則的地方;
    log是記日志的東西,就是關關采集器出錯的時候會記錄錯誤的信息,我們看到這個就知道采集出錯在哪里了;

    現在我們點開關關采集器,直接打開NovelSpider.exe,就可以啟動關關采集器了。(注:打開的過程會有點慢,所以點擊一次就等一下。千萬不要再點打開,否則在一段時間后會打開多個關關采集器!)
    有些關關會出現提示框,我們不管它直接關掉。

了解關關采集器的一些常用的東西
    打開之后,我們應該立刻修改“設置(S)”→系統設置。:
    1.修改本地網站目錄,比如,我的在D:\xiaoshuo
    2.再修改數據庫連接字符串
DataSource=127.0.0.1;
Database=數據庫名稱;
UserID=數據庫管理用戶名;
Password=數據庫管理密碼;
port=3306;
charset=gbk
    這上面是設置關關采集器的東西,就是第一次用的時候要設置,設置好了就不需要再設置了。

關于“關關采集器1.7”分類設置

    第一:分類設置一般用大類對應,這些對應你網站的類別。譬如
1|玄幻奇幻=,玄幻,奇幻,魔法,魔幻,玄幻魔法,奇幻玄幻,玄幻小說,玄幻·魔幻,玄幻異界,玄幻奇幻,
1是你網站第一個藍米玄幻奇幻,等號后面的是采集目標網站可能遇到的分類,越詳細越好,一些模板網站對應你的玄幻奇幻沒有的,你就添加進去。

    第二:是設置里面的生成
    默認不需要修改,第一個生成目錄頁html是你網站小說目錄頁的html,如果你網站用的是偽靜態那就不需要生成,第二個生成內容頁html這個是小說內容的點擊去看小說的文字章節,這個和上面第一個一樣,如果你網站用的是偽靜態那就不需要生成。
如果在建靜態小說網站的話就需要生成了,這個很耗費硬盤的。一般1000本小說都要幾G的空間了。

    第三:生成全文閱讀。不用管他一般用不到。

    第四:生成OPF。這個是一定要生成的要不網站打不開,你的小說網站也是如果不生成是打開錯誤的。這里打勾就行了。其他的設置不要管,沒有特殊要求是用不到的。
(注意:【設置--的電子書設置】這個不需要管,默認即可,所以的勾勾都不要選,設置里面的圖片設置也是默認即可,所以的勾勾都不要選。)

    五:文字廣告。如果你想在你的小說內容里面添加廣告可以在這打上內容,看需要選擇第一個入庫章節添加文字廣告真實入庫也就是會把你的廣告添加入你采集下來的小說,files/article/txt/0/1這些路徑的txt文檔里面
這個,你的小說是手機版所以需要選擇第一個,在你添加廣告的時候,章節閱讀會看到不過還是不要用這些功能。

    第六:其他【過濾替換】、【文字轉圖片】。不需要管

    第七:日志選擇。全部打勾就可以,這個是采集遇到的記錄錯誤的日志,可以根據這個排除錯誤。

如何看關關規則行不行
    點擊規則,進入規則管理器,我們選擇做不的那個三角型符號下拉選擇你要測試的規則點擊右邊的載入,然后點擊"測試規則",就會彈出一個界面,如果出現這些這個是獲取ID和小說名字
這個是獲得小說信息內容包含小說名字分類簡介和封面。
    有些網站這些信息沒有采集全,我們采集回來的話也會出現不全的這個沒什么影響,主要小說章節內容可以看就行了。然后這些是獲取采集的章節,這個是獲取小說的內容。
    這樣就是一個好的采集規則我們可以用這個采集規則去采集小說更新了。

如何采集
    一般,我們使用的是標準采集模式。
    我們點“采集--標準采集模式”有時候會出現錯誤提示,不管我們在采集框架隨便點一個規則,他就會出現正的位置了還有一些出現什么提示我們也是忽略他直接點擊【繼續】就可以了。
    進入標準采集后正確的姿勢后,一般用的是第一個按目標站頁面獲取編號,這個我們規則寫的時候都是按目標站最近更新的小說設置的,采集的時候會自動采集對方更新的小說我們更新的時候也會跟著別人的小說網站更新。
1.設置好ID的范圍,按目標站ID采集很少用到一般需要特殊采集對方的某一本書采集的時候才采集。
2.按目標站ID采集很少用到一般需要特殊采集對方的某一本書采集的時候才采集。
3.按自己網站的小說ID采集的,也是要更新自己網站的某一本小說才點擊,但是模板站不一定有這本書,所以采集起來很慢。很少用、基本沒用。
4.到最下面的日志記錄這個一定個要選上會記錄采集小說的到時候無緣無故出現采集不了的信息。循環采集這個也一定要選上,這個是自動采集的時候保證采集器自動循環采集對方的網站,循環時間設置看你自己的需求,我一般設置是十分鐘。如果你想不停采集那設置為零。

如何設置采集動作?
【添加新書】:這個要加書的時候添加的;
【慎用】:后面帶的這兩個字的這個是對比模板站的章節名稱如果對就繼續采集不對就清空再采集,這個不要用,會出大問題的。有時候不小心把自己百度收錄過的頁面清空那就悲劇了。其他的一些功能那就沒什么了看文字就知道了;
【設置2】:這個是對比章節的選擇哪個都差不多,反正我怎么感覺不出來有什么不同你默認就可以;
【空章節處理方式】:就是模板站有些小說內容是空的,看你自己需要,不過注意的就是不要選擇第二個跳過本章,因為跳過這個章節就會空出一個章節名字,下次采集的時候少一個章節名字就和模板站對比章節名字就無法更新這本書了;
【章節排列方式】:這個是看目標站的情節的,比較復雜。我給你的采集規則都是按目標站順序的。不要選擇什么,一般用到的是【目標站順序】這個和【按章節ID順序】,其他的不要用。用這兩個都不會出問題,我給你的設置默認即可;
【過濾設置】:看你自己需要設置看字面意思很明白了;
【去除水印】:這個基本不需要;
【代理】、【進度】:一般設置上面的三個數字都是000;
這樣就采集快了,代理IP那個是目標站封你的采集然后你在網上找一些代理來,開啟代理功能然后采集的。

到這里關關的一些功能都講完了,其他的是一些輔助的功能可以以后自己慢慢了解。
下面就設置好點擊開始采集可以了,選好規則選好按什么采集采集動作進的等可以點擊開始了;
如提示“成功開始采集的模式”,這樣就好了可以去看你的網站更新了沒有。

(淘寶店主寫完“關關采集器1.7”后留給我的話:寫完了累啊哥們要給好評啊。有什么問題就問下我吧!我白天要上班晚上一般有空的,這個帶新手的套餐我都是直接收三百的,虧死了!)
站長的話:有閑錢的朋友還是別看教程了,直接去淘寶店讓別人做吧!