手機(jī)掃描下載
應(yīng)用指數(shù):3 分
類型:電腦應(yīng)用性質(zhì):國(guó)外軟件版本:v7.2.0.217 官方版大小:130 MB更新:2025-02-13語言:英文等級(jí):平臺(tái):WinXP, Win7, Win8, Win10, WinAll官網(wǎng):https://www.webharvy.com/
LizardSystems Wi-Fi Scanner(無線網(wǎng)絡(luò)掃描工具)5.59 MB電腦應(yīng)用
懶人采集器Chrome版(網(wǎng)頁資源采集工具)85.6 MB電腦應(yīng)用
Hibernate Enable or Disable(休眠啟用或禁用工具)1.13 MB電腦應(yīng)用
佰盾鎧甲(Baidun Armor)3.07 MB電腦應(yīng)用
Algorius Net Viewer(網(wǎng)絡(luò)監(jiān)控軟件)18.4 MB電腦應(yīng)用
Winbox(ROS軟路由)8.58 MB電腦應(yīng)用
應(yīng)用介紹應(yīng)用截圖相關(guān)版本網(wǎng)友評(píng)論下載地址
SysNucleus
WebHarvy提供網(wǎng)頁內(nèi)容采集功能,可以在軟件界面配置采集計(jì)劃,輸入一個(gè)網(wǎng)站,設(shè)置數(shù)據(jù)類型,設(shè)置頁面交互方式,設(shè)置捕捉數(shù)據(jù)的參數(shù),輸入采集的關(guān)鍵詞,創(chuàng)建采集計(jì)劃完畢就可以直接在電腦上快速捕捉自己需要的大量文本資源,將多個(gè)網(wǎng)站的貼子采集,將圖像網(wǎng)站的素材資源采集,將電子郵件采集,可以采集的資源還是非常多的,大部分網(wǎng)頁上的元素資源都可以批量下載到電腦使用,如果你需要這款軟件就下載使用吧。
圖像抓取
可以下載圖像或抓取圖像 URL。 WebHarvy 可以自動(dòng)抓取顯示在 電子商務(wù)網(wǎng)站的產(chǎn)品詳細(xì)信息頁面。
分類抓取
WebHarvy 使您能夠從指向網(wǎng)站上類似頁面或列表的鏈接列表中抓取數(shù)據(jù)。此功能允許您使用單個(gè)配置抓取網(wǎng)站中的類別和子類別。
正則表達(dá)式
正則表達(dá)式 (RegEx) 可應(yīng)用于文本或 HTML source 的網(wǎng)頁來抓取匹配的部分。這 強(qiáng)大的技術(shù)為您提供更多的靈活性和控制力 over 數(shù)據(jù)選擇。
輕松的網(wǎng)頁抓取
使用 WebHarvy 的點(diǎn)擊式界面,Web 抓取變得毫不費(fèi)力。無需編碼或腳本即可抓取數(shù)據(jù)。使用 WebHarvy 的內(nèi)置瀏覽器,您可以加載網(wǎng)站、導(dǎo)航頁面,只需單擊即可選擇要抓取的數(shù)據(jù)。
智能模式檢測(cè)
WebHarvy 智能識(shí)別數(shù)據(jù)發(fā)生的模式 在網(wǎng)頁中。要抓取項(xiàng)目列表或表(名稱、 地址、電子郵件、價(jià)格等)在網(wǎng)頁中,不需要執(zhí)行其他步驟。如果數(shù)據(jù)重復(fù),WebHarvy 將 自動(dòng)抓取它。
保存到文件或數(shù)據(jù)庫
抓取的數(shù)據(jù)可以以多種格式保存。最新版本的 WebHarvy 允許您將數(shù)據(jù)導(dǎo)出為 Excel、XML、CSV、JSON 或 TSV 文件。此外,您可以直接將數(shù)據(jù)導(dǎo)出到 SQL 數(shù)據(jù)庫(MySQL、SQL Server、Oracle 等)。
1、SysNucleus WebHarvy支持配置引導(dǎo)功能,可以閱讀軟件界面的提示文字
2、支持手動(dòng)配置采集方案,可以添加需要采集的數(shù)據(jù)
3、支持網(wǎng)頁訪問功能,在軟件可以輸入需要采集的網(wǎng)站地址,可以直接瀏覽網(wǎng)頁內(nèi)容
4、支持多個(gè)URL地址采集,可以在軟件添加對(duì)應(yīng)的地址,匹配采集規(guī)則
5、支持圖像文件名設(shè)置,下載的圖像可以設(shè)置新的名字規(guī)則,支持從URL字符串自動(dòng)命名圖像
6、標(biāo)記類別/URL/關(guān)鍵字:在數(shù)據(jù)表中添加一個(gè)額外的列,顯示與記錄相關(guān)的類別、URL或關(guān)鍵字,用于基于類別和關(guān)鍵字的抓取。
7、支持禁用加載圖像、禁用元素突出顯示、啟用web安全、禁用打開彈出窗口
8、使用單獨(dú)的瀏覽器引擎挖掘,啟用自定義用戶代理字符串,挖掘時(shí)自動(dòng)刪除重復(fù)記錄
9、支持自動(dòng)保存挖掘數(shù)據(jù),捕獲每100個(gè)數(shù)據(jù)后自動(dòng)保存
如何編輯配置 ?
要編輯已保存的配置,請(qǐng)點(diǎn)擊 Home 菜單中的 Open 按鈕打開配置 XML 文件。
然后,WebHarvy 將詢問您是使用配置開始挖礦還是對(duì)其進(jìn)行編輯。單擊 Edit configuration 按鈕。
您也可以點(diǎn)擊 編輯 主菜單中的按鈕開始編輯已加載的 配置。
單擊 Edit 按鈕后,WebHarvy 將開始加載配置。這 配置的起始頁將被加載并顯示在瀏覽器窗口中。預(yù)覽 還將顯示選擇進(jìn)行抓取的數(shù)據(jù)。在此之后,WebHarvy 會(huì)自動(dòng)切換 設(shè)置為配置模式,您可以開始選擇要抓取的更多數(shù)據(jù)或刪除現(xiàn)有數(shù)據(jù) 選擇。您還可以編輯與配置關(guān)聯(lián)的 URL 和關(guān)鍵字。
添加 / 刪除數(shù)據(jù)
要選擇新數(shù)據(jù),只需單擊它。要?jiǎng)h除已選擇的數(shù)據(jù),請(qǐng)右鍵單擊 “Captured Data Preview”窗格,然后從“Delete”菜單中選擇要?jiǎng)h除的數(shù)據(jù),如圖所示 下面。
完成配置編輯后,單擊 Home 菜單的 Configuration 面板中的 Stop 按鈕。您現(xiàn)在可以通過單擊 Save 按鈕來保存配置,或者通過單擊 Start-Mine 按鈕來運(yùn)行配置。
在配置中添加/刪除 URL
在配置期間(或編輯配置時(shí)),您可以單擊配置菜單的編輯面板中的 URL 按鈕,以添加或刪除與 配置。
在結(jié)果窗口中,您可以在配置中添加或刪除 URL,如下所示。所有 URL added 將使用相同的配置進(jìn)行抓取。
如果您有一個(gè) URL 列表(所有 URL 都屬于同一個(gè)域,共享相同的頁面布局),則 可以按照以下步驟使用此功能使用單個(gè)配置抓取所有 URL 下面給出。
1. 打開 WebHarvy 并導(dǎo)航到列表中的第一個(gè) URL
2. 開始配置
3. 選擇所需數(shù)據(jù)
4. 在“配置”菜單中,單擊“編輯”面板中的“URL”按鈕。
5. 在結(jié)果窗口中,粘貼列表中所有剩余的 URL,然后單擊“應(yīng)用”
6. 停止配置
7. Start Mine - 列表中的所有 URL 都將使用相同的配置進(jìn)行抓取
編輯關(guān)鍵字
要編輯配置中的關(guān)鍵字,請(qǐng)?jiān)谂渲脮r(shí)(或編輯時(shí) 配置),單擊 Configuration 菜單的 Edit 面板中的 Keywords 按鈕,如下所示。
在結(jié)果窗口中,您可以添加/刪除與配置關(guān)聯(lián)的關(guān)鍵字。
編輯開始 URL 和發(fā)布數(shù)據(jù)
要編輯(更改)配置的 Start URL、Post Data 和 Headers,請(qǐng)?jiān)谂渲闷陂g單擊 Configuration 菜單的 Edit 面板中的 Start URL / PostData 按鈕,如 所 示。
在結(jié)果窗口中,您可以更改 Start URL、PostData 和 Headers 的值
在起始頁中禁用自動(dòng)模式檢測(cè)
WebHarvy 會(huì)自動(dòng)查找并提取起始頁中出現(xiàn)的重復(fù)數(shù)據(jù)模式 的配置。這可以幫助您從起始頁的所有記錄中選擇和抓取相似數(shù)據(jù) 只需單擊一下。但有時(shí),當(dāng)起始頁數(shù)據(jù) 不是表格或列表,其中每頁的每個(gè)數(shù)據(jù)列只有一個(gè)條目。
例如,如果您在加載列出的產(chǎn)品的產(chǎn)品詳細(xì)信息頁面后開始配置 在亞馬遜,建議打開此選項(xiàng),因?yàn)槊總€(gè)選定的數(shù)據(jù)(如價(jià)格、評(píng)級(jí)、 ASIN 等)每個(gè)頁面(每個(gè)產(chǎn)品)僅出現(xiàn)一次。
如下所示,您可以從 Configuration 菜單的 Options 面板中選擇 Disable pattern detection 選項(xiàng)。
僅當(dāng) configuration 不是列表或表。默認(rèn)情況下,對(duì)于加載的頁面,模式識(shí)別處于禁用狀態(tài) 通過導(dǎo)航起始頁中的鏈接。
開始抓取數(shù)據(jù)
配置 WebHarvy 后(開始配置 - 數(shù)據(jù)選擇 - 停止配置)或之后 打開已保存的配置 XML 文件,單擊 Start-Mine 按鈕打開 Miner 窗口。
點(diǎn)擊 Miner 窗口中的 'Start' 按鈕開始挖礦 數(shù)據(jù)。如果您的配置涉及從多個(gè)頁面抓取數(shù)據(jù),您還可以指定要挖掘的頁面數(shù)。
WebHarvy 將開始挖掘數(shù)據(jù)。WebHarvy 的評(píng)估版僅限于 從最多 2 個(gè)頁面抓取數(shù)據(jù)。(一旦您購(gòu)買了 完整版 WebHarvy)
應(yīng)用截圖
相關(guān)版本
多平臺(tái)下載
猜您喜歡換一換
騰訊視頻pc客戶端
夸克瀏覽器PC版
微信PC客戶端
qq音樂pc端
搜狗輸入法PC版
騰訊應(yīng)用寶pc版
谷歌瀏覽器正式版/穩(wěn)定版(Google Chrome)
Wps Office PC版
酷我音樂盒pc版
360極速瀏覽器pc版安裝包
微信輸入法pc端
優(yōu)酷視頻pc客戶端
百度輸入法pc客戶端
360安全瀏覽器PC版
查看所有0條評(píng)論>網(wǎng)友評(píng)論
海鸚OfficeAI助手45 MB電腦應(yīng)用
消防融合通信PC客戶端154.09 MB電腦應(yīng)用
lossless scaling最新版(游戲無損放大工具)43.00 KB電腦應(yīng)用
Bandizip Professional(解壓縮軟件)24.3 MB電腦應(yīng)用
網(wǎng)易云音樂客戶端115.23 MB電腦應(yīng)用
大華攝像機(jī)IP搜索工具17.8 MB電腦應(yīng)用
海鸚OfficeAI助手45 MB電腦應(yīng)用
消防融合通信PC客戶端154.09 MB電腦應(yīng)用
4DDiG DLL Fixer(DLL全能修復(fù)工具)16.2 MB電腦應(yīng)用
京東ME PC版336.33 MB電腦應(yīng)用
西瓜視頻pc客戶端90.01 MB電腦應(yīng)用
Rolling Sky Remake電腦版(滾動(dòng)的天空自制器)36.00 MB電腦應(yīng)用