SysNucleus WebHarvy是款網(wǎng)頁(yè)采集軟件,這軟件可以保存多個(gè)網(wǎng)站數(shù)據(jù),抓取網(wǎng)頁(yè)上的內(nèi)容,可以從鏈接列表中抓取數(shù)據(jù),使用起來非常便捷,喜歡的用戶們千萬不要錯(cuò)過哦!
軟件介紹
SysNucleus WebHarvy是一款網(wǎng)頁(yè)數(shù)據(jù)抓取工具,擁有自動(dòng)檢測(cè)模式,可提取多個(gè)頁(yè)面的數(shù)據(jù),并將其導(dǎo)出到數(shù)據(jù)庫(kù)或文件夾中。WebHarvy中支持運(yùn)行JavaScript和表達(dá)式,讓你可以靈活抓取數(shù)據(jù),需要的朋友趕緊下載吧!
軟件特色
1、SysNucleus WebHarvy可以讓您分析網(wǎng)頁(yè)上的數(shù)據(jù)
2、可以顯示從一個(gè)HTML地址上分析連接數(shù)據(jù)
3、可以延伸到下一個(gè)網(wǎng)頁(yè)頁(yè)面
4、可以指定搜索數(shù)據(jù)的范圍以及內(nèi)容
5、可以將掃描的圖片下載保存
6、支持在瀏覽器上復(fù)制鏈接搜索
7、支持配置對(duì)應(yīng)資源項(xiàng)目搜索
8、可以使用項(xiàng)目名稱以及資源名稱查找
9、SysNucleus WebHarvy可以輕松提取數(shù)據(jù)
10、提供更高級(jí)的多詞語搜索以及多頁(yè)搜索
軟件功能
簡(jiǎn)易網(wǎng)頁(yè)搜刮:WebHarvy的指向和點(diǎn)擊界面使Web Scraping很容易。絕對(duì)不需要編寫任何代碼或腳本來刮取數(shù)據(jù)。您將使用WebHarvy的內(nèi)置瀏覽器加載網(wǎng)站,并且可以通過單擊鼠標(biāo)來選擇要提取的數(shù)據(jù)。就這么簡(jiǎn)單?。ㄒ曨l)
智能模式檢測(cè):自動(dòng)識(shí)別網(wǎng)頁(yè)中出現(xiàn)的數(shù)據(jù)模式。因此,如果您需要從網(wǎng)頁(yè)上抓取項(xiàng)目列表(名稱,地址,電子郵件,價(jià)格等),則無需進(jìn)行任何其他配置。如果數(shù)據(jù)重復(fù),WebHarvy將自動(dòng)對(duì)其進(jìn)行刮擦。 保存到文件或數(shù)據(jù)庫(kù)
您可以用多種格式保存從網(wǎng)站提取的數(shù)據(jù)。當(dāng)前版本的WebHarvy Web搜尋軟件允許您將提取的數(shù)據(jù)另存為Excel,XML,CSV,JSON或TSV文件。您也可以將抓取的數(shù)據(jù)導(dǎo)出到SQL數(shù)據(jù)庫(kù)。(了解更多)
抓取多頁(yè):網(wǎng)站通常會(huì)在多個(gè)頁(yè)面中顯示諸如產(chǎn)品列表或搜索結(jié)果之類的數(shù)據(jù)。WebHarvy可以自動(dòng)爬網(wǎng)并從多個(gè)頁(yè)面提取數(shù)據(jù)。只需指出“加載下一頁(yè)的鏈接”,WebHarvy Web Scraper就會(huì)自動(dòng)從所有頁(yè)面抓取數(shù)據(jù)。(了解更多)
提交關(guān)鍵字:通過自動(dòng)提交輸入關(guān)鍵字列表以搜索表單來擦除數(shù)據(jù)。可以將任意數(shù)量的輸入關(guān)鍵字提交到多個(gè)輸入文本字段以執(zhí)行搜索??梢詮妮斎腙P(guān)鍵字所有組合的搜索結(jié)果中提取數(shù)據(jù)。(了解更多)(視頻)
保護(hù)隱私:為了匿名抓取并防止Web抓取軟件被Web服務(wù)器阻止,您可以選擇通過代理服務(wù)器訪問目標(biāo)網(wǎng)站。可以使用單個(gè)代理服務(wù)器地址或代理服務(wù)器地址列表。(了解更多)
類別抓?。鹤ト」ぞ呤鼓梢詮逆溄恿斜碇凶ト?shù)據(jù),這些鏈接會(huì)導(dǎo)致網(wǎng)站中出現(xiàn)類似的頁(yè)面/列表。這使您可以使用單一配置在網(wǎng)站內(nèi)抓取類別和子類別。(了解更多)(視頻)
常用表達(dá):允許您在網(wǎng)頁(yè)的文本或HTML源上應(yīng)用正則表達(dá)式(RegEx)并抓取匹配的部分。這項(xiàng)功能強(qiáng)大的技術(shù)可在您抓取數(shù)據(jù)時(shí)提供更大的靈活性。(了解更多) (RegEx教程)
JavaScript支持:提取數(shù)據(jù)之前,請(qǐng)?jiān)跒g覽器中運(yùn)行您自己的JavaScript代碼。它可用于與頁(yè)面元素進(jìn)行交互,修改DOM或調(diào)用已在目標(biāo)頁(yè)面中實(shí)現(xiàn)的JavaScript函數(shù)。(了解更多)
圖像提取:可以下載圖像或提取圖像URL。WebHarvy可以自動(dòng)提取顯示在電子商務(wù)網(wǎng)站產(chǎn)品詳細(xì)信息頁(yè)面中的多個(gè)圖像。(了解更多)
自動(dòng)化瀏覽器任務(wù):WebHarvy可以輕松配置為執(zhí)行諸如單擊鏈接,選擇列表/下拉選項(xiàng),向字段輸入文本,滾動(dòng)頁(yè)面,打開彈出窗口等任務(wù)。
技術(shù)援助:購(gòu)買WebHarvy后,您將在購(gòu)買之日起的1年內(nèi)獲得我們的免費(fèi)更新和免費(fèi)支持。
標(biāo)簽: 網(wǎng)頁(yè)輔助
下載地址
普通下載通道
精品推薦
-
WYSIWYG Web Builder
詳情 -
H5制作工具maka(瑪卡)
詳情 -
Applet Headline Factory(網(wǎng)頁(yè)制作軟件)
詳情 -
H5設(shè)計(jì)精靈
詳情 -
理正勘察軟件
詳情 -
Rapid CSS editor
詳情 -
微簡(jiǎn)vjpage
詳情 -
極致CMS建站程序
詳情 -
TemplateToaster(網(wǎng)頁(yè)模板制作工具)
詳情 -
Namo WebEditor漢化版
詳情 -
Microsoft FrontPage(網(wǎng)頁(yè)制作軟件)
詳情 -
Pinegrow Web Editor(多功能桌面Web編輯器)
詳情
-
1 六角大王
裝機(jī)必備軟件
網(wǎng)友評(píng)論