InfoSpider是一個(gè)非常使用的爬蟲工具箱,目前支持所有主流的平臺(tái),使用它就可以爬取自己在這些平臺(tái)發(fā)過的內(nèi)容,幫助用戶取回自己的數(shù)據(jù)。例如我們發(fā)了許多郵件,想要將所有郵件的內(nèi)容保存?zhèn)浞萜饋?,手?dòng)才做是需要花費(fèi)很多時(shí)間和精力的,用InfoSpider就可以一鍵快速爬取你的信息,基于用戶數(shù)據(jù)生成圖表文件,使得用戶更直觀、深入了解自己的信息。
軟件介紹
INFO-SPIDER 是一個(gè)集眾多數(shù)據(jù)源于一身的爬蟲工具箱,旨在安全快捷的幫助用戶拿回自己的數(shù)據(jù),工具代碼開源,流程透明。并提供數(shù)據(jù)分析功能,基于用戶數(shù)據(jù)生成圖表文件,使得用戶更直觀、深入了解自己的信息。 目前支持?jǐn)?shù)據(jù)源包括GitHub、QQ郵箱、網(wǎng)易郵箱、阿里郵箱、新浪郵箱、Hotmail郵箱、Outlook郵箱、京東、淘寶、支付寶、中國(guó)移動(dòng)、中國(guó)聯(lián)通、中國(guó)電信、知乎、嗶哩嗶哩、網(wǎng)易云音樂、QQ好友、QQ群、生成朋友圈相冊(cè)、瀏覽器瀏覽歷史、12306、博客園、CSDN博客、開源中國(guó)博客、簡(jiǎn)書。
軟件功能
安全可靠:本項(xiàng)目為開源項(xiàng)目,代碼簡(jiǎn)潔,所有源碼可見,本地運(yùn)行,安全可靠。
使用簡(jiǎn)單:提供 GUI 界面,只需點(diǎn)擊所需獲取的數(shù)據(jù)源并根據(jù)提示操作即可。
結(jié)構(gòu)清晰:本項(xiàng)目的所有數(shù)據(jù)源相互獨(dú)立,可移植性高,所有爬蟲腳本在項(xiàng)目的 Spiders 文件下。
數(shù)據(jù)源豐富:本項(xiàng)目目前支持多達(dá)24+個(gè)數(shù)據(jù)源,持續(xù)更新。
數(shù)據(jù)格式統(tǒng)一:爬取的所有數(shù)據(jù)都將存儲(chǔ)為json格式,方便后期數(shù)據(jù)分析。
個(gè)人數(shù)據(jù)豐富:本項(xiàng)目將盡可能多地為你爬取個(gè)人數(shù)據(jù),后期數(shù)據(jù)處理可根據(jù)需要?jiǎng)h減。
數(shù)據(jù)分析:本項(xiàng)目提供個(gè)人數(shù)據(jù)的可視化分析,目前僅部分支持。
文檔豐富:本項(xiàng)目包含完整全面的使用說明文檔和視頻教程
使用說明
依賴安裝
安裝python3和Chrome瀏覽器
安裝與Chrome瀏覽器相同版本的驅(qū)動(dòng)
安裝依賴庫 pip install -r requirements.txt
工具運(yùn)行
進(jìn)入 tools 目錄
運(yùn)行 python3 main.py
在打開的窗口點(diǎn)擊數(shù)據(jù)源按鈕, 根據(jù)提示選擇數(shù)據(jù)保存路徑
彈出的瀏覽器輸入用戶密碼后會(huì)自動(dòng)開始爬取數(shù)據(jù), 爬取完成瀏覽器會(huì)自動(dòng)關(guān)閉.
在對(duì)應(yīng)的目錄下可以查看下載下來的數(shù)據(jù)(xxx.json), 數(shù)據(jù)分析圖表(xxx.html)
標(biāo)簽: 爬蟲工具
下載地址
精品推薦
-
FVD下載器
詳情 -
IIS7.0完整安裝包
詳情 -
BAI云盤鏈接檢測(cè)
詳情 -
斗魚直播源地址解析軟件
詳情 -
GitHub Desktop
詳情 -
MagicSnow(C4D魔法飛雪插件)
詳情 -
知賣工具箱
詳情 -
簡(jiǎn)易拓展(Simple Extension)
詳情 -
大華攝像頭網(wǎng)頁播放插件
詳情 -
Auto Refresh Plus
詳情 -
VideoDownloadHelper
詳情 -
大華攝像頭瀏覽器插件
詳情 -
通達(dá)信萬能破解器
詳情 -
AIX智能下載器擴(kuò)展
詳情 -
postman
詳情 -
全網(wǎng)vip視頻解析去廣告、全網(wǎng)音樂下載腳本
詳情
裝機(jī)必備軟件
網(wǎng)友評(píng)論